DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
⚡️В России заработал первый в мире ИИ-сервис для комплексной оценки развития мозга новорожденных

Технология поможет врачам быстрее выявлять ДЦП и другие патологии центральной нервной системы у детей в первые месяцы жизни. Нейросеть разработали специалисты из Санкт-Петербургского государственного педиатрического медицинского университета, Yandex B2B Tech и студенты Школы анализа данных Яндекса. Разработку выложат в открытый доступ, чтобы ей могли пользоваться любые медицинские организации в России и мире.
📉 The Hidden Cost of Readability 

Учёные проверили простой приём: убрать из кода *всё форматирование* перед подачей в LLM — и оказалось, что это экономит в среднем 24,5% входных токенов, при этом точность моделей почти не падает. 

🔎 Почему так работает 
- Отступы, пробелы и переносы строк помогают людям, но заставляют модель платить больше за каждый токен. 
- Они удаляли только косметику, сохраняя смысл программы (контроль через сравнение AST). 
- Тест: задача Fill-in-the-Middle на Java, C++, C# и Python. 

📊 Результаты 
- Большие модели почти не теряют в качестве, маленькие слегка «шатаются». 
- В Python экономия меньше, так как пробелы — часть синтаксиса. 
- Интересно: даже если на вход подать «смятый» код, модели всё равно печатают красиво отформатированный вывод. Поэтому экономия на выходе мала. 

Решение 
- Явный промпт «выводи без форматирования» или лёгкий дообучение на неформатированных примерах. 
- В таком случае выходные токены сокращаются ещё на 25–36%, а pass-rate остаётся прежним. 
- Авторы предлагают утилиту: она стирает форматирование перед инференсом и восстанавливает после — человек читает аккуратный код, а модель тратит меньше. 

📑 Статья: *The Hidden Cost of Readability: How Code Formatting Silently Consumes Your LLM Budget* 

👉 arxiv.org/abs/2508.13666
🥷 GPT-5 взломали за сутки | Привет, друг. На связи Эллиот.

После того как Grok-4 удалось взломать за два дня, GPT-5 пала всего за 24 часа под натиском тех же исследователей.

Почти одновременно команда тестировщиков SPLX заявила:
«Сырой GPT-5 практически непригоден для корпоративного применения "из коробки". Даже встроенные фильтры OpenAI оставляют заметные пробелы, особенно в части бизнес-ориентации».

- NeuralTrust применила собственную технику EchoChamber в сочетании с приёмом «рассказа историй». Так им удалось заставить модель пошагово описать процесс изготовления коктейля Молотова.

Ссылка на чтиво

#News #GPT #AI #Hack #Vulnerability
Please open Telegram to view this post
VIEW IN TELEGRAM
Рынок технологий искусственного интеллекта в 2025 году может вырасти на 25–30%, до 1,9 трлн руб., следует из данных аналитической компании Smart Ranking, с которыми ознакомился «Ъ». 

При этом 95% выручки от монетизации ИИ приходится на пять крупнейших компаний. По данным за 2024 год, топ-5 компаний показали следующие результаты:

🔵 «Яндекс» — 500 млрд руб. (+49,25% за год);
🔵 «Сбер» — 400 млрд руб. (+14,29%);
🔵 «Т-Технологии» (Т-Банк) — 350 млрд руб. (+16%);
🔵 VK — 119 млрд руб. (+26,34%);
🔵 «Лаборатория Касперского» — более 49 млрд руб. (+7,5%).

Тем не менее участники рынка говорят, что такая оценка может быть завышенной, так как у лидеров рынка ИИ не является основным направлением деятельности.

По мнению старшего разработчика систем ИИ Innostage Александра Лебедева, компании, которые не являются техногигантами, могут составить им конкуренцию в узких областях, выигрывая через специализацию.

Эксперты отмечают, что в дальнейшем рост рынка может сдерживать ограниченный доступ к современным чипам.

📡 Сети меняются. Мы следим. Подписывайтесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
🦎 Эволюция ИИ моделей, вдохновленная природой 

В Sakana AI предложили новый подход: развивать ИИ не как один гигантский «мозг», а как экосистему моделей, которые конкурируют, объединяются и обмениваются навыками.

Этот метод они назвали M2N2 (Model Merging of Natural Niches)

🔑 Как это работает 
- Гибкие границы слияния — модели объединяются не фиксированными слоями, а переменными кусками параметров, как будто меняются фрагментами ДНК. 
- Конкуренция за данные — модели соревнуются за ограниченные ресурсы и становятся «экспертами» в узких областях. 
- Выбор партнёров — для объединения подбираются те модели, которые дополняют друг друга: одна сильна там, где другая слаба. 

📊 Чего удалось добиться 
- С нуля: только слиянием случайных сетей удалось получить классификатор MNIST, сравнимый с классическими эволюционными методами, но быстрее и дешевле. 
- Крупные LLM: объединение модели-«математика» и модели-«агента» породило систему, которая уверенно справляется с обоими типами задач. 
- Мультимодальные модели: при слиянии text-to-image моделей для японского итоговая версия стала лучше понимать японские запросы и при этом сохранила сильный английский — без «забывания» старых навыков. 

Этот подход показывает, что будущее ИИ может быть не за одним огромным монолитом, а за живой экосистемой специализированных моделей, которые эволюционируют вместе, обмениваются сильными сторонами и становятся более гибкими и креативными. 

🟠 Paper: https://arxiv.org/abs/2508.16204 
🟠 Code: https://github.com/SakanaAI/natural_niches
Please open Telegram to view this post
VIEW IN TELEGRAM
Международная конференция для молодых ученых «Генетические технологии в биомедицине»

🗓️ 25 сентября 2025 года
📍 ИБР РАН, г. Москва
💰 Организационный взнос не предусмотрен

Конференция будет посвящена различным аспектам генетических технологий в биомедицине:
🔵современным методам геномного анализа
🔵роли эпигенетических механизмов в развитии заболеваний
🔵клеточным моделям для изучения патологий
🔵применению генетических технологий в диагностике и персонализированной терапии
🔵биоинформатическим подходам в обработке биомедицинских данных

🏆 По итогам сессии будут определены победители, представившие лучшие доклады

📑 Тезисы докладов будут опубликованы и изданы (с ISBN) в электронном формате

Школа для молодых ученых «Транскриптом в пространстве и времени: новые подходы к изучению объектов биологии развития»

📆 26-27 сентября 2025
📍 ИБР РАН

👤 Участники Конференции могут также подать заявку на участие в мастер-классах Школы на сайте

👤 Для участников Школы возможно участие в Конференции в качестве докладчиков и слушателей

В рамках Школы планируется проведение лекций и мастер-классов ведущими учеными в области биологии развития и клеточной биологии

📄 Программа Школы охватывает разнообразные аспекты эпителиально-мезенхимных взаимодействий и их изучение с помощью современных методов пространственной транскриптомики. В качестве модельных объектов будут служить культуры плюрипотентных клеток, органоиды, эмбрионы позвоночных и беспозвоночных животных на стадии гаструляции

✔️ Участники Школы также познакомятся с гистологическими препаратами, полученными в экспериментах по пересадке тканевых эксплантатов млекопитающих
Будут продемонстрированы:
▪️анализ данных пространственной транскриптомики с помощью программного обеспечения VISIUM
▪️инъекция генетических конструктов в яйцеклетки животных
▪️уникальный метод гибридизации in situ методом HCR (гибридизационная цепная реакция - Hybridization Chain Reaction)
▪️подходы и методы конфокальной лазерной сканирующей микроскопии

Срок приема тезисов - до 31 августа
 
🌐 Сайт конференции

🌐 Сайт школы

#конференция #школа #молодымученым
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖ESET обнаружили первый 🔒 ИИ-шифровальщик «PromptLock», использующий open-source LLM от 👩‍💻OpenAI

Специалисты из ESET Research обнаружили ИИ-шифровальщик, который получил название "PromptLock". Вредоносное ПО на языке Golang использует локальную модель gpt-oss:20b от OpenAI через Ollama API для динамической генерации вредоносных Lua-скриптов. Локер может обходить традиционные методы обнаружения, поскольку полезная нагрузка создается «на лету», так как не является статичной. Сгенерированные скрипты позволяют сделать эксфильтрацию данных и пошифровать файлы с помощью 128-битного алгоритма SPECK.

Обнаруженные образцы для Windows и Linux считаются Proof-of-Concept, но PromptLock демонстрирует качественный скачок в архитектуре вредоносного ПО. Вместо встраивания всей ИИ-модели злоумышленники используют прокси-соединение к серверу с API, что соответствует тактике Internal Proxy (MITRE ATT&CK T1090.001) и свидетельствует о продуманной стратегии. Использование кроссплатформенных Lua-скриптов указывает на цель злоумышленников обеспечить максимальный охват различных операционных систем, включая Windows, Linux и macOS.

@Russian_OSINT
Please open Telegram to view this post
VIEW IN TELEGRAM
1
This media is not supported in your browser
VIEW IN TELEGRAM
Тактика ответы на вопросы ))) и главное все понятно )))
Логика переносима и на LLM-модели (ChatGPT, Claude, Gemini и др.). Пользователь формулирует вопрос уже с предвзятостью (например, «почему вакцина вредна» вместо «какие аргументы за и против вакцинации»).

Модель, обученная предсказывать наиболее вероятный ответ, будет подстраиваться под этот «угол», выдавая подтверждающую информацию.

В результате эффект «узкого поиска» в LLM даже усиливается, так как текст формируется под пользователя ещё гибче, чем в поисковике.
На что только не пойдут люди, чтобы сэкономить: девушка поделилась ситуацией, как турист, арендующий у неё апартаменты, прислал сгенерированные фотографии гигантских тараканов, которые «выползают по ночам».

Судя по размером тараканов они точно родственники динозавров )))
Кое что о вайб-кодинге и когда вам рассказывают, что там все на лайте ))) Не братцы, до лайта там забор из костылей и километры синей изоленты )))
Кстати хорошая инфографика, практически также можно описать и степень с которой сейчас работают промпты. По факту, здесь видно, примерно, то же самое, в свете последних событий видно на осязаемом плато, в которое собирается взобраться прогресс с нейронками, особенно по качеству безопасности, наметился провал. Нейронки добрались до смыслового дна и кажется начали копать )))
https://t.me/DenoiseLABQuestions - напоминаю у нас есть чатик для общения, залетайте кому интересно ))
Московские центральные диаметры продлят до Ярославля, Тулы, Иванова, Твери и Смоленска

Сейчас, например, из Смоленска доехать на пригородной электричке до Москвы очень сложно. Если же наладить движение, то из соседнего региона можно будет ездить в Москву на работу и возвращаться. Как сообщил мэр Москвы Сергей Собянин, проект планируется реализовать в ближайшие годы.

Вот это да))) МосМетро по всей России. Ваааще жир.

Хочу метро в Шанхай !!!! хахахаха
🔥3
Кака интересная статистика... Скоро ИИ будет там, вернее оно уже там, сейчас мы перенимаем модели математические поведения живых ораганизмов для адаптации и обучения и разработки новых методик сетей. Что уже стоит Sakana.AI
Показали красивое: Китай запустил строительство подводного дата-центра для ИИ. Питание дата-центра в 10 км. от побережья Шанхая будет обеспечивать ветроэлектростанция. Зацените фотки, выглядит очень футуристично и максимально круто.

В подводных дата-центрах морскую воду прокачивают по трубам через радиатор, расположенный на задней стороне серверных стоек, поглощая и отводя тепло. ЦОД рядом с Шанхаем строит компания Hailanyum. По оценкам компании и Китайской академией информационных и коммуникационных технологий, этот объект потребляет минимум на 30% меньше электроэнергии, чем наземные дата-центры благодаря естественному охлаждению.

Центр обработки данных Hailanyum подключат к близлежащей морской ветряной электростанции, которая будет обеспечивать дата-центр 97% требуемой энергии. Первая фаза проекта рассчитана на 198 серверных стоек, что позволяет разместить от 396 до 792 серверов с поддержкой ИИ. Центр введут в эксплуатацию к началу осени этого года.

Вычислительной мощности объекта будет достаточно для завершения обучения ИИ-модели, эквивалентной GPT-3.5. Однако дата-центр Hailanyum невелик по сравнению с типичными наземными ЦОД. Среднемасштабный дата-центр в Китае имеет до 3000 стандартных стоек, а супермасштабный может содержать более 10 000.

Кстати, такой ЦОД оценивается в 223 млн. баксов, а в его основе лежит технология, впервые реализованная Microsoft более 10 лет назад в рамках проекта Project Natick. Тогда Microsoft затопила капсулу размером с грузовой контейнер, содержащую более 800 серверов, на глубину 38 м. у побережья Шотландии. Спустя два года американская корпорация сообщила, что подводные дата-центры надёжны, практичны и экономически выгодны в плане использования энергии.

Также отмечено, что подводные центры обработки данных могут быть разрушены определёнными шумами, создаваемыми подводными акустическими системами, что вызывает опасения по поводу вредоносных атак с использованием звука. Об этом есть хорошее исследование в нашем канале, почитать можно вот тут.

О планах создания подводных ЦОД также сообщили в Южной Корее, Японии и Сингапуре.
Ведущие ML- и DS-инженеры соберутся 13 и 14 сентября на E-CODE.
Это масштабное IT-событие создано командой Ozon Tech. Вы приглашены, но нужно зарегистрироваться: https://s.ozon.ru/63nnD27

Что будет:
6 контентных треков — один из них для ML/DS.
Выступления известных учёных.
Качественный нетворк — комьюнити middle+ специалистов.
Интеллектуальные интерактивы — и эксклюзивный мерч в подарок.
Вечеринки каждый день — на сцене НТР, Заточка, ILWT и Нейромонах Феофан.

E-CODE — комьюнити-пространство, в котором стоит быть
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Научно-практическая конференция «ГЕНЕТИКА 2025»

🗓 5 - 7 ноября 2025
📍 г. Москва
👤 смешанный формат
💰 Участие бесплатное

Секции конференции охватят все темы научной и практической генетики, а именно:
🔵Медицинская генетика. Врожденные заболевания
🔵Онкология и онкогематология
🔵Древняя ДНК. Палео- и историческая генетика
🔵Генетика растений
🔵Генетическое редактирование, современные методы
🔵Генетика с/х животных
🔵Популяционная генетика
🔵Клеточная биология и терапия
🔵Биоинформатика
🔵ДНК-идентификация и криминалистика
🔵Эпигенетика и старение
🔵Микробиом и генетика микроорганизмов
🔵Эволюция и генетика

📄 Подробнее можно ознакомиться в программе конференции

Прием тезисов осуществляется до 15 сентября 2025

📑 Принятые к публикации тезисы будут индексироваться в Elibrary.ru

🏆 Тезисы принимаются от всех участников. Лучшие работы будут отмечены профессиональным жюри

🌐 Сайт

#конференция
Please open Telegram to view this post
VIEW IN TELEGRAM