DenoiseLAB
485 subscribers
1.33K photos
158 videos
3 files
1.56K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
👍9
👍7
🏆 Sakana AI выиграла ICFP 2025 - благодаря новой системе эволюции кода ShinkaEvolve 

Исследователи из Sakana AI и команда Unagi показали, что большие языковые модели можно использовать не просто для генерации программ, а для пошаговой эволюции и оптимизации уже существующего кода. 

ShinkaEvolve - это эволюционный фреймворк, где языковая модель играет роль «генетического программиста». 
Она не пишет решения с нуля, а мутирует, оценивает и улучшает уже работающий код. 
Процесс идёт циклами, похожими на естественный отбор. 

1. Инициализация 
   Модель получает исходный код (обычно корректный, но неоптимальный) и описание метрики — например, скорость или точность. 

2. Мутации (Variations) 
   LLM вносит небольшие изменения: перестраивает цикл, меняет структуру данных, переписывает логику с рекурсии на итерацию, удаляет лишние вычисления и т.д. 

3. Оценка (Evaluation) 
   Каждая версия автоматически компилируется и запускается на тестах. 
   Система измеряет, стало ли решение быстрее или стабильнее. 

4. Отбор (Selection) 
   Лучшие варианты проходят дальше, худшие отбрасываются. 
   LLM получает обратную связь: что сработало, а что нет. 

5. Итерации 
   Процесс повторяется десятки или сотни раз. 
   В исследовании — около 320 поколений за ~60 долларов вычислительных затрат. 

Изначально решение ICFP-задачи использовало SAT-кодирование (логическую форму для solver'а), но плохо масштабировалось. 
ShinkaEvolve смогла: 
- переписать часть кода, чтобы сократить количество ограничений; 
- внедрить промежуточное представление («дверь → вершина → дверь»), что уменьшило сложность; 
- оптимизировать поиск и кэширование данных. 

Результат — ускорение до 10×, а на некоторых тестах — почти в 10 раз быстрее базового решения. 

ShinkaEvolve — не просто автоматический оптимизатор. 
Это новый способ мышления об ИИ-программировании: модель не заменяет разработчика, а ведёт себя как «цифровой соавтор», который предлагает гипотезы и тестирует их сотни раз быстрее, чем человек. 

🟠Подробнее: https://sakana.ai/icfp-2025
🟠Код: https://github.com/SakanaAI/ShinkaEvolve
🟠Статья: https://arxiv.org/abs/2509.19349
🟠Блог: https://sakana.ai/shinka-evolve/
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
👨‍🎓 Одна из самых запоминающихся сцен в истории Нобелевской премии.

12 октября 2020 года, в 2:15 ночи, камера видеонаблюдения зафиксировала, как профессор Роберт Уилсон в тапочках стоит у двери своего соседа — профессора Пола Милгрома.

Они были давними коллегами и жили напротив друг друга. В ту ночь им обоим присудили Нобелевскую премию по экономике за вклад в теорию аукционов, но дозвониться удалось только одному — поэтому второй пришёл лично сообщить новость.
🔥4
В Китае создают первого в мире робота-гуманоида с искусственной маткой и возможностью зачатия. Робот сможет сам вынашивать эмбрион вплоть до его рождения благодаря встроенной системе с искусственной маткой, околоплодной жидкостью и питательными трубками. Прототип выпустят уже в 2026 году по цене всего около 1 млн рублей. @banki_oil
🤔2
Почему утечка данных через ИИ-сервисы стала проблемой и как ее решать без тотальных запретов?
#ИИ #ai #llm #ml #ciso

Мне близка проблема ShadowAI, поэтому думаю стоит поделиться хорошим материал и CISO Club и HiveTrace


Корпоративные ИИ-ассистенты создали новые каналы для утечки данных. Исследования показывают, что генеративным ИИ активно пользуются 45% сотрудников крупных компаний, при этом две трети этой активности происходят через личные аккаунты, создавая новую «слепую зону» корпоративной безопасности. Этот скрытый, но массовый оборот данных заставляет более половины российских компаний опасаться утечек через ИИ. Неудивительно: исследование LayerX показало, что ИИ стал главным каналом утечки данных в 2025 году.

🔗Источник

🌚 @poxek
Please open Telegram to view this post
VIEW IN TELEGRAM
Интерпретатор NGS данных в Институт синтетической биологии и генной инженерии "ЦСП" ФМБА России

Задачи:
🔸Ведение проектов по генетике социально значимых патологий (репродуктивные и детские генетические заболевания, возраст-ассоциированные заболевания,  кардиология, психиатрия, спортивная медицина).
🔸Интерпретация разного типа данных секвенирования нового поколения (WGS, панельное секвенирование и т.д.).
🔸Взаимодействие с биоинформатиками, врачами и исследователями при разработке дизайна исследований.
🔸Участие в разработке индивидуальных регистрационных карт исследований, протоколов исследований.
🔸Постоянное отслеживание актуальных публикаций и научных трендов в области медицинской генетики.
🔸Подготовка научных статей, презентаций и участие в разработке пользовательских диагностических решений.

Требования:
🔸Высшее медицинское образование (врач терапевтической специальности, клинический фармаколог) или биологическое образование.
🔸Дополнительное обучение или опыт в анализе NGS-данных, биоинформатике будет преимуществом.
🔸Желательно наличие научных публикаций, отражающих результаты собственных исследований.
🔸Владение английским языком на уровне, достаточном для работы с научной литературой.

Условия:
🔸Полная занятость, возможность гибридного формата работы после прохождения испытательного срока.
🔸Работа в междисциплинарной команде врачей, биоинформатиков и исследователей.
🔸Стабильная заработная плата на уровне рынка.
🔸Оформление по ТК РФ.
🔸Прикрепление к поликлинике ФМБЦ им. Бурназяна ФМБА.
🔸Комфортный офис в 10 минутах от метро Щукинская.
🔸Зарплата: от 120000 рублей на руки, зависит от опыта и навыков.

Хотите разместить свою карьерную возможность? Заполняйте заявку.
Хотите посотрудничать с нами?
Пишите @scicareerwork ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Дни NVidia сочтены, их поглотят также как рынок автомобилей в европе. Это я предполагаю если что. Вообще, очень интересно если что, 90% прибыли NVidia это разработки ИИ.
🙏3
🚀 Как Alibaba использовала ИИ для перехода от монолита к DDD: реальный кейс

Команда разработчиков Taobao применила искусственный интеллект для рефакторинга сложной системы сервисных пакетов. Цель — автоматизировать и ускорить переход на доменно-ориентированное проектирование (DDD).

📌 Ключевой результат: разработка новой функциональности, которая раньше занимала 5-8 человеко-дней, теперь сводится к конфигурационным изменениям.

🔍 В чем была проблема?
Старый код превратился в "монолит" с критическими недостатками:
Высокая стоимость изменений: добавление нового типа товара требовало правок в 8+ файлах.
Тонны дублирования: одна и та же логика проверки товара повторялась в 10 разных местах.
Сильная связанность: один сервисный класс на 3800 строк смешивал логику товаров, цен, контрактов и акций.
Риски: любое изменение могло сломать существующую функциональность.

🤖 Как помог ИИ? Процесс в две фазы

1. Фаза проектирования: Инженеры давали ИИ промпты вроде "Ты — эксперт по DDD, проанализируй этот пакет классов и предложи границы контекстов". ИИ быстро предлагал варианты на основе структуры кода, а люди дорабатывали их с учетом бизнес-семантики.

2. Фаза реализации:
    • Генерация каркаса: ИИ создавал заготовки классов (Domain, DomainService, DomainRepo) на основе техзадания.
    • Написание кода: ИИ генерировал boilerplate-код и преобразования данных. Например, написал 734 строки с точностью 96.6% (потребовалось исправить всего 25 строк).
    • Анализ качества: ИИ сравнивал методы "до" и "после", выявлял дубликаты и оценивал степень связности.

📊 Результаты рефакторинга
Вот сравнение одного ключевого метода queryConfirmableProgramList:

Было (монолит):
• Код: ~1500 строк в основном методе + вспомогательных цепочках.
• Проблемы: высокая связанность, дублирующиеся if-else на 10+ типов товаров, логика ценообразования и акций вперемешку.

Стало (DDD с ИИ):
• Код: ~720 строк, разделенных по четким доменным контекстам (Магазин, Контракт, Товар, Цена, Акция).
• Преимущества: каждый шаг отвечает за одну задачу, логика изолирована, дублирование устранено, систему легко тестировать и расширять.

🎯 Вывод
Это не про то, что ИИ заменит архитекторов. Это про мощный симбиоз: ИИ берет на себя рутинный анализ кода, генерацию шаблонов и поиск антипаттернов, освобождая инженеров для решения сложных архитектурных и бизнес-задач. Такой подход сокращает циклы рефакторинга на 75%+ и кардинально повышает качество кода.

Подробнее

Опыт отечественных компаний подтверждает выводы китайских специалистов. В частности, об этом недавно писал в своей статье «Меньше рутины, больше инженерного творчества: как AI меняет подход к рефакторингу» Антон Атоян из Сбертех.

#КитайскийИИ #КитайAI
👍1
📝 Главное из System Card GPT-5.2

— GPT-5.2 стала заметно честнее. В реальном продакшн-трафике случаи обмана у версии Thinking снизились до 1.6% против 7.7% у GPT-5.1. Модель гораздо реже врёт или искажает информацию о работе с инструментами.

— Модель лучше держит удар при провокациях. В специальных тестах, где её пытаются склонить к обману, показатель снизился с 11.8% до 5.4%. То есть GPT-5.2 устойчивее к манипулятивным подсказкам.

— Защита от prompt-injection стала сильнее. Instant и Thinking почти полностью проходят известные тесты (0.997 и 0.978). При этом OpenAI честно предупреждает: это проверка на известные атаки, а не гарантия защиты от новых.

— Большой скачок в чувствительных темах. Особенно в областях ментального здоровья и эмоциональной зависимости:
• mental health: 0.915 вместо 0.684
• emotional reliance: 0.955 вместо 0.785
Это один из самых заметных прогрессов по сравнению с GPT-5.1.

— GPT-5.2 Instant реже отказывается отвечать на запросы взрослых пользователей по «18+» темам. При этом правила не ослаблялись, а доступ для несовершеннолетних не расширялся.

— OpenAI внедряет автоматическое определение возраста. Для аккаунтов младше 18 лет будут жёстче ограничиваться чувствительные категории — сексуальный контент, романтические ролевые сценарии, сцены насилия.

— По фактической точности GPT-5.2 Thinking как минимум не хуже прошлых версий, а в некоторых сценариях лучше. С включённым браузингом уровень галлюцинаций опустился ниже 1% в пяти тематических областях.

— В рамках Preparedness Framework модель признана «высокоспособной» в биологии и химии. Включены дополнительные меры защиты. При этом OpenAI подчёркивает: нет доказательств, что модель может помочь новичку нанести серьёзный биологический вред, хотя она уже близка к этому порогу.

— В задачах самоулучшения ИИ GPT-5.2 Thinking стала лучшей моделью на бенчмарке OpenAI PRs, сопоставима с gpt-5.1-codex-max на MLE-bench и всего на 1 пункт уступает ему на PaperBench.

— Независимая проверка Apollo Research не выявила скрытого саботажа, попыток самосохранения или подрывного поведения. По их оценке, риск катастрофического вреда из-за «коварных» стратегий модели крайне низок.

GPT-5.2 показывает заметный прогресс в честности, устойчивости, безопасности и качестве ответов.
🔍 Когда интуиция сработала раньше антивируса

Сижу поздним вечером, читаю корп чат — и вдруг замечаю: коллега скинул ссылку на «новую систему отчётов». Только вот стиль не его — слишком формально. Я запустил проверку, и вот что вышло.


🚨 Что сразу насторожило:
✔️ Письмо пришло в нерабочее время — паттерн срочности.
✔️ Ссылка сокращена через bit.ly — маскировка реального домена. 
✔️ Грамматика слишком правильная — след ИИ-генерации.
✔️ Отправитель последний раз менял пароль 8 месяцев назад — признак скомпрометированного аккаунта.


👉Погнал цепочку проверок: домен зарегистрирован 3 дня назад, SSL-сертификат самоподписанный, а IP ведёт в регион, где у нашей компании нет серверов. Проверил через VirusTotal — 4 антивируса уже пометили как фишинг.

➡️ Читайте полный разбор схемы

🗣🗣Совет: Даже если письмо от знакомого — проверяй контекст. ИИ научился копировать стиль, но не знает ваших внутренних шуток и деталей последних разговоров. Одно «странное» слово может спасти всю сеть компании.
Please open Telegram to view this post
VIEW IN TELEGRAM
✔️ Интересная утечка - Google работает над TorchTPU, секретным проектом, который позволит PyTorch работать нативно на TPU от Google, обходя легендарную привязку NVIDIA к CUDA.
Please open Telegram to view this post
VIEW IN TELEGRAM
DuckDB быстрей Spark 🦆

В посте DuckDB benchmarked against Spark сравнили Spark и DuckDB на локальном MacBook Pro, и утка показала отличный результат.

Поэтому если мало данных, можно смело пользоваться уткой. Зависит от вашего сервера, на котором запускается duckdb.

Есть прикольные кейсы, когда Pandas заменяют DuckDB и распаралеливуют процессы, например через lambda или чтобы экономить дорогой Snowflake compute.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖 Nanbeige4-3B от Boss Zhipin - LLM с 3 млрд параметров, которая превосходит Qwen3-32B в математике (AIME), науке (GPQA) и tool calling (BFCL-V4), а на бенчмарках с человеческими предпочтениями (Arena-Hard-V2) сопоставима с Qwen3-30B-A3B.

Как это удалось?

- 23 трлн токенов ультра-курированных данных
- более 30 млн высококачественных SFT-инструкций
- многостадийный RL + инновационная дистилляция (DPD)
- реконструкция chain-of-thought и deliberative generation

Модель также входит в топ-15 на WritingBench и EQ-Bench3, обгоняя модели в 100 раз больше по размеру — включая GLM-4.5 и Deepseek-R1.

🔗 Weights: https://modelscope.cn/organization/nanbeige
📄 Paper: https://arxiv.org/pdf/2512.06266
🔥3
Научный сотрудник исследовательского отдела "Трансгенные животные" (специалист по эмбриологии) в ПАО «Татнефть»


Ключевые задачи:
👉Планирование и проведение экспериментов по получению трансгенных и генномодифицированных лабораторных животных.
👉Выполнение всего цикла работ с эмбрионами млекопитающих: индукция суперовуляции, сбор эмбрионов, микроинъекции (пронуклеарные, в бластоцисту), криоконсервация, трансплантация реципиентам.
👉Культивирование эмбрионов и клеточных линий in vitro.
👉Ведение беременности у животных-реципиентов, получение и первичный анализ потомства.
👉Проведение генотипирования с использованием методов молекулярной биологии (ПЦР, электрофорез и др.).
👉Ведение лабораторной документации, анализ и представление результатов.

Требования:

Высшее образование (специалитет или магистратура) в области биологии, биотехнологии, ветеринарии, зоотехнии.
Практический опыт (от 3 лет) в эмбриологии млекопитающих, включая ключевые методы: микроинъекции, работа с бластоцистами, криоконсервация гамет/эмбрионов.
Готовность к переезду в Альметьевск.

Приветствуется (будет преимуществом):
👌Опыт работы с лабораторными животными (мыши, крысы), знание правил содержания и работы с ними.
👌Навыки клеточного культивирования.
👌Понимание принципов работы с CRISPR/Cas9 и другими системами геномного редактирования.
👌Опыт планирования экспериментов и статистической обработки данных.
👌Наличие научных публикаций или участия в исследовательских грантах.
👌Ответственность, аккуратность, способность работать как в команде, так и самостоятельно.
👌Уверенные навыки в методах молекулярной биологии для генотипирования (ПЦР, электрофорез, работа с ДНК/РНК).

Условия:

🤝Конкурентный доход (от 100 000р) + бонусы: ежегодный бонус, зависящий от личных и командных результатов.
🤝Переезд в Альметьевск + предоставление служебного жилья для комфортного старта в новом городе.
🤝Расширенный ДМС для тебя и твоей семьи.
🤝Программа «Социальная ипотека» для приобретения собственного жилья.
🤝Санаторно-курортное лечение и организация отдыха.
🤝Медицинские осмотры за счет компании.

Откликнуться👈
Please open Telegram to view this post
VIEW IN TELEGRAM
🥴1
🔍 Mistral представила OCR 3 - новую версию своей AI-системы распознавания документов.

Ключевое:
- Существенный рост качества по сравнению с OCR 2, особенно на формах, таблицах и сложных PDF
- Уверенно работает со сканами, рукописным текстом и нестандартной версткой
- Возвращает структурированный результат, а не просто сырой текст
- Подходит для автоматизации Document AI и downstream-аналитики
- Доступен через API и готов к продакшен-использованию

Главное
- На 74% лучше Mistral OCR 2 при работе с формами, сканированными документами, сложными таблицами и рукописным текстом.

- Точность уровня state-of-the-art: Обходит как корпоративные системы обработки документов, так и современные AI-OCR решения.

- Используется в Document AI Playground:
В Mistral AI Studio появился простой drag-and-drop интерфейс для разбора PDF и изображений в чистый текст или структурированный JSON.


https://mistral.ai/news/mistral-ocr-3

#ocr #mistal #llm
👏3