AML – Telegram

AML

Начинается ежегодный марафон по чтению статей с ICML 2026, которая в этом году пройдет 6-11 июля

Попадается много инженерных статей с практическими результатами.

Среди таких – работа Яндекса и ШАДа. Она получила статус Spotlight: это статьи, которым программный комитет дал самые высокие оценки. Таких работ на конференции всего 2.2 % от всех поданных заявок

В статье исследователи из Yandex Research, команд ML-инфраструктуры и инференса и студенты ШАД работали над ускорением Graph Neural Networks
Дело в том, что вычисления на графах неэффективно ложаться на парадигму GPU-вычислений, данные лежат в памяти неравномерно, и поэтому видеокарта значительную часть времени ждет загрузки данных вместо того, чтобы выполнять вычисления, которые представляют собой достаточно простые операции

Как раз из-за этого скорость работы ограничена чтением и записью данных, и грамотная работа с GPU-памятью — это главный источник ускорения таких операций

Авторы атакуют именно это узкое место, фактически минимизируя лишние перемещения данных между памятью и вычислительными блоками GPU

Также авторы переносят часть алгоритмов на тензорные ядра, что позволяет ускорится на графах с большой плотностью

Они разработали новые готовые GPU-кернелы для популярных семейств графовых нейросетей, и добились потрясающего ускорения в 3–10 раз в зависимости от архитектуры
Потребление памяти в отдельных сценариях сокращается более чем на порядок

Поздравляем команду с заслуженным Spotlight и прекрасной работой!

Статья уже доступна на arXiv, а код вот здесь

30 views18:15

AML

Знание — это геометрия

Рассуждение — это перемещение по геометрии

Интеллект — это приобретение и стабилизация эффективных траекторий по этой геометрии

31 views10:11

AML

Anthropic's CEO just went on record saying the people who tested their most powerful AI model came back asking them not to release it, calling it a super weapon that should require a license to operate

Here's what it actually did in testing

Against Firefox alone, it found 271 vulnerabilities and turned 181 of them into working exploits, the previous best model managed 2 under identical conditions

It hit a 72 % exploit success rate, autonomously chained vulnerabilities into multi step attack paths and found a 17-year-old remote code execution flaw that gave unauthenticated attackers root access

99 % of what it discovered is still unpatched and the oldest flaw had been sitting in production software for 27 years without any human researcher ever finding it

The part that makes this a different category of concern is not the vulnerability discovery, scanners have done that for years

Mythos doesn’t just find the flaw, it turns it into a working exploit automatically, at scale, and faster than patches can ship

Anthropic's red team rated Mythos at more than five times the cybersecurity capability of their prior generation, which had itself already autonomously discovered over 500 high-severity zero-days

The external world caught up fast

In May, Google's Threat Intelligence Group confirmed the first AI crafted zero day found in active use in the wild, a cybercrime group had used an AI model to find and weaponize a 2FA bypass

The time between a vulnerability being found and being exploited has collapsed from 2.3 years in 2019 to under one day in 2026

Anthropic's response was to not release Mythos publicly at all, and instead launch Project Glasswing, a controlled access program with roughly 52 vetted organizations including Amazon, Apple, Google, Microsoft, and CrowdStrike, backed by $100 million in usage credits, restricted entirely to defensive use

The logic is to give defenders a head start before equivalent offensive capabilities show up at labs with fewer guardrails and these capabilities are coming regardless

Anthropic just decided that buying defenders more time was worth more than the commercial upside of a full release

32 views10:25

AML

Потенциально любая цифровая система на планете в ближайшем будущем может оказаться скомпрометирована

Новый «Манхэттенский проект», по своим разрушительным последствиям киберудар, сопоставим с применением ядерного оружия

Теперь новые модели можно и нужно официально относить к ОМП — оружию массового поражения

Кто-то может подумать: возможно, нас спасет изоляция?
Разве нельзя опустить «цифровой железный занавес» и отрезать себя от глобальной сети?
Уже нет
Мир сросся слишком плотно
Даже локальный, полностью изолированный от интернета компьютер в защищенном бункере критически зависит от электричества и носителей информации, через которые уже не раз заражали закрытые системы

Даже если мировые правительства внезапно договорятся и попытаются искусственно затормозить развитие цифровых технологий, у них ничего не выйдет
Прямо сейчас по всему миру огромное число энтузиастов и независимых разработчиков обучают собственные модели

Практика показывает, что небольшая нейросеть, натренированная на один узкий навык (например, на поиск уязвимостей в коде), зачастую не уступает гигантским передовым моделям
И для этого не нужны колоссальные дата-центры стоимостью в миллиарды долларов

К чему нас всё это ведет? Человечество стремительно въезжает в эпоху «Стеклянного дома»

Это мир, в котором больше негде спрятаться, а у каждого государства, корпорации и человека прозрачные стены
Скрыть секреты становится технически невозможно

И как ни парадоксально, именно в этом единственный выход
Если скрыть ничего нельзя, то прежняя игра в тайные киберудары теряет смысл — стеклянный дом одинаково хрупок для всех

Придётся заново учиться жить (на выученной беспомощности религиозности)

Безопасность будущего будет строиться не на файрволах, секретах и изоляции, а на глобальных договорённостях, абсолютной открытости и доктрине взаимного гарантированного уничтожения — точно так же, как в ХХ веке политикам пришлось договариваться о контроле над ядерным оружием

https://x.com/oleg_a_chagin/status/2068719689497219301?s=46
https://bsky.app/profile/olegchagin.bsky.social/post/3mosp6dfbas22

X (formerly Twitter)

Oleg A. Chagin (@Oleg_A_Chagin) on X

Заблокированная по требованию властей США нейросеть Mythos во время тестовой проверки смогла взломать почти все засекреченные ресурсы АНБ за несколько часов, рассказал командующий киберкомандованием США и директор АНБ

384 viewsedited 03:13

19 views11:51

Anthropic разобрал 400 тысяч сессий с Claude — и вывернул все предположения наизнанку

Anthropic проанализировал 235.000 пользователей за семь месяцев
Оказалось: успех сессии с AI-агентом определяет не знание Python, а понимание того, что ты строишь

Разделение труда внутри сессии такое:
→ Человек принимает 70 % стратегических решений (что делать)
→ Агент — 80 % исполнительских (как делать)

Дальше — интереснее
Новичок в теме запускает промптом в среднем 5 действий агента и 600 слов вывода

Эксперт — 12 действий и 3.200 слов
Та же модель, та же подписка

В пять раз больше работы

Единственная переменная — насколько хорошо вы понимаете задачу

Результат:
→ Сессии экспертов достигают успеха в два раза чаще
→ Новички бросают провальные попытки в 19 % случаев
Все остальные — в 5 %

Фоновое знание кода, не играет роли
Юристы, аналитики, маркетологи и менеджеры успешны наравне с разработчиками
Минетжеры — даже чуть лучше

Рост эффективности идёт от компетентности, а не мастерства
Рабочее понимание проблемы даёт почти весь выигрыш
Узкая специализация добавляет совсем немного сверху

Узкое место никогда не было в синтаксисе
Оно — в том, насколько чётко вы представляете, что пытаетесь построить

Нейросеть не думает
Делает что думает, человек

Оригинал отчета
https://www.anthropic.com/research/claude-code-expertise

Anthropic

Agentic coding and persistent returns to expertise

Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.

143 views12:40

AML

Google shipped the Interactions API into GA, a new API designed to let you orchestrate across models and agents in the same interface, and is a new default API going forward

Interactions sets the stage for the new era of Agents

The Interactions API documentation to get started

19 viewsedited 13:08

AML

Oxford introduced Masked Language Flow Models (MLFMs)

A method to scale flow-based language models to reasoning and instruction-following tasks

GitHub

kiaashour.github.io

Masked Language Flow Models | Kianoosh Ashouritaklimi

Bridging Masked Diffusion Models and Flow Language Models

20 views13:09

AML

Biology's EDA moment has arrived

Bota Biosciences presents Biology Protocol Language (BPL) and BPL-COGEN: a compiler-verified protocol language and AI pipeline that turns ambiguous natural language lab instructions into precise, machine-checkable code

Every reagent, unit, and container state is tracked, so impossible operations are caught at compile time

On 300 Nature Protocols benchmarks, it achieved 95.1 % fidelity to the original, with wet-lab validation showing reproducible execution across manual and automated platforms

A key step toward autonomous, physically embodied AI in biology

bioRxiv

Towards autonomous biology: Compiler-Verified Protocols as a Foundation for Real-World AI Execution

Artificial intelligence has advanced from analyzing experimental data to autonomously generating hypotheses, designing experiments, and coordinating closed loop discovery. Yet the translation from computational reasoning to physical execution remains bottlenecked…

21 views13:11

AML

Китай занял 1-е место со своим суперкомпьютером, а РФ - 83-250-е места

Китайский суперкомпьютер LineShine (LingKun, Huawei LX2) неожиданно занял 1-е место в мире с результатом 2.198 EFlop/s

Топ-10 суперкомпьютеров мира:
1. LineShine - Китай, 2.198 EF (CPU ARM LX2)
2. El Capitan - США, 1.809 EF (AMD + MI300A)
3. Frontier - США, 1.353 EF (AMD + MI250X)
4. Aurora - США, 1.012 EF (Intel + GPU)
5. JUPITER Booster - Германия, 1.000 EF (NVIDIA Grace Hopper)
6. HPC7 - Италия, 0.572 EF (AMD + MI300A)
7. Eagle - Microsoft Azure,0.561 EF (Intel + H100)
8. HPC6-Италия, 0.478 EF
9. Fugaku - Япония, 0.442 EF (Fujitsu A64FX)
10. Alps-Швейцария, 0.435 EF (Grace Hopper)

Россия в новом рейтинге представлена:

1. Chervonenkis (Яндекс) — 83-е место (~21.5 PF) - это гетерогенная система на AMD EPYC + NVIDIA A100, одна из самых мощных в России
Она лидирует среди российских суперкомпьютеров уже несколько лет

2. Галушкин (Яндекс)
3. Ляпунов (Яндекс)
4. Christofari Neo (Сбер)
5. Christofari (Сбер)

22 views14:41

AML

Большинство европейских подростков пользуются AML-инструментами несколько раз в неделю — и делают это без какой-либо системной подготовки
ОЭСР и Еврокомиссия выпустили первый совместный международный фреймворк о том, чему именно нужно учить школьников в эпоху искусственного интеллекта

Над AI Literacy Framework два года работали более 2.000 специалистов из 100 стран
Авторы разграничивают использование и понимание Второе и есть цель

Фреймворк устроен как матрешка, где каждый уровень вкладывается в следующий и без предыдущего не работает

«Взаимодействие с AI» — школьники учатся распознавать, где AI уже применяется, и критически оценивать его результаты. «Создание с AI» и «Управление AI» — разграничивать задачи, которые стоит делегировать машине, и те, где необходимо человеческое суждение

«Формирование AI» — ученики осмысляют, как улучшить систему с точки зрения общественного блага

Так что Европа, которая обычно долго запрягает, скоро может понестись во всю прыть
Фреймворк планируют встроить в PISA 2029, то есть AI-грамотность начнут оценивать наряду с математикой, чтением и естественными науками

А значит, профильным министерствам придется напрягаться уже сегодня
Иначе к тем, кто окажется внизу списка, могут появиться вопросики
Пока же трое из четырех учителей в странах ОЭСР не чувствуют себя готовыми преподавать AI-грамотность

AI Literacy Framework

228 views15:10

About

Blog

Apps

Platform