130 subscribers
94 photos
21 videos
57 files
490 links
ALGORITHMS MACHINE LEARNING
Download Telegram
Claude нашёл уязвимости в ядре Linux, LLM догоняют людей в кибербезе

Николас Карлини из Anthropic- один из лучших исследователей безопасности AML мире
говорит так:

«Эти модели - лучшие исследователи уязвимостей, чем я
Вероятно, они пока не лучше всех вас, но в какой-то момент станут

Если эта тенденция продолжится ещё хотя бы год, они, вероятно, станут лучшими исследователями уязвимостей, чем все
И я не знаю, как будет выглядеть этот мир

Довольно страшно жить в мире, где можно автоматически находить ошибки, которые раньше могли найти только один-два лучших специалиста в мире».

«Я никогда раньше не находил таких ошибок в своей жизни
Это невероятно, невероятно сложно
С помощью языковых моделей у меня их много
Это меня довольно сильно пугает»

Время удвоения возможностей LLM - каждые 4 месяца

Sonnet 4.5 и Opus 4.1 такие ошибки почти не находили


«Языковые модели по значимости находятся примерно на том же уровне, что и появление интернета»

Переходный период - вот чего он боится:
«В долгосрочной перспективе защитники, вероятно, выиграют
Но в переходный период между сейчас и тогда, вероятно, всё будет очень плохо»
Oт моделей, которые отвечают, к агентам, которые действуют

Агентам недостаточно уметь воспроизводить правильные ответы, они должны уметь выбирать стратегию поведения, чтобы решать многошаговые задачи и подстраиваться под непредсказуемое поведение пользователя

Отсюда вывод: агентам нужно учиться через опыт

RL-среды — сейчас один из главных трендов машинного обучения в целом
Над его развитием работают все игроки индустрии: Open AI, Google, Яндекс, Anthropic

RL-среда = симулятор, где модель обучается через реальные действия

Модель выбирает какую-то стратегию и работает по ней (это называется траектория), затем получает оценку своих действий, и постепенно учится выбирать лучшую политику
Самое главное, что правильного ответа тут иногда просто нет, так что мы говорим именно про сравнение вариантов действий

Работает это потому, что RL-среда учит не отдельным ответам, а последовательностям действий
Модель начинает учитывать последствия своих шагов и учится планированию, адаптации и работе с неопределенностью

Но и проблем с RL-средами пока хватает

Во-первых, сложно задать корректную функцию награды: модель может научиться "обманывать" метрику, не решая задачу по сути

Во-вторых, остается проблема credit assignment – как понять, на каком шаге стратегия пошла не так

И, наконец, сами среды пока далеки от реальности: симулированный пользователь все еще ведет себя проще, чем
настоящий

Вот тут
об этих и других вызовах для RL есть побольше вводных

Суть в том, что чем лучше будут RL-среды – тем лучше (и быстрее) будут агенты
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft выпустили Critique: инструмент для deep research, который может вызывать несколько разных моделей одновременно

То есть теперь вашим запросом занимаются сразу две модели: первая берет на себя основную генерацию, а вторая выступает в роли критика и рецензента и поправляет ошибки и неточности перед тем как система даст окончательный ответ

Какие модели участвовали в генерации – видно в шапке ответа
По бенчмарку DRACO – яркая SOTA, других бенчей нет

Появился еще режим Council для обычных запросов: там ваш промпт просто прогоняют через несколько моделей, и вы сразу видите разные варианты ответа
Плюс есть кратенькая выжимка о том, где модели сходятся и где у них разногласия
Удобно

techcommunity.microsoft.com/blog/microsoft365copilotblog/introducing-multi-model-intelligence-in-researcher/4506011
Ты никогда ничего не изменишь, если будешь бороться с существующей реальностью
Если хочешь что-то изменить, создай новую модель, чтобы старая просто устарела...
2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
В Claude Code теперь доступен Computer use
Агент пишет код, компилирует, запускает приложение, кликает по UI, находит баг, фиксит и проверяет результат
Всё по одному запросу.

Research preview доступно на Pro и Max планах, только macOS
Включается через /mcp в настройках
Мнения о локальных LLM сильно поляризованы, часто основаны на вайбах и хайпе, а не на фактах и науке

Несмотря на это, локальные модели используются всё больше, и 2026-й станет переломным годом для этого движения

Год назад агентные применения казались нереалистичными из-за требований к памяти и вычислениям, но летом 2025 с выходом gpt-oss и тд. появились модели, где tool calling реально работает на обычных устройствах

Уже не нужны триллионные модели и датацентры для большинства реальных задач
Существует некий порог достаточного интеллекта, который полностью достижим локально - это вопрос правильного software stack, а не вычислительной мощи

Qwen3.5 сейчас - лучший выбор
Но главная боль не в моделях, а в цепочке от промпта до результата

Единственная правильная архитектура, та, что работает эффективно на любом устройстве, в открытой разработке с сообществом и независимыми производителями железа

Локальные LLM - это
экономика наличных расчётов в мире AML-агентов
Понравилось определение AGI, которое дал на днях Франсуа Шолле (создатель ARC-AGI) на подкасте у Y Combinator

Его идея – в том, что в настоящее индустрия путает автоматизацию с интеллектом

AGI чаще всего определяется как то, что автоматизирует большинство экономически значимых задач
Но эта формулировка на самом деле не описывает общий интеллект

Альтернативное определение Шолле звучит так:

AGI – это система, которая при встрече с абсолютно новой задачей или абсолютно новым для нее доменом может разобраться в нем с той же эффективностью, что и человек

Это значит, что ей потребуется примерно столько же обучающих данных и компьюта

И это довольно мало, потому что люди крайне эффективно обрабатывают данные


Так что AGI – это не про автоматизацию, а про способность приобретения навыков на уровне человека на том же объеме задач, который люди потенциально могут научиться выполнять

Подкаст полностью тут:
https://youtu.be/k2ZLQC8P7dc
Anthropic движется к созданию полностью автономных AML -сотрудников, которые могут работать без человека часами/ днями

Это следует из сегодняшней
утечки кода Claude Code, которая показала, в какую сторону движется вся эта технология:

В коде очень много упоминаний функции под названием KAIROS
Это режим, в котором Claude будет работать в фоне
Он сможет:
- Сам думать над задачами
- Запоминать важное, есть даже специальный режим «сон», где AML подводит итоги
- Следить за изменениями в проекте
- Сам принимать решения, что делать дальше

Есть также режим PROACTIVE - AML будет периодически «просыпаться»и искать, чем полезным заняться, без постоянных вопросов

А в режиме Coordinator один Claude сможет управлять несколькими помощниками одновременно: один ищет информацию, второй пишет код, третий проверяет результат

Появится умный классификатор, который будет автоматически разрешать безопасные действия

Голосовой режим - можно будет просто разговаривать с AML в терминале.

Buddy - это питомец типа тамагочи прямо в терминале
18 разных существ

Специальный «режим под прикрытием» для сотрудников компании, чтобы никто не понял, что код написал агент

То есть, это полноценный член команды

Конечно, пока многие функции ещё в разработке и спрятаны
Но направление ясно - будущее за более самостоятельными и «живыми» агентами
Летняя школа «Современная математика» имени Виталия Арнольда пройдет в этом году с 19 по 30 июля в Царском Селе под Санкт-Петербургом. Принимаются заявки от школьников 10 и 11 классов и студентов I и II курсов

Можно посмотреть видеозаписи курсов прошедших школ
https://mccme.ru/dubna/courses/ — и брошюры, написанные по мотивам некоторых из них https://mccme.ru/dubna/books/

mccme.ru/dubna/2026/inform1.htm
Решили как–то Готфрид Лейбниц, Исаак Ньютон и Блез Паскаль поиграть в прятки

Водить выпало Лейбницу
Паскаль куда–то залез, замаскировался так, что не найдешь
А Ньютон взял палку, начертил на земле квадрат со стороной длиною 1 метр, встал посередине его и стоит

Лейбниц досчитал, открывает глаза и видит Ньютона
— Ньютон, — кричит Лейбниц, — я тебя нашел!
— Нет, — отвечает Ньютон — Ты что не видишь, что я Ньютон на квадратном метре?

Так что ты нашел Паскаля
😁1
Если вы пропустили исследование Google, то вот вам

Caltech
говорит, что благодаря новым кодам и архитектуре, квантовый компьютер может потребовать на порядки меньше физических кубитов от 10.000 до 26.000 для взлома, а не миллионы, как считали раньше

Google же представил сильно оптимизированную версию алгоритма Шора специально для взлома 256-битной эллиптической криптографии (та, на которой работают Bitcoin, Ethereum и почти вся крипто индустрия)
Атака может занять минуты, а не дни или недели

Вместе эти 2 прорыва резко снижают барьер: вместо миллионов кубитов теперь речь идёт о десятках тысяч

Даже
скептик Скотт Ааронсон - один из самых известных и при этом исторически скептически настроенных экспертов по квантовым вычислениям, признаёт, что это заметный прогресс и серьёзный сигнал для всей отрасли

При этом Google не выложил саму дорожную карту взлома, чтобы, вероятно, не дать готовый рецепт атаки в руки противникам
Вместо этого Google опубликовал ZK-proof, который доказывает, что есть рецепт, как эту атаку сделать
Proof сгенерирован с помощью SP1 zkVM от компании Succinct Labs

При этом сам Ааронсон не уверен, насколько этот подход реально помогает
Но он говорит так, как только другие компании , например, IBM и др. узнают, что схема существует, им может понадобиться немного времени, чтобы найти её самостоятельно

Сам факт публикации уже указывает направление
О “Проекте Pi”, проводимом Google и междисциплинарной командой Paradigms of Intelligence во главе с вице-президентом Google Блезом Агуэра-и-Аркас

Если кто-то из читателей еще не в курсе, – напомню миссию этого беспрецедентного проекта:
• Обосновать тупиковость нынешнего мейнстримного пути развития исследований и разработок создание Сверхразума
• Перевести стрелку развития на альтернативный путь, ведущий не в тупик, а к новому эволюционному скачку вселенского разума – его интеллектуальному взрыву

Однако, до сих пор было не ясно, что это за альтернативный путь
Ведь до сих пор об этом никто из команды “Проекта PI” явно не проговаривался

И вот наконец лидеры Google Paradigms of Intelligence продекларировали,
на какой путь развития они предлагают перевести стрелку

Вместо попыток создания единого сверхразумного «цифрового бога сингулярности» (AGI самопревращающегося в ASI), предлагается строительство нового социального слоя реальности, как основы Мира гибридного разума, где сотни миллиардов кентаврических конфигураций взаимодействуют в гигантском Цифровом Мегаполисе, в который превратится инфосфера Земли


Это будет мир сосуществования и симбиоза двух видов разума: биологического и небиологического

Это будет мир деятельного взаимодействия трёх типов идентичностей: людей, AML агентов и их кентавров различных конфигураций

Это будет мир, где один человек управляет многими агентами, один агент работает на многих людей, многие люди и многие агенты образуют временные ансамбли для решения конкретных задач, - и все вместе они образуют синтетическую интеллектуальную ткань коллективного действия

Такое видение будущего кардинально меняет план действий разработчиков

Для Цифрового Мегаполиса проектировать надо уже не просто агентов, а структуру и нормы их социальной жизни: роли, специализации, разделение когнитивного труда, иерархии, процедуры, способы разрешения конфликтов и образования коалиций, формы надзора, механизмы сдержек и противовесов, институты, рынки, суды и т.д.


Ну а что конкретно предлагают лидеры команды Paradigms of Intelligence для перевода развития на альтернативный путь, читайте в «манифесте Проекта Pi»
«Agentic AI and the next intelligence explosion» (Агентский ИИ и следующий интеллектуальный взрыв)

В посвящённом этой работе эссе «Сингулярность отменяется» развитие концепции Paradigms of Intelligence — от маршрутизации пути к следующему интеллектуальному взрыву к его онтологизации: к трактовке взрыва разума не как его апгрейд, а как выход на новый социальный уровень сложности жизни в результате очередного Большого перехода когнитивной эволюции разума
В статье "Раскрытие строгого диапазона применения любой математической эквивалентности между различными физическими свойствами, чтобы избежать добавления в реальность лишних непроверяемых вещей для объяснения внутренних расхождений в измерении явлений" автора Вей Гуо исследуется, почему математика является лишь формой описания физических законов, причем грубой и не точной

Практика размещения математического знака равенства между различными физическими величинами не является строгой
Причем, это следует из глубокого изучения самой же математики
Если настаивать на использовании этого подхода для описания физических законов, то справедливость математического знака равенства между различными физическими величинами сильно ограничена определенным кругом явлений, которые стоило бы описать отдельно или хотя бы их перечислить

Скажем, очень образно, автор говорит, что второй закон Ньютона в виде его классической математической записи применим (грубо) только на Земле
Но равенство в записи заставляет растаскивать всё это на масштабы Вселенной, что приводит к таким сущностям, как тёмная материя и т.п.

Но многие явления сначала спрогнозированы математически, а только потом обнаружены экспериментально
ABC–гипотеза стоит в одном ряду с гипотезой Гольдбаха, "гипотезой о простых близнецах" и Великой теоремой Ферма, хотя ее формулировка капельку сложнее

Грубо говоря, утверждение гипотезы устанавливает связь между алгебраическими свойствами составляющих число слагаемых и его множителей
Зато у ABC–гипотезы по сравнению с теоремой Ферма есть важное преимущество: если последняя – во многом красивый факт, повисший в воздухе, из которого нельзя вывести практически никаких существенных следствий, то доказательство ABC–гипотезы даст нам новое фундаментальное знание об устройстве чисел
В частности, из ABC–гипотезы, по–видимому, можно будет вывести и саму теорему Ферма

Характерно, что открытые вопросы теории чисел, как правило, невероятно трудны; для их решения (в случае, если оно все же со временем находится) приходится применять технический аппарат из многих других разделов математики – можно вспомнить доказательство Вайлза, использовавшее инструментарий эллиптических кривых, локальных полей, алгебраической геометрии и комплексного анализа
Метод, которым Мочидзуки доказал ABC–гипотезу, новаторская теория IUTeich, оказался сложным настолько, что понять его до сих пор бессильны почти все математики мира

Через три дня после того, как Мочидзуки выложил тексты своих статей в интернет, 3 сентября 2012 года, в популярном блоге математика Джордана Элленберга появилась запись, с которой, по–видимому, новость о появлении возможного доказательства ABC–гипотезы и начала свое распространение в математическом сообществе
"Шин опубликовал свое доказательство abc–гипотезы, о котором ходило много слухов, – писал Элленберг – Я пока не начал изучать его подход, но уже сейчас очевидно, что здесь использованы методы, лежащие далеко за пределами обычного для этой темы круга идей
Глядя на них, чувствуешь себя человеком, читающим статью, написанную в будущем или на другой планете"


Математика – не только строй знания, теоремы и формулы, но и сообщество со своими традициями и представлениями, в котором не очень–то принято переписывать самые устои науки, да еще в одиночку, да еще так, что никто не может разобраться в твоих идеях

Такие выбивающиеся из мейнстрима чудачества иногда встречаются, но редко воспринимаются всерьез научным сообществом
"Важно понимать, что [к доказательству Мочидзуки] относятся серьезно, потому что специалисты, разбирающиеся в вопросе, очень высокого мнения и о самом Мочидзуки, и о его предыдущих работах, – пишет авторитетный научный блогер физик Питер Войт – Если бы какой–нибудь никому не известный аутсайдер стал утверждать, что в его статье содержится решение одной из больших открытых математических проблем, да еще и на основе какого–то странного нового мира математических объектов, вряд ли кто–то из экспертов стал бы тратить свое время на проверку этих заявлений"


Итак, репутация Мочидзуки указывала, что в его теории IUTeich нужно разбираться, вот только как это сделать?
....

"Математическое сообщество просто парализовано, – замечает Фесенко,– так как мало кто находит мужество потратить большое количество времени, не менее 250 часов, на изучение его работы
Такого не было ни с работой Вайлза, ни с работой Перельмана"


Очевидно, проблема с теорией Мочидзуки лежит не столько в научной, сколько в социальной плоскости
"Математика в последнее время стала очень сложной
Человек тратит годы жизни, чтобы стать специалистами в какой–то узкой области
Вложив в это столько усилий, он получает колоссальный стимул в дальнейшем оставаться экспертом только в этой области, зато одним из немногих
Это приводит к узкой специализации и большому сопротивлению к изучению новых областей, в частности из–за естественного страха показать собственную слабость"...
Арнольд утверждал, что математика это просто часть физики, где не нужны дорогие эксперименты, а результат можно получить просто на бумажке, немного напрягши мозг

Вот, например, то, что высоты треугольника пересекаются в одной точке - физический факт
Нарисуйте на песке 150 треугольников, проведите высоты и убедитесь - пересекаются!
И не надо огород городить с этой вашей аксиоматикой

Формальное же изложение математики как чистой игры ума, по Арнольду, приводит к ужасным последствиям
У одного мальчика, обученного таким образом, спросили: сколько будет 3+2?
И мальчик ответил: 2+3, потому что сложение коммутативно

Мне кажется, что историю про несчастного алгебраического мальчика Арнольд выдумал
Просто хотел потроллить сообщество преподов, которое слишком увлеклось абстракциями
Law without law.pdf
2 MB
Law without law: from observer states to physics via
algorithmic information theory
Летняя школа «Современная математика» имени Виталия Дмитриевича Арнольда пройдет в этом году с 19 по 30 июля в Царском Селе под Санкт-Петербургом. Принимаются заявки от школьников 10 и 11 классов и студентов I и II курсов

Можно посмотреть видеозаписи курсов прошедших школ
mccme.ru/dubna/courses/ — и брошюры, написанные по мотивам некоторых из них mccme.ru/dubna/books/

mccme.ru/dubna/2026/inform1.htm
Ян Лекун продолжает свой крестовый поход против LLM как магистрального направления развития AML и дороги к человекоподобному интеллекту

Языковые модели не являются будущим AML
Они не смогут привести к человеческому уровню интеллекта, потому что они опираются только на текст и статистику языка, а не на реальное понимание мира

Интеллект — это решение новых задач без дообучения
Текущие модели этим свойством не обладают

Нужны модели мира на основе сенсорных данных
Это системы, которые строят внутренние абстрактные модели мира исходя из сенсорных данных (зрение, звук, взаимодействие), а не только из текста; именно они смогут безопасно и осмысленно действовать в мире

Разрыв между впечатляющими демками и полезной робототехникой велик
Никакой автономный транспорт не способен обучиться вождению за 20 часов практики, которых хватает человеку чтобы получить права

Предстоит долгая дорога до AML человеческого уровня, но прямо сейчас есть огромный научный потенциал
Оптимистом в отношении вклада AML в науку и ее ускорения можно быть уже сейчас
Заметная часть этих утверждений противоречит уверенности, например, Альтмана, который все время повторяет, что путь к AGI уже понятен
Тем интересней следить за конкуренцией разных взглядов на прогресс (причем приверженцы обоих неплохо профинансированы)
Да и сам Лекун сказал, что хорошие идеи “come from the interactions between people working on different assumptions with different motivations in different environments”

https://www.brown.edu/news/2026-04-01/yann-lecun-artificial-intelligence-pioneer
и
https://www.browndailyherald.com/article/2026/04/ai-pioneer-yann-lecun-discusses-new-frontiers-in-the-field-at-brown-lecture
2