130 subscribers
94 photos
21 videos
57 files
490 links
ALGORITHMS MACHINE LEARNING
Download Telegram
Из-за ошибки в настройках CMS Anthropic почти 3.000 внутренних файлов оказались в открытом доступе
Среди них - черновик анонса новой модели, которую компания ещё не представила

Модель называется Claude Mythos, кодовое название- Capybara

Эта модель выше уровня Opus, иерархия теперь выглядит так:
Haiku → Sonnet → Opus → Capybara

В просочившимся документе написано, что модель показывает очень высокую скорость по сравнению с Opus 4.6 в программировании, академическом рассуждении и кибербезопасности

Это самая мощная модель, которую они когда-либо создавали
Модель уже дотренирована, и сейчас они постепенно и тихо внедряют её своим enterprise клиентам

В утёкшем черновике сказано, что модель сильно впереди любой другой модели по киберспособностям и способна эксплуатировать уязвимости быстрее, чем успевают среагировать защитники
То есть Anthropic сами боятся собственной модели и пишут об этом внутри компании


Внедрение будет осторожным и постепенным

Реакция рынка на фоне этого слива
такая - акции компаний в сфере кибербезопасности упали
В шабад завершилась первая ВсОШ по AML (в рамках профиля "информатика"). В финале приняли участие почти 250 школьников со всей страны
Финалу, как и всегда в рамках ВсОШ, предшествовали региональные, муниципальные и школьные этапы

Ключевая особенность ВсОШ по AML состоит в том, что в ней есть, как математические задачи, так и задачи на машинное обучение

Математические задачи позволяют проверить, понимает ли школьник математические основы AML, или лишь научился механически его применять

Прикладной тур проходил без использования интернета

ВсОШ по AML серьёзно переосмысливает не только подход к обучению информатике в школе, фактически требуя изучения методов машинного обучения в 9-11 классах, но и впервые за много лет предъявляет новые требования к школьной математике
Чтобы успешно заниматься AML школьнику так или иначе нужно гораздо глубже знать математическую статистику, а что ещё важнее, частные производные и градиентный спуск

Всё это ещё вчера было немыслимо в школе
Всё это потребует привлекать учителей совершенно нового типа в школы, в первую очередь из индустрии, обеспечивая то самое обновление кадров


На этом фоне возникает вопрос, где же взять школьников, которые всё это потянут?

И они есть

Потрясающие ребята со всей страны, которые при наличии соответствующих возможностей в будущем смогу добиться лидерства России в области AML

Остается вопрос как их удержать в регионах

Подготовке кадров и многих другим вопросам, касающимся молодых специалистов будетпосвящен форум
«На Ты с IT», который пройдет 22-22 апреля в Челябинске

В 2026 году, АНО «ЛЦТ» готовит чемпионат по математическому моделированию на платформе регионального управления АСУР

В чемпионате примут участие как представителей правительств регионов, студенты и школьники

Участники будут решать реальные задачи, предоставленные региональными органами исполнительной власти.

Следите за детьми!

Написано с МИФИ
Инженер из Midjourney выложил в опенсорс алгоритм, который позволяет делать верстку без CSS
То есть он сам считает layout текста, без DOM и без браузерного reflow

Звучит странно, потому что мы привыкли, что за это отвечает браузер
Но браузер делает это тяжело, через каскад стилей, зависимости между элементами и пересчеты при каждом изменении
Если текст часто меняется, вся система начинает тормозить

Pretext убирает этот слой и сводит задачу к прямой математике

Собственно, это дает кратный выигрыш по скорости – до 500 крат

Зачем это все нужно?

Сейчас появляется все больше интерфейсов, где текст и структура не заданы заранее, а формируются динамически
В частности – это история про агентов

Когда агент собирает UI под задачу пользователя, интерфейс не фиксирован, он постоянно меняется, иногда буквально на каждом шаге

И каждый такой апдейт через браузерный reflow – это лишняя задержка и непредсказуемость

С Pretext это занимает гораздо меньше времени + полностью контролируемо со стороны кода
Когда интерфейс генерирует не человек, а система, удобнее работать с прямыми алгоритмами, а не с тяжелым браузерным пайплайном

Ну и, конечно, выглядит это очень красиво
За счет скорости обработки выдумать поверх Pretext можно что угодно (примеры прикладываю)
И все же в первую очередь проект интересен именно тем, как изящно он ложится на новые сценарии

github.com/chenglou/pretext
Claude нашёл уязвимости в ядре Linux, LLM догоняют людей в кибербезе

Николас Карлини из Anthropic- один из лучших исследователей безопасности AML мире
говорит так:

«Эти модели - лучшие исследователи уязвимостей, чем я
Вероятно, они пока не лучше всех вас, но в какой-то момент станут

Если эта тенденция продолжится ещё хотя бы год, они, вероятно, станут лучшими исследователями уязвимостей, чем все
И я не знаю, как будет выглядеть этот мир

Довольно страшно жить в мире, где можно автоматически находить ошибки, которые раньше могли найти только один-два лучших специалиста в мире».

«Я никогда раньше не находил таких ошибок в своей жизни
Это невероятно, невероятно сложно
С помощью языковых моделей у меня их много
Это меня довольно сильно пугает»

Время удвоения возможностей LLM - каждые 4 месяца

Sonnet 4.5 и Opus 4.1 такие ошибки почти не находили


«Языковые модели по значимости находятся примерно на том же уровне, что и появление интернета»

Переходный период - вот чего он боится:
«В долгосрочной перспективе защитники, вероятно, выиграют
Но в переходный период между сейчас и тогда, вероятно, всё будет очень плохо»
Oт моделей, которые отвечают, к агентам, которые действуют

Агентам недостаточно уметь воспроизводить правильные ответы, они должны уметь выбирать стратегию поведения, чтобы решать многошаговые задачи и подстраиваться под непредсказуемое поведение пользователя

Отсюда вывод: агентам нужно учиться через опыт

RL-среды — сейчас один из главных трендов машинного обучения в целом
Над его развитием работают все игроки индустрии: Open AI, Google, Яндекс, Anthropic

RL-среда = симулятор, где модель обучается через реальные действия

Модель выбирает какую-то стратегию и работает по ней (это называется траектория), затем получает оценку своих действий, и постепенно учится выбирать лучшую политику
Самое главное, что правильного ответа тут иногда просто нет, так что мы говорим именно про сравнение вариантов действий

Работает это потому, что RL-среда учит не отдельным ответам, а последовательностям действий
Модель начинает учитывать последствия своих шагов и учится планированию, адаптации и работе с неопределенностью

Но и проблем с RL-средами пока хватает

Во-первых, сложно задать корректную функцию награды: модель может научиться "обманывать" метрику, не решая задачу по сути

Во-вторых, остается проблема credit assignment – как понять, на каком шаге стратегия пошла не так

И, наконец, сами среды пока далеки от реальности: симулированный пользователь все еще ведет себя проще, чем
настоящий

Вот тут
об этих и других вызовах для RL есть побольше вводных

Суть в том, что чем лучше будут RL-среды – тем лучше (и быстрее) будут агенты
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft выпустили Critique: инструмент для deep research, который может вызывать несколько разных моделей одновременно

То есть теперь вашим запросом занимаются сразу две модели: первая берет на себя основную генерацию, а вторая выступает в роли критика и рецензента и поправляет ошибки и неточности перед тем как система даст окончательный ответ

Какие модели участвовали в генерации – видно в шапке ответа
По бенчмарку DRACO – яркая SOTA, других бенчей нет

Появился еще режим Council для обычных запросов: там ваш промпт просто прогоняют через несколько моделей, и вы сразу видите разные варианты ответа
Плюс есть кратенькая выжимка о том, где модели сходятся и где у них разногласия
Удобно

techcommunity.microsoft.com/blog/microsoft365copilotblog/introducing-multi-model-intelligence-in-researcher/4506011
Ты никогда ничего не изменишь, если будешь бороться с существующей реальностью
Если хочешь что-то изменить, создай новую модель, чтобы старая просто устарела...
2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
В Claude Code теперь доступен Computer use
Агент пишет код, компилирует, запускает приложение, кликает по UI, находит баг, фиксит и проверяет результат
Всё по одному запросу.

Research preview доступно на Pro и Max планах, только macOS
Включается через /mcp в настройках
Мнения о локальных LLM сильно поляризованы, часто основаны на вайбах и хайпе, а не на фактах и науке

Несмотря на это, локальные модели используются всё больше, и 2026-й станет переломным годом для этого движения

Год назад агентные применения казались нереалистичными из-за требований к памяти и вычислениям, но летом 2025 с выходом gpt-oss и тд. появились модели, где tool calling реально работает на обычных устройствах

Уже не нужны триллионные модели и датацентры для большинства реальных задач
Существует некий порог достаточного интеллекта, который полностью достижим локально - это вопрос правильного software stack, а не вычислительной мощи

Qwen3.5 сейчас - лучший выбор
Но главная боль не в моделях, а в цепочке от промпта до результата

Единственная правильная архитектура, та, что работает эффективно на любом устройстве, в открытой разработке с сообществом и независимыми производителями железа

Локальные LLM - это
экономика наличных расчётов в мире AML-агентов
Понравилось определение AGI, которое дал на днях Франсуа Шолле (создатель ARC-AGI) на подкасте у Y Combinator

Его идея – в том, что в настоящее индустрия путает автоматизацию с интеллектом

AGI чаще всего определяется как то, что автоматизирует большинство экономически значимых задач
Но эта формулировка на самом деле не описывает общий интеллект

Альтернативное определение Шолле звучит так:

AGI – это система, которая при встрече с абсолютно новой задачей или абсолютно новым для нее доменом может разобраться в нем с той же эффективностью, что и человек

Это значит, что ей потребуется примерно столько же обучающих данных и компьюта

И это довольно мало, потому что люди крайне эффективно обрабатывают данные


Так что AGI – это не про автоматизацию, а про способность приобретения навыков на уровне человека на том же объеме задач, который люди потенциально могут научиться выполнять

Подкаст полностью тут:
https://youtu.be/k2ZLQC8P7dc
Anthropic движется к созданию полностью автономных AML -сотрудников, которые могут работать без человека часами/ днями

Это следует из сегодняшней
утечки кода Claude Code, которая показала, в какую сторону движется вся эта технология:

В коде очень много упоминаний функции под названием KAIROS
Это режим, в котором Claude будет работать в фоне
Он сможет:
- Сам думать над задачами
- Запоминать важное, есть даже специальный режим «сон», где AML подводит итоги
- Следить за изменениями в проекте
- Сам принимать решения, что делать дальше

Есть также режим PROACTIVE - AML будет периодически «просыпаться»и искать, чем полезным заняться, без постоянных вопросов

А в режиме Coordinator один Claude сможет управлять несколькими помощниками одновременно: один ищет информацию, второй пишет код, третий проверяет результат

Появится умный классификатор, который будет автоматически разрешать безопасные действия

Голосовой режим - можно будет просто разговаривать с AML в терминале.

Buddy - это питомец типа тамагочи прямо в терминале
18 разных существ

Специальный «режим под прикрытием» для сотрудников компании, чтобы никто не понял, что код написал агент

То есть, это полноценный член команды

Конечно, пока многие функции ещё в разработке и спрятаны
Но направление ясно - будущее за более самостоятельными и «живыми» агентами
Летняя школа «Современная математика» имени Виталия Арнольда пройдет в этом году с 19 по 30 июля в Царском Селе под Санкт-Петербургом. Принимаются заявки от школьников 10 и 11 классов и студентов I и II курсов

Можно посмотреть видеозаписи курсов прошедших школ
https://mccme.ru/dubna/courses/ — и брошюры, написанные по мотивам некоторых из них https://mccme.ru/dubna/books/

mccme.ru/dubna/2026/inform1.htm
Решили как–то Готфрид Лейбниц, Исаак Ньютон и Блез Паскаль поиграть в прятки

Водить выпало Лейбницу
Паскаль куда–то залез, замаскировался так, что не найдешь
А Ньютон взял палку, начертил на земле квадрат со стороной длиною 1 метр, встал посередине его и стоит

Лейбниц досчитал, открывает глаза и видит Ньютона
— Ньютон, — кричит Лейбниц, — я тебя нашел!
— Нет, — отвечает Ньютон — Ты что не видишь, что я Ньютон на квадратном метре?

Так что ты нашел Паскаля
😁1
Если вы пропустили исследование Google, то вот вам

Caltech
говорит, что благодаря новым кодам и архитектуре, квантовый компьютер может потребовать на порядки меньше физических кубитов от 10.000 до 26.000 для взлома, а не миллионы, как считали раньше

Google же представил сильно оптимизированную версию алгоритма Шора специально для взлома 256-битной эллиптической криптографии (та, на которой работают Bitcoin, Ethereum и почти вся крипто индустрия)
Атака может занять минуты, а не дни или недели

Вместе эти 2 прорыва резко снижают барьер: вместо миллионов кубитов теперь речь идёт о десятках тысяч

Даже
скептик Скотт Ааронсон - один из самых известных и при этом исторически скептически настроенных экспертов по квантовым вычислениям, признаёт, что это заметный прогресс и серьёзный сигнал для всей отрасли

При этом Google не выложил саму дорожную карту взлома, чтобы, вероятно, не дать готовый рецепт атаки в руки противникам
Вместо этого Google опубликовал ZK-proof, который доказывает, что есть рецепт, как эту атаку сделать
Proof сгенерирован с помощью SP1 zkVM от компании Succinct Labs

При этом сам Ааронсон не уверен, насколько этот подход реально помогает
Но он говорит так, как только другие компании , например, IBM и др. узнают, что схема существует, им может понадобиться немного времени, чтобы найти её самостоятельно

Сам факт публикации уже указывает направление
О “Проекте Pi”, проводимом Google и междисциплинарной командой Paradigms of Intelligence во главе с вице-президентом Google Блезом Агуэра-и-Аркас

Если кто-то из читателей еще не в курсе, – напомню миссию этого беспрецедентного проекта:
• Обосновать тупиковость нынешнего мейнстримного пути развития исследований и разработок создание Сверхразума
• Перевести стрелку развития на альтернативный путь, ведущий не в тупик, а к новому эволюционному скачку вселенского разума – его интеллектуальному взрыву

Однако, до сих пор было не ясно, что это за альтернативный путь
Ведь до сих пор об этом никто из команды “Проекта PI” явно не проговаривался

И вот наконец лидеры Google Paradigms of Intelligence продекларировали,
на какой путь развития они предлагают перевести стрелку

Вместо попыток создания единого сверхразумного «цифрового бога сингулярности» (AGI самопревращающегося в ASI), предлагается строительство нового социального слоя реальности, как основы Мира гибридного разума, где сотни миллиардов кентаврических конфигураций взаимодействуют в гигантском Цифровом Мегаполисе, в который превратится инфосфера Земли


Это будет мир сосуществования и симбиоза двух видов разума: биологического и небиологического

Это будет мир деятельного взаимодействия трёх типов идентичностей: людей, AML агентов и их кентавров различных конфигураций

Это будет мир, где один человек управляет многими агентами, один агент работает на многих людей, многие люди и многие агенты образуют временные ансамбли для решения конкретных задач, - и все вместе они образуют синтетическую интеллектуальную ткань коллективного действия

Такое видение будущего кардинально меняет план действий разработчиков

Для Цифрового Мегаполиса проектировать надо уже не просто агентов, а структуру и нормы их социальной жизни: роли, специализации, разделение когнитивного труда, иерархии, процедуры, способы разрешения конфликтов и образования коалиций, формы надзора, механизмы сдержек и противовесов, институты, рынки, суды и т.д.


Ну а что конкретно предлагают лидеры команды Paradigms of Intelligence для перевода развития на альтернативный путь, читайте в «манифесте Проекта Pi»
«Agentic AI and the next intelligence explosion» (Агентский ИИ и следующий интеллектуальный взрыв)

В посвящённом этой работе эссе «Сингулярность отменяется» развитие концепции Paradigms of Intelligence — от маршрутизации пути к следующему интеллектуальному взрыву к его онтологизации: к трактовке взрыва разума не как его апгрейд, а как выход на новый социальный уровень сложности жизни в результате очередного Большого перехода когнитивной эволюции разума
В статье "Раскрытие строгого диапазона применения любой математической эквивалентности между различными физическими свойствами, чтобы избежать добавления в реальность лишних непроверяемых вещей для объяснения внутренних расхождений в измерении явлений" автора Вей Гуо исследуется, почему математика является лишь формой описания физических законов, причем грубой и не точной

Практика размещения математического знака равенства между различными физическими величинами не является строгой
Причем, это следует из глубокого изучения самой же математики
Если настаивать на использовании этого подхода для описания физических законов, то справедливость математического знака равенства между различными физическими величинами сильно ограничена определенным кругом явлений, которые стоило бы описать отдельно или хотя бы их перечислить

Скажем, очень образно, автор говорит, что второй закон Ньютона в виде его классической математической записи применим (грубо) только на Земле
Но равенство в записи заставляет растаскивать всё это на масштабы Вселенной, что приводит к таким сущностям, как тёмная материя и т.п.

Но многие явления сначала спрогнозированы математически, а только потом обнаружены экспериментально
ABC–гипотеза стоит в одном ряду с гипотезой Гольдбаха, "гипотезой о простых близнецах" и Великой теоремой Ферма, хотя ее формулировка капельку сложнее

Грубо говоря, утверждение гипотезы устанавливает связь между алгебраическими свойствами составляющих число слагаемых и его множителей
Зато у ABC–гипотезы по сравнению с теоремой Ферма есть важное преимущество: если последняя – во многом красивый факт, повисший в воздухе, из которого нельзя вывести практически никаких существенных следствий, то доказательство ABC–гипотезы даст нам новое фундаментальное знание об устройстве чисел
В частности, из ABC–гипотезы, по–видимому, можно будет вывести и саму теорему Ферма

Характерно, что открытые вопросы теории чисел, как правило, невероятно трудны; для их решения (в случае, если оно все же со временем находится) приходится применять технический аппарат из многих других разделов математики – можно вспомнить доказательство Вайлза, использовавшее инструментарий эллиптических кривых, локальных полей, алгебраической геометрии и комплексного анализа
Метод, которым Мочидзуки доказал ABC–гипотезу, новаторская теория IUTeich, оказался сложным настолько, что понять его до сих пор бессильны почти все математики мира

Через три дня после того, как Мочидзуки выложил тексты своих статей в интернет, 3 сентября 2012 года, в популярном блоге математика Джордана Элленберга появилась запись, с которой, по–видимому, новость о появлении возможного доказательства ABC–гипотезы и начала свое распространение в математическом сообществе
"Шин опубликовал свое доказательство abc–гипотезы, о котором ходило много слухов, – писал Элленберг – Я пока не начал изучать его подход, но уже сейчас очевидно, что здесь использованы методы, лежащие далеко за пределами обычного для этой темы круга идей
Глядя на них, чувствуешь себя человеком, читающим статью, написанную в будущем или на другой планете"


Математика – не только строй знания, теоремы и формулы, но и сообщество со своими традициями и представлениями, в котором не очень–то принято переписывать самые устои науки, да еще в одиночку, да еще так, что никто не может разобраться в твоих идеях

Такие выбивающиеся из мейнстрима чудачества иногда встречаются, но редко воспринимаются всерьез научным сообществом
"Важно понимать, что [к доказательству Мочидзуки] относятся серьезно, потому что специалисты, разбирающиеся в вопросе, очень высокого мнения и о самом Мочидзуки, и о его предыдущих работах, – пишет авторитетный научный блогер физик Питер Войт – Если бы какой–нибудь никому не известный аутсайдер стал утверждать, что в его статье содержится решение одной из больших открытых математических проблем, да еще и на основе какого–то странного нового мира математических объектов, вряд ли кто–то из экспертов стал бы тратить свое время на проверку этих заявлений"


Итак, репутация Мочидзуки указывала, что в его теории IUTeich нужно разбираться, вот только как это сделать?
....

"Математическое сообщество просто парализовано, – замечает Фесенко,– так как мало кто находит мужество потратить большое количество времени, не менее 250 часов, на изучение его работы
Такого не было ни с работой Вайлза, ни с работой Перельмана"


Очевидно, проблема с теорией Мочидзуки лежит не столько в научной, сколько в социальной плоскости
"Математика в последнее время стала очень сложной
Человек тратит годы жизни, чтобы стать специалистами в какой–то узкой области
Вложив в это столько усилий, он получает колоссальный стимул в дальнейшем оставаться экспертом только в этой области, зато одним из немногих
Это приводит к узкой специализации и большому сопротивлению к изучению новых областей, в частности из–за естественного страха показать собственную слабость"...