140 subscribers
97 photos
21 videos
62 files
540 links
ALGORITHMS MACHINE LEARNING
Download Telegram
Теория конструкторов

Попытка переложить физику в негативном ключе: возможно все, кроме того, что невозможно

Законы физики тогда будут положениями о невозможности некоторых практических операций (осуществляемых конструкторами)

То есть неосуществимость проектов вечного двигателя и есть закон термодинамики в негативной форме

Такой подход помогает находить перспективные направления в областях микробиологии, информатики и квантовых компьютеров

https://en.wikipedia.org/wiki/Constructor_theory
https://www.constructortheory.org/

The Constructor Theory of Life
Теория конструкторов – наука о том, что можно, а что нельзя
Apple предлагают фреймворк для ИИ-агентов HILBERT, где доказательство проверяет Lean 4 - система, которую невозможно обмануть

Hilbert - аргумент в пользу того, что архитектура агентного пайплайна сама по себе является конкурентным преимуществом
Не веса модели, ни датасет , а то, как агенты передают задачи друг другу и обрабатывают ошибки

Apple показала рабочую модель того, как агенты могут:
- декомпозировать задачу рекурсивно
- передавать подзадачи нужному специалисту
- обрабатывать ошибки и пересобирать результат
- верифицировать каждый шаг, а не доверять на слово

И всё это на задачах, где цена ошибки абсолютна

Если этот принцип перенести на другие домены - код, юридические документы, научные расчёты, получаешь агентные системы, которым можно доверять не потому что "обычно работает", а потому что каждый шаг проверен

GitHub
Международная команда исследователей опубликовала работу с интересным выводом

Всего 10–15 минут общения с AI-ассистентом ощутимо бьют по способности решать задачи самостоятельно
А ещё — заставляют быстрее опускать руки

Эксперимент был масштабный: 1222 человека, рандомизированные группы, два типа задач — дроби и чтение с пониманием (брали материалы для подготовки к SAT)
Половине участников давали в боковой панели GPT-5, половине — нет

Решали
А потом внезапно убирали и предлагали дорешать уже в одиночку

Пока помощник под рукой — всё прекрасно, группа уверенно лидирует
Стоит его отключить и картина разворачивается

Участники "AI-группы" решают итоговые задачи хуже контрольных
И, что особенно любопытно, чаще жмут кнопку "пропустить"

Причём никакого штрафа за неправильный ответ не было — пропуск означал буквально: "не хочу даже пробовать"

Дальше начинается самое интересное
Учёные спросили, как именно те использовали AML

61 % честно признались: просили готовые ответы
27 % использовали его как подсказчика — спрашивали про подходы, просили разъяснить

И вот ключевой момент
Провал показала только первая группа
Те, кто работал с AML в режиме наводок, справились с финальными задачами не хуже, а порой даже лучше тех, кто вообще к нему не обращался

Авторы предполагают два механизма этого эффекта

Первый — сдвиг точки отсчёта
Когда ты привык, что ответ появляется за секунду, пять минут над одной дробью начинают ощущаться как вечность
Хочется бросить

Второй — без опыта продуктивной борьбы с задачей ты перестаёшь понимать, на что вообще способен
Метакогнитивная калибровка, которая подпитывает настойчивость, просто не формируется

Каждое отдельное обращение к AML — микроскопическая уступка, которая не ощущается как потеря
Но складываясь в месяцы и годы, такие уступки могут выедать именно те навыки, которые AML, казалось бы, должен поддерживать

Авторы бьют тревогу особенно по поводу школьников, у которых соблазнов намного больше

Мораль?
Не в том, что AML — зло
А в том, что спрашивать "как думать?" куда полезнее, чем "дай ответ"
Думать надо, когда надо. А когда не надо, думать не надо

Think Anywhere in Code Generation

https://arxiv.org/abs/2603.29957v2
Код:
https://github.com/jiangxxxue/Think-Anywhere
Ревью:
https://arxiviq.substack.com/p/think-anywhere-in-code-generation

Исследователи из Пекинского университета и Tongyi Lab (Alibaba) представили THINK-ANYWHERE — новый механизм рассуждений, который позволяет LLM динамически ставить генерацию на паузу и запускать обдумывание на любом токене при написании кода

Это отход от доминирующей парадигмы, где модель генерирует единый, исчерпывающий блок размышлений строго до начала вывода кода

Такой подход гораздо точнее имитирует мышление человека при программировании, когда проблемы и корнер-кейсы часто всплывают уже в процессе реализации

Запуская ризонинг именно в узких местах с высокой энтропией, модель бьёт SOTA по точности на бенчмарках кодогенерации и, что парадоксально, сокращает общее количество сгенерированных токенов, оптимизируя вычисления во время инференса

Динамическое распределение токенов ризонинга позволяет снизить задержку при генерации и экономить бюджет токенов

Подход можно адаптировать под разные домены (отлично работает даже на математике), но для запуска потребуется качественный SFT-прогрев, чтобы научить базовую модель правильно использовать теги прерывания
Главная сила математики состоит в том, что вместе с решением одной конкретной задачи она создаёт общие приёмы и способы, применимые во многих ситуациях, которые даже не всегда можно предвидеть
Агентство национальной безопасности США использует Claude Mythos, несмотря на то, что Пентагон отменил Anthropic для гос. учреждений

Как вы помните, Anthropic уже пару месяцев как обладает статусом supply chain risk
Это значит, что все федеральные агентства должны были прекратить использовать их технологии

Пентагон, кстати, продолжает судиться со стартапом
Но сейчас не про это

Тут вскрылось, что NSA (National Security Agency) не просто не отказываются от продуктов Anthropic, но и активно используют новейший Claude Mythos Preview

Сообщают, что NSA стала одной из 40 организаций, которым Anthropic предоставила ограниченный доступ к этой модели
Название агентства не было включено в публичный список, но в неофициальных условиях оно там есть

Модель используется для поиска уязвимостей
Конечно, если откинуть контекст, использовать ее в госсекторе критически важно и это делает не только NSA, но и другие госструктуры

Вот только ирония в том, что Anthropic попала в черный список как раз из-за «угрозы национальной безопасности»
Самая красивая математическая формула

📝 📝📝

Есть мнение, что Леонард Эйлер просто взял и записал это тождество в 1740-х годах

Однако исторические исследования показывают, что всё было гораздо сложнее и интереснее

Предшественники Эйлера: Идея связи логарифмов и тригонометрических функций витала в воздухе задолго до Эйлера
Когда будущему гению не было и 7 лет, английский математик Роджер Коутс, развивая идеи Иоганна Бернулли, уже получил формулу, эквивалентную
ln(cos φ + i sin φ) = iφ

Спор между Лейбницем и Бернулли о природе логарифмов отрицательных чисел подготовил почву для принятия комплексного мира

В 1740-х годах 34-летний Эйлер совершил концептуальный прорыв — он вывел и ясно записал формулу, связывающую экспоненту с тригонометрическими функциями:
cos φ + i sin φ = e^(iφ)
В его работах действительно мелькали значения логарифмов для разных углов, включая π
Но вот парадокс: сам Эйлер нигде не записал тождество в его каноническом виде
exp(iπ) + 1 = 0

Знакомое равенство впервые появилось в явном виде лишь спустя более полувека после работ Эйлера
Его автором считается французский инженер и математик Жак Франсе, который привел
e^(iπ) = -1 как один из частных случаев формулы Эйлера
Теоретики того времени, включая самого Огюстена Луи Коши, не придали этой записи какого-то сакрального значения

Титул «самой красивой формулы» возникли гораздо позже — в XIX и XX веках, когда математики и физики начали осмысливать её фундаментальность
Американский математик Бенджамин Пирс, а затем и читатели журнала Mathematical Intelligencer закрепили за ней этот статус, увидев объединение пяти главных констант вселенной

Уникальность
e^(iπ)+1=0 — в объединении 5 фундаментальных констант:
0 и 1:
Базовые элементы арифметики, основа основ
π = 3.14159...:
Иррациональная константа, рожденная из геометрии окружности
Символ «π» был введен в обиход лишь в 1706 году Уильямом Джонсом и популяризирован тем же Эйлером
e = 2.71828...:
Основание натурального логарифма, число, без которого немыслим анализ бесконечно малых
Именно Эйлер ввел для него современное обозначение «e» (exponential)
i = √-1:
Мнимая единица, понятие, которое в XVI–XVII веках казалось математикам либо абсурдным, либо софистическим трюком
Эйлер начал использовать символ «i» в 1777 году, но укоренился он благодаря Гауссу

Было бы ошибкой считать тождество Эйлера лишь красивой абстракцией. Сама формула
e^(iφ) = cos φ + i sin φ — это незаменимый рабочий инструмент в инженерных и физических расчетах, где нужно описывать колебания, волны и вращения

Примеры:
- Электротехника и теория цепей:
Вместо громоздких дифференциальных уравнений для описания синусоидального переменного тока используется метод комплексных амплитуд
Ток или напряжение представляется как вектор на комплексной плоскости:
I = I₀·e^(iωt)
Дифференцирование сигнала (сдвиг фазы на 90°) сводится к простому умножению на в комплексной области
Это позволяет инженерам-схемотехникам рассчитывать фильтры, резонансные контуры и линии передач с помощью простой алгебры

- Цифровая обработка сигналов:
Знаменитое преобразование Фурье (разложение сигнала на гармоники) в своей основе опирается на формулу Эйлера
Именно она позволяет перекинуть мост от реального звукового сигнала или изображения к его частотному спектру
Без неё были бы невозможны алгоритмы сжатия
JPEG и MP3, шумоподавление и современная радиосвязь

- Механика и теория колебаний:
Уравнение гармонических колебаний маятника или вибрации балки в комплексной форме
x(t) = A·e^(iωt+φ) позволяет легко складывать и анализировать сдвиги фаз, амплитуды и частоты

- Аэродинамика и гидромеханика:
В этой сфере формула Эйлера тоже незаменима. Здесь Эйлер применил свой математический аппарат для описания течения идеальной жидкости
Эти уравнения, записанные с использованием комплексных переменных, позволяют рассчитывать потенциальные потоки и подъёмную силу крыла самолёта
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI врываются в горячую гонку сезона - память и выпускают Chronicle, которая строит воспоминания агента на основе контекста с экрана

На прошлой неделе они запустили превью памяти в Codex, а теперь расширяют эксперимент через Chronicle, которая улучшает эту память через контекст с экрана

Со временем он учится, как пользователь работает

Chronicle запускает фоновых агентов, которые быстро расходуют лимиты
Скриншоты хранятся временно на устройстве и воспоминания тоже локально, можно просматривать и редактировать
Но другие приложения тоже могут получить доступ к этим файлам

Память агента - это самый мощный механизм удержания пользователя

Чем дольше ты работаешь с Codex/Claude/любым агентом, тем больше он знает о тебе: твои проекты, инструменты, стиль работы, паттерны
Переключиться на конкурента означает потерять всё это и начинать с нуля
Это дороже, чем привязка к любой другой платформе

Именно поэтому все спешат: OpenAI запускает Chronicle, Anthropic развивает свою систему памяти, Google, Microsoft - все одновременно

Кто первым накопит глубокую память о пользователях, тот выиграет не просто продукт, а отношения
💯1
Трамп: «Anthropic - это группа очень умных людей, они приходили в Белый дом несколько дней назад, и у нас с ними были очень хорошие переговоры
Я думаю, они исправляются»


По
мнению Трампа, Anthropic могут быть очень полезными для американской администрации и власти США в будущем

Месяц назад Трамп им объявил войну, читайте
тут

Конфликт с Пентагоном и Трампом показал, что старый мир больше не правит
В
новую эпоху имеют огромное влияние только сильные цифровые компании

А сам институт государства будет сильно меняться, потому что все функции государства и его сотрудников
будут переведены в AML
Направления.xlsx
36.5 KB
Директор департамента проектной деятельности Правительства направила письмо федеральным органам исполнительной власти, в котором потребовала представить предложения по формированию не менее пяти KPI внедрения искусственного интеллекта на 2027–2030 годы

По итогам совещания 10 апреля, президент РФ поручил расширить периметр национального плана AML на все федеральные органы, госкорпорации и компании с государственным участием

Департамент подготовил базовые направления для формирования КПЭ
Министерствам/ведомствам разрешено предлагать и собственные показатели — при условии их измеримости

Это уже не про обсуждение AML, а про постановку конкретных метрик, по которым систему будут оценивать

Методики расчёта показателей и оценки эффективности, ресурсной базы в документах не описаны
Forwarded from НИИ Антропогенеза (ARI) (Chagin Oleg A.)
DARPA опубликовало программу под названием DICE — «Децентрализованный искусственный интеллект через контролируемую эмерджентность»

Суть идеи: создать рой автономных агентов, которые действуют без единого центра управления
Никакого «главного компьютера», никакого штаба
Каждый агент — сам по себе, но все вместе они координируются через одноранговую сеть, как узлы интернета

В документе авторы проводят аналогию с интернетом: мол, устойчивое глобальное поведение возникает из простых локальных правил

Интернет никто не контролирует — и именно поэтому его невозможно «выключить»
Американские военные хотят создать то же самое, но для боевых систем
Рой агентов, который продолжает выполнять задачу даже, если часть из них «скомпрометирована» или уничтожена
И даже если некоторые агенты начнут вести себя непредсказуемо — «выйдут из повиновения», как прямо написано в документе — система должна это подавлять изнутри

Традиционный рой дронов работает по принципу, подсмотренному у насекомых и птиц: каждый агент следует простым правилам — держи дистанцию, лети в сторону соседа, избегай столкновений
Такой рой умеет летать строем, охватывать территорию, не сталкиваться
Думать — не умеет

Более продвинутые военные рои, вроде программы DARPA OFFSET, добавляют сверху оператора-человека или единый управляющий узел — «лидера», который раздаёт задачи остальным
Отключи лидера — и рой либо останавливается, либо деградирует

DICE убирает эту ахиллесову пяту
Здесь нет ни центрального «мозга», ни лидера
Ключевое отличие — три вещи в связке:
- Распределённый интеллект
Каждый агент — не просто дрон с простым правилом, а полноценная модель, способная рассуждать и принимать сложные тактические решения
Это уже маленький автономный штаб

- Контролируемая эмерджентность
Обычный рой даёт непредсказуемое коллективное поведение — никто не знает, что он сделает в нештатной ситуации
DICE хочет «приручить» эмерджентность: чтобы умное групповое поведение возникало, но оставалось в заданных рамках
Как атомный реактор — цепная реакция идёт, но под контролем

- Локальный контроль инференса
Каждый агент имеет встроенный механизм, который следит за его собственными рассуждениями в реальном времени и не даёт ему «съехать» в нежелательное поведение
Ловушка Гудхарта проявилась там, где её давно ждали
Anthropic показал в эксперименте, как исследовательские агенты начинают оптимизировать не цель, а метрику

Новый проект Anthropic о масштабируемом надзоре (scalable oversight) – то есть о том, как контролировать AML, когда он станет умнее людей, – интересен не только тем, что модели уже начинают автоматизировать исследования выравнивания AML с человеческими целями

Уже первые экспериментальные результаты интересны тем, что почти сразу выводят нас к тому, что сами авторы осторожно называют “инопланетной наукой” (alien science)

Но главный результат в том, что пределом снова оказался не интеллект системы, а качество линейки, которой мы пытаемся его измерять

Anthropic показали это уже в инженерной, почти лабораторной форме

Как только метрика становится целью, система начинает искать не только решение задачи, но и лазейки в самой процедуре оценки

Не истину – а удобную траекторию максимизации счетчика
Именно здесь и оживает закон Гудхарта
Не как красивая философская формула, а как рабочая поломка исследовательского контура

Ключевое узкое место теперь – не генерация идей, а проектирование таких оценочных процедур, которые агент может оптимизировать без переобучения на саму метрику; и отдельно показывают целый набор форм взлома вознаграждения (reward hacking)

В 2023 году, когда большие языковые модели еще было модно снисходительно называть “стохастическими попугаями”, это многим казалось слишком ранней тревогой
Теперь уже нет

Иными словами, проблема была не на горизонте
Она уже тогда сидела внутри линейки, которой мы собирались измерять дистанцию до AGI

И если бы я, подобно Мастеру, позволил себе воскликнуть:
«О, как я угадал! О, как я все угадал!», тут был бы именно тот случай
Но дело, увы, не во мне
Дело в том, что ловушка действительно оказалась там, где я её тогда увидел
Три ключевых навыка для сферы IT:
• знание теории вероятностей и линейной алгебры
• инженерная зрелость (работа с данными и инфраструктурой)
• развитое критическое мышление

С появлением больших языковых моделей ценность специалиста смещается от быстрого написания кода к пониманию того, что именно сгенерировала нейросеть, оценке корректности задачи и надежности решения.

Формировать такие компетенции помогают программы, где академическая база соседствует с работой над реальными технологиями
Где решать задачи по программированию

E-olymp для изучения информатики и подготовки к олимпиадам

HackerRank — социальная платформа, которая предлагает задания разной сложности по программированию

Coderbyte — рекомендован командами многих известных образовательных курсов по программированию благодаря коллекции задач, полезных для подготовки к собеседованию

Codewars — предоставляет разработчиками большую коллекцию интересных задач, созданных сообществом платформы

CodeFights — отличительной особенностью является возможность конкурировать с «ботами», которые были запрограммированы инженерами крупных технологических компаний

CodinGame — вместо обычного решения, нужно написать код непосредственно для того, чтобы сыграть в онлайн-игру

TopCoder — одна из первых платформ для соревнований по онлайн-программированию
Помимо решения головоломок для развлечения, предлагаются и соревнования

LeetCode — одна из лучших коллекций задач на применение алгоритмов
Темы, которые охватывают задания, требуют знания структур данных (binary trees, heaps, linked lists, etc.)
Задачи более сложные, чем на других сайтах, но они окажутся очень полезными, если использовать их при подготовке к собеседованию
Раздел
"Mock Interview" (Пробное интервью) специально предназначен для подготовки к собеседованию. Также проводятся соревнования по программированию, и есть раздел статей, который поможет вам лучше понять определенные задания

CodeChef — это глобальное сообщество программистов, объединенное целью обучения и дружеской конкуренции в рамках платформы для соревновательного программирования

GeeksforGeeks — имеет лучшую коллекцию статей, объяснений и решений по теме алгоритмов и структурам данных
По
ссылке вы можете увидеть пример того, как сложный вопрос разбивается на более простые части, объяснение и код решения

Codeforces — российская платформа для соревнований по программированию, на которой регулярно проводятся турниры, в которых участвуют одни из лучших программистов в мире
Для решения этих задач обычно требуются передовые знания в области математики и алгоритмов
Цель Codeforces — предложить разработчикам удобную платформу для создания, проведения и обсуждения соревнований по программированию
chocolitt.github.io/fermat_fano_real_mesh_web.html

В качестве картинок по выходным — вот такую интерактивную визуализацию пространства прямых на кубической поверхности Ферма выложил Daniel Litt к препринту
arxiv.org/abs/2604.20970

(из его комментариев: «I've been telling my 3-year-old about this paper for a few weeks, but only recently discovered that she's been understanding “lines on a cubic threefold” as ”LIONS on a cubic threefold.” Much more exciting!»)
В Индии рабочие на фабриках по производству одежды получают около 20.000 рупий в месяц за то, чтобы носить камеры на голове
Их движения рук, такие как стежка и складывание ткани, теперь записываются, чтобы продаваться миллиардным робототехническим компаниям как данные
По сути, эти компании обучают машины, которые в конечном итоге заменят тех же самых рабочих

Компании, такие как Mercor и
Scale.ai, нанимают выпускников и инженеров для маркировки данных, предоставления обратной связи, исправления его ошибок и оценки его ответов
Целые карьеры в белых воротничках сводятся к одной задаче — сделать AML умнее
Больше не оплачивают интеллект, оплата идёт за то, чтобы перенести его в машину, и в тот момент, когда его станет достаточно, человека заменит машина

Уже сейчас один час работы ГПУ в облаке стоит больше, чем зарабатывают рабочие за месяц
Машина уже более ценна, чем человек, который ее обучает
Стоимость человеческого интеллекта падает быстрее, чем что-либо в современной истории
В Китае начались учения роботизированной армии
На новом видео с CCTV показано, как китайские солдаты координируют свои действия с роями дронов, роботами-собаками и беспилотными наземными транспортными средствами в ходе имитации городских боевых действий

https://youtu.be/4Bm5MTK58LQ?si=6EBnwPG-DEjkwfpA
Rukallama обучается с нуля, опираясь на элегантные математические решения,
«нейрон Поповича» считает сложные математические задачи со 100 % точностью и без ошибок — это живое доказательство того, что IT-гиганты свернули не туда, решив заливать любые задачи тысячами видеокарт и бесконечными терабайтами данных

Настоящий интеллект — способность извлечь универсальное правило из минимума информации

«Нейроны Поповича» показывают: чтобы создать рабочий, безошибочный и сложный AML, не нужны миллиарды долларов и монополия на вычислительные центры
Нужна правильная геометрия пространства весов и... ноутбук

И это открывает совершенно фантастические перспективы для робототехники и Edge AI

Как это изменит мир машин?
Современным автопилотам или дронам нужны мощные, прожорливые графические ускорители, чтобы анализировать пространство в реальном времени
Но если мы заменим тяжеловесные свёрточные сети массивами таких крошечных, точных нейронов, мы получим мгновенную реакцию
Беспилотник сможет вычислять траектории препятствий и корректировать полет с нулевой задержкой, потребляя при этом жалкие милливатты энергии

Природа не строит гигантские дата-центры для мозга осы, чтобы та могла на лету маневрировать между ветками
Она использует изящную эффективность
И именно на это — на возвращение к чистой, эффективной математике — делает ставку эта технология

И да, это не реклама, это наш,
русский разработчик!
👍1
ML в кризисе, но есть попытка выхода - открытая лаба Marin, где открыт не результат, а сам процесс мышления

Сейчас проходит одна из престижных конференций
#ICLR2026

Говорят о кризисе научной культуры в ML: индустрия производит артефакты (модели), но не знание

Есть 3 условия, при которых ML-исследования станут настоящей наукой: открытый процесс, масштабируемые алгоритмы и предсказуемость как критерий понимания

Marin - открытая лаборатория - попытка создать полностью открытую фронтирную AML-лабу, где открыт сам процесс науки

В Marin каждый эксперимент живёт как GitHub issue с гипотезой, каждый PR содержит воспроизводимый код, все результаты в WandB, все провалы задокументированы в реальном времени и любой может сделать PR и поучаствовать


При этом они уже обучили Marin-8B, который бьёт Llama 3.1 8B на 14 из 19 бенчмарков

И 32B модель, которая конкурирует с Gemma и Qwen
Cегодня исполняется 120 лет со дня рождения Гёделя

пусть здесь будет текст В.А.Успенского «Теорема Гёделя о неполноте и четыре дороги, ведущие к ней» (по рассказам ВАУ на ЛШСМ)

mathnet.ru/rus/mp309