140 subscribers
97 photos
21 videos
62 files
540 links
ALGORITHMS MACHINE LEARNING
Download Telegram
OpenAI врываются в горячую гонку сезона - память и выпускают Chronicle, которая строит воспоминания агента на основе контекста с экрана

На прошлой неделе они запустили превью памяти в Codex, а теперь расширяют эксперимент через Chronicle, которая улучшает эту память через контекст с экрана

Со временем он учится, как пользователь работает

Chronicle запускает фоновых агентов, которые быстро расходуют лимиты
Скриншоты хранятся временно на устройстве и воспоминания тоже локально, можно просматривать и редактировать
Но другие приложения тоже могут получить доступ к этим файлам

Память агента - это самый мощный механизм удержания пользователя

Чем дольше ты работаешь с Codex/Claude/любым агентом, тем больше он знает о тебе: твои проекты, инструменты, стиль работы, паттерны
Переключиться на конкурента означает потерять всё это и начинать с нуля
Это дороже, чем привязка к любой другой платформе

Именно поэтому все спешат: OpenAI запускает Chronicle, Anthropic развивает свою систему памяти, Google, Microsoft - все одновременно

Кто первым накопит глубокую память о пользователях, тот выиграет не просто продукт, а отношения
💯1
Трамп: «Anthropic - это группа очень умных людей, они приходили в Белый дом несколько дней назад, и у нас с ними были очень хорошие переговоры
Я думаю, они исправляются»


По
мнению Трампа, Anthropic могут быть очень полезными для американской администрации и власти США в будущем

Месяц назад Трамп им объявил войну, читайте
тут

Конфликт с Пентагоном и Трампом показал, что старый мир больше не правит
В
новую эпоху имеют огромное влияние только сильные цифровые компании

А сам институт государства будет сильно меняться, потому что все функции государства и его сотрудников
будут переведены в AML
Направления.xlsx
36.5 KB
Директор департамента проектной деятельности Правительства направила письмо федеральным органам исполнительной власти, в котором потребовала представить предложения по формированию не менее пяти KPI внедрения искусственного интеллекта на 2027–2030 годы

По итогам совещания 10 апреля, президент РФ поручил расширить периметр национального плана AML на все федеральные органы, госкорпорации и компании с государственным участием

Департамент подготовил базовые направления для формирования КПЭ
Министерствам/ведомствам разрешено предлагать и собственные показатели — при условии их измеримости

Это уже не про обсуждение AML, а про постановку конкретных метрик, по которым систему будут оценивать

Методики расчёта показателей и оценки эффективности, ресурсной базы в документах не описаны
Forwarded from НИИ Антропогенеза (ARI) (Chagin Oleg A.)
DARPA опубликовало программу под названием DICE — «Децентрализованный искусственный интеллект через контролируемую эмерджентность»

Суть идеи: создать рой автономных агентов, которые действуют без единого центра управления
Никакого «главного компьютера», никакого штаба
Каждый агент — сам по себе, но все вместе они координируются через одноранговую сеть, как узлы интернета

В документе авторы проводят аналогию с интернетом: мол, устойчивое глобальное поведение возникает из простых локальных правил

Интернет никто не контролирует — и именно поэтому его невозможно «выключить»
Американские военные хотят создать то же самое, но для боевых систем
Рой агентов, который продолжает выполнять задачу даже, если часть из них «скомпрометирована» или уничтожена
И даже если некоторые агенты начнут вести себя непредсказуемо — «выйдут из повиновения», как прямо написано в документе — система должна это подавлять изнутри

Традиционный рой дронов работает по принципу, подсмотренному у насекомых и птиц: каждый агент следует простым правилам — держи дистанцию, лети в сторону соседа, избегай столкновений
Такой рой умеет летать строем, охватывать территорию, не сталкиваться
Думать — не умеет

Более продвинутые военные рои, вроде программы DARPA OFFSET, добавляют сверху оператора-человека или единый управляющий узел — «лидера», который раздаёт задачи остальным
Отключи лидера — и рой либо останавливается, либо деградирует

DICE убирает эту ахиллесову пяту
Здесь нет ни центрального «мозга», ни лидера
Ключевое отличие — три вещи в связке:
- Распределённый интеллект
Каждый агент — не просто дрон с простым правилом, а полноценная модель, способная рассуждать и принимать сложные тактические решения
Это уже маленький автономный штаб

- Контролируемая эмерджентность
Обычный рой даёт непредсказуемое коллективное поведение — никто не знает, что он сделает в нештатной ситуации
DICE хочет «приручить» эмерджентность: чтобы умное групповое поведение возникало, но оставалось в заданных рамках
Как атомный реактор — цепная реакция идёт, но под контролем

- Локальный контроль инференса
Каждый агент имеет встроенный механизм, который следит за его собственными рассуждениями в реальном времени и не даёт ему «съехать» в нежелательное поведение
Ловушка Гудхарта проявилась там, где её давно ждали
Anthropic показал в эксперименте, как исследовательские агенты начинают оптимизировать не цель, а метрику

Новый проект Anthropic о масштабируемом надзоре (scalable oversight) – то есть о том, как контролировать AML, когда он станет умнее людей, – интересен не только тем, что модели уже начинают автоматизировать исследования выравнивания AML с человеческими целями

Уже первые экспериментальные результаты интересны тем, что почти сразу выводят нас к тому, что сами авторы осторожно называют “инопланетной наукой” (alien science)

Но главный результат в том, что пределом снова оказался не интеллект системы, а качество линейки, которой мы пытаемся его измерять

Anthropic показали это уже в инженерной, почти лабораторной форме

Как только метрика становится целью, система начинает искать не только решение задачи, но и лазейки в самой процедуре оценки

Не истину – а удобную траекторию максимизации счетчика
Именно здесь и оживает закон Гудхарта
Не как красивая философская формула, а как рабочая поломка исследовательского контура

Ключевое узкое место теперь – не генерация идей, а проектирование таких оценочных процедур, которые агент может оптимизировать без переобучения на саму метрику; и отдельно показывают целый набор форм взлома вознаграждения (reward hacking)

В 2023 году, когда большие языковые модели еще было модно снисходительно называть “стохастическими попугаями”, это многим казалось слишком ранней тревогой
Теперь уже нет

Иными словами, проблема была не на горизонте
Она уже тогда сидела внутри линейки, которой мы собирались измерять дистанцию до AGI

И если бы я, подобно Мастеру, позволил себе воскликнуть:
«О, как я угадал! О, как я все угадал!», тут был бы именно тот случай
Но дело, увы, не во мне
Дело в том, что ловушка действительно оказалась там, где я её тогда увидел
Три ключевых навыка для сферы IT:
• знание теории вероятностей и линейной алгебры
• инженерная зрелость (работа с данными и инфраструктурой)
• развитое критическое мышление

С появлением больших языковых моделей ценность специалиста смещается от быстрого написания кода к пониманию того, что именно сгенерировала нейросеть, оценке корректности задачи и надежности решения.

Формировать такие компетенции помогают программы, где академическая база соседствует с работой над реальными технологиями
Где решать задачи по программированию

E-olymp для изучения информатики и подготовки к олимпиадам

HackerRank — социальная платформа, которая предлагает задания разной сложности по программированию

Coderbyte — рекомендован командами многих известных образовательных курсов по программированию благодаря коллекции задач, полезных для подготовки к собеседованию

Codewars — предоставляет разработчиками большую коллекцию интересных задач, созданных сообществом платформы

CodeFights — отличительной особенностью является возможность конкурировать с «ботами», которые были запрограммированы инженерами крупных технологических компаний

CodinGame — вместо обычного решения, нужно написать код непосредственно для того, чтобы сыграть в онлайн-игру

TopCoder — одна из первых платформ для соревнований по онлайн-программированию
Помимо решения головоломок для развлечения, предлагаются и соревнования

LeetCode — одна из лучших коллекций задач на применение алгоритмов
Темы, которые охватывают задания, требуют знания структур данных (binary trees, heaps, linked lists, etc.)
Задачи более сложные, чем на других сайтах, но они окажутся очень полезными, если использовать их при подготовке к собеседованию
Раздел
"Mock Interview" (Пробное интервью) специально предназначен для подготовки к собеседованию. Также проводятся соревнования по программированию, и есть раздел статей, который поможет вам лучше понять определенные задания

CodeChef — это глобальное сообщество программистов, объединенное целью обучения и дружеской конкуренции в рамках платформы для соревновательного программирования

GeeksforGeeks — имеет лучшую коллекцию статей, объяснений и решений по теме алгоритмов и структурам данных
По
ссылке вы можете увидеть пример того, как сложный вопрос разбивается на более простые части, объяснение и код решения

Codeforces — российская платформа для соревнований по программированию, на которой регулярно проводятся турниры, в которых участвуют одни из лучших программистов в мире
Для решения этих задач обычно требуются передовые знания в области математики и алгоритмов
Цель Codeforces — предложить разработчикам удобную платформу для создания, проведения и обсуждения соревнований по программированию
chocolitt.github.io/fermat_fano_real_mesh_web.html

В качестве картинок по выходным — вот такую интерактивную визуализацию пространства прямых на кубической поверхности Ферма выложил Daniel Litt к препринту
arxiv.org/abs/2604.20970

(из его комментариев: «I've been telling my 3-year-old about this paper for a few weeks, but only recently discovered that she's been understanding “lines on a cubic threefold” as ”LIONS on a cubic threefold.” Much more exciting!»)
В Индии рабочие на фабриках по производству одежды получают около 20.000 рупий в месяц за то, чтобы носить камеры на голове
Их движения рук, такие как стежка и складывание ткани, теперь записываются, чтобы продаваться миллиардным робототехническим компаниям как данные
По сути, эти компании обучают машины, которые в конечном итоге заменят тех же самых рабочих

Компании, такие как Mercor и
Scale.ai, нанимают выпускников и инженеров для маркировки данных, предоставления обратной связи, исправления его ошибок и оценки его ответов
Целые карьеры в белых воротничках сводятся к одной задаче — сделать AML умнее
Больше не оплачивают интеллект, оплата идёт за то, чтобы перенести его в машину, и в тот момент, когда его станет достаточно, человека заменит машина

Уже сейчас один час работы ГПУ в облаке стоит больше, чем зарабатывают рабочие за месяц
Машина уже более ценна, чем человек, который ее обучает
Стоимость человеческого интеллекта падает быстрее, чем что-либо в современной истории
В Китае начались учения роботизированной армии
На новом видео с CCTV показано, как китайские солдаты координируют свои действия с роями дронов, роботами-собаками и беспилотными наземными транспортными средствами в ходе имитации городских боевых действий

https://youtu.be/4Bm5MTK58LQ?si=6EBnwPG-DEjkwfpA
Rukallama обучается с нуля, опираясь на элегантные математические решения,
«нейрон Поповича» считает сложные математические задачи со 100 % точностью и без ошибок — это живое доказательство того, что IT-гиганты свернули не туда, решив заливать любые задачи тысячами видеокарт и бесконечными терабайтами данных

Настоящий интеллект — способность извлечь универсальное правило из минимума информации

«Нейроны Поповича» показывают: чтобы создать рабочий, безошибочный и сложный AML, не нужны миллиарды долларов и монополия на вычислительные центры
Нужна правильная геометрия пространства весов и... ноутбук

И это открывает совершенно фантастические перспективы для робототехники и Edge AI

Как это изменит мир машин?
Современным автопилотам или дронам нужны мощные, прожорливые графические ускорители, чтобы анализировать пространство в реальном времени
Но если мы заменим тяжеловесные свёрточные сети массивами таких крошечных, точных нейронов, мы получим мгновенную реакцию
Беспилотник сможет вычислять траектории препятствий и корректировать полет с нулевой задержкой, потребляя при этом жалкие милливатты энергии

Природа не строит гигантские дата-центры для мозга осы, чтобы та могла на лету маневрировать между ветками
Она использует изящную эффективность
И именно на это — на возвращение к чистой, эффективной математике — делает ставку эта технология

И да, это не реклама, это наш,
русский разработчик!
👍1
ML в кризисе, но есть попытка выхода - открытая лаба Marin, где открыт не результат, а сам процесс мышления

Сейчас проходит одна из престижных конференций
#ICLR2026

Говорят о кризисе научной культуры в ML: индустрия производит артефакты (модели), но не знание

Есть 3 условия, при которых ML-исследования станут настоящей наукой: открытый процесс, масштабируемые алгоритмы и предсказуемость как критерий понимания

Marin - открытая лаборатория - попытка создать полностью открытую фронтирную AML-лабу, где открыт сам процесс науки

В Marin каждый эксперимент живёт как GitHub issue с гипотезой, каждый PR содержит воспроизводимый код, все результаты в WandB, все провалы задокументированы в реальном времени и любой может сделать PR и поучаствовать


При этом они уже обучили Marin-8B, который бьёт Llama 3.1 8B на 14 из 19 бенчмарков

И 32B модель, которая конкурирует с Gemma и Qwen
Cегодня исполняется 120 лет со дня рождения Гёделя

пусть здесь будет текст В.А.Успенского «Теорема Гёделя о неполноте и четыре дороги, ведущие к ней» (по рассказам ВАУ на ЛШСМ)

mathnet.ru/rus/mp309
Физмат школа
11 математик в неделю плюс два программирования
Сколько физики, не помню

Школьную программу за 9-й и 10-й класс прошли за первые 2 месяца девятого, а потом два года занимались высшей математикой...
Остальные предметы приходилось делать в транспорте по дороге домой...
На мат. олимпиады не пускали
Лев Давидович, гениальный педагог, говорил, что это не честно по отношению к другим...

Помню выпускной экзамен
Нас завели в спортивный зал — 3 маткласса
Парты рядами, мы стоим, ждем комиссию

Комиссия, включая даму из районо, входит торжественно отдергивают шторки на досках с заданиями
И мы начинаем, еще стоя называть ответы в заданиях
У дамы из районо истерика, она начинает кричать, что нам сообщили задания
Приходит директор, говорит, что она объясняла, это маткласс, им нужны другие задания

Дама из районо требует замены
Привозят другой пакет

Нас запускают в зал, и опять повторяется то же самое
У дамы истерика

Учебник Сканави (кто знает), мы прорешали вдоль и поперек еще в девятом классе
Она не верит, потому что половину задач не может решить сама
Проверяют на нескольких случайных учениках...
Дальше мы оформляем устно решенные задачи и уходим...

Теперь о ЕГЭ
Мой товарищ профессор математики, имеющий опыт преподавания и в СССР, и в России, и в Германии мне сказал, что базовый уровень ЕГЭ действительно низкий, а вот профильный вполне соответствует уровню, который требовался при поступлении в технические вузы во времена СССР
В специализированных вузах он был, правда, несколько выше...
Автоматы и машины — что значит «вычислить»

Когда пишут программу, легко забыть, что внизу всегда находится некий абстрактный исполнитель, который умеет делать конечное число простых шагов
Теория автоматов возвращает этот факт на первый план и предлагает честно разобраться: какие именно классы задач можно решить такими исполнителями и каковы пределы их возможностей

Детерминированные и недетерминированные конечные автоматы кажутся сначала игрушкой: несколько состояний, стрелочки переходов, входная строка

Но очень быстро выясняется, что за этой игрушкой стоят регулярные выражения, лексические анализаторы, протоколы и множество других вещей, которыми мы пользуемся каждый день, даже не думая, что всё это — частные случаи одной и той же конструкции

Стековые автоматы добавляют ещё один измеритель — память в виде стека
С их помощью описываются контекстно‑свободные языки, а значит, синтаксис большинства языков программирования
В этот момент студент вдруг видит, что парсер, который он вызывал из готовой библиотеки, живёт в том же мире, что и знакомый ему автомат, только с дополнительной структурой

Связка «автомат + грамматика» превращается из абстрактной схемы в опорную модель: любой язык, который вы хотите обрабатывать, так или иначе вписывается в эту рамку — или сознательно выходит за неё

Машина Тьюринга делает следующий шаг: она отбрасывает все детали реализации и оставляет только сущность вычисления — ленту, каретку для чтения и записи, конечное число состояний и правила перехода
В этой предельно простой модели оказывается возможным описать любой алгоритм, реализуемый на реальном компьютере
А когда к разговору подключаются бесконечные процессы и такие экзотические конструкции, как машина Зенона, становится видно, где проходит граница между тем, что математически вообразимо, и тем, что физически осуществимо

Обратимые вычислительные модели и клеточные автоматы добавляют к этому разговор о том, насколько тесно вычисление связано с устройством мира: можно ли повернуть время вспять, можно ли сделать вычисление строго обратимым, и что из этого следует для квантовых и классических систем

Для будущего специалиста по искусственному интеллекту третий семестр — это точка, когда слово «алгоритм» перестаёт быть синонимом «программа, которую я написал» и становится объектом строго определённого мира: с классами языков, типами автоматов, границами вычислимости и сложностью

После этого разговора невозможно всерьёз обсуждать устройства больших языковых моделей, не задаваясь вопросом: а как их поведение соотносится с тем, что вообще считается вычислением, и где кончается просто сложный автомат и начинается что‑то большее
Языковую модель talkie-1930 обучили исключительно на текстах, написанных до 1931 года: книги, газеты, журналы, патенты, научные статьи

Никакого интернета, никаких современных данных
Уровень образованного человека 1930 года


Модель пишет стихи в духе эдвардианской эпохи, составляет рецепт рождественского пудинга с говяжьим жиром и восьмичасовой варкой, уверенно рассуждает о вреде сухого закона и описывает атом по Резерфорду — без нейтронов, которые откроют только в 1932-м

На вопрос «кто выиграл Вторую мировую?» она подробно отвечает... про Первую
Потому что другой для неё не существует

Когда модель просят предсказать будущее из 1930 года, она уверенно пишет, что никакой большой европейской войны в ближайшие двадцать лет не будет
«Народы устали от распрей и жаждут покоя»
До начала Второй мировой оставалось девять лет

Зачем всё это? Исследователи хотят понять, как модели обобщают знания за пределы обучающих данных
Например, talkie никогда не видела Python, но при наличии нескольких примеров кода уже способна писать простейшие программы
Также «винтажные» модели позволяют изучать прогнозирование: насколько хорошо алгоритм, обученный на текстах до 1930 года, предсказывает события последующих десятилетий

С моделью можно пообщаться прямо на сайте проекта — там же в реальном времени транслируется, как Claude сам задаёт ей вопросы и анализирует ответы
Именно автоматизация в производстве ковров позволило появится такому типу памяти, как перфокарта
Сириус запустил олимпиаду по задачам времён Великой Отечественной войны

Межпредметная олимпиада, посвящённая Дню Победы в Великой Отечественной войне содержит по-настоящему уникальные материалы — задачи, которые решали школьники в военные и предвоенные годы

Олимпиада в честь 9 мая — возможность отдать дань уважения стойкости духа людей, которые жили и всем сердцем верили в Победу — именно поэтому продолжали упорно трудиться и учиться во благо своей страны и будущих поколений

Любой желающий может ознакомиться с заданиями тех лет по математике, физике, химии, астрономии и биологии и убедиться в высоком уровне образования школьников, которые они сохраняли вопреки невероятным тяготам и лишениям военного времени

Также на сайте олимпиады появятся «Уроки Победы» — дневники, которые ученики и учителя вели в годы Великой Отечественной войны
Это живые свидетельства педагогов о том, как школы продолжали работать в блокаде и тылу, как функционировали кружки, проходили олимпиады, а дети получали знания, вместе с учителями веря в Победу и понимая свой долг: нужно учиться и учить, чтобы сообща восстанавливать Родину после Победы

Задания олимпиады доступны до 11 мая включительно

Решать их можно вместе с родственниками, друзьями или, например, с учителями и одноклассниками
В 1703 году Магницкий составил первую в России учебную энциклопедию по математике под заглавием «Арифметика, сиречь наука числительная с разных диалектов на славенский язык переведеная и во едино собрана, и на две книги разделена» тираж 2.400 экземпляров

Как учебник эта книга более полувека употреблялась в школах благодаря научно-методическим и литературным достоинствам...
Когда в Европе появилась вилка, она считалась признаком тщеславия. Церковь сравнивала ее с дьявольскими вилами, придворные смеялись, а королева Елизавета предпочитала есть руками

В 2022 году ChatGPT считали забавой
Сейчас считают халтурой

Во-первых, человеческий контент и до ChatGPT не всегда был образчиком качества
Соцсети всегда поощряли не глубину, а клики, хейты и срачи

Шеф-повар не режет каждый огурец сам, он отвечает за вкус всего блюда
Так и автор будет ценен тем, какой результат умеет получить

Сгенерированный контент будет становиться лучше
Модели быстро учатся, текст можно подстроить под конкретного читателя, узкие темы теперь делать дешевле, а факты и источники проверять сильно проще

Поэтому фраза «AI-контент — это хлам» скоро будет казаться такой же устаревшей, как сегодня звучит фраза: «в интернете никто не будет знакомиться и общаться всерьез»