129 subscribers
94 photos
21 videos
57 files
488 links
ALGORITHMS MACHINE LEARNING
Download Telegram
LLM плохо обновляют убеждения по мере получения новой информации
Хотя от модели ожидается, что она должна понимать предпочтения пользователя по его ответам и при накоплении таких данных становится полезнее, на самом деле LLM в этом плохи

С математической точки зрения это означает, что у моделей нет байесовского мышления, то есть умения обновлять вероятность гипотез при поступлении новой информации
У людей, кстати, такое мышление должно быть хорошо развито

Здесь исследователи предлагают интересный подход
Вместо того, чтобы учить модель обновлять знания с помощью файнтюна на обычных диалогах, они берут и дистиллируют в нее настоящий байесовский алгоритм

То есть:
• строится обычный автомат Байеса, который знаком всем, кто изучал классический ML
Он решает задачу, просто обновляя вероятность разных гипотез по формуле
• LLM файнтюнят на ответах алгоритма, чтобы она переняла общую логику обновления, но уже без формулы

Во-первых, модель действительно начинает вести себя ближе к байесовскому оптимуму и учитывать новые данные

На основной задаче рекомендаций качество заметно увеличилось

Во-вторых, появилось обобщение
То есть модель фактически выучивает сам принцип рассуждения, и начинает использовать эту стратегию в других задачах, где ее напрямую не обучали

Короче говоря, довольно показательно, и авторы делают вывод о том, что обучение на демонстрациях алгоритмов в целом – работает

В действительности, мы ведь и правда хотим от LLM, чтобы они были не просто генераторами текста, а универсальными имитатороми алгоритмов мышления

research.google/blog/teaching-llms-to-reason-like-bayesians/
Пока мировые медиа обсуждают битву за полупроводники и гонку нейросетевых чипов, в науке тихо зреет куда более радикальная идея — а что, если вместо всё более сложных микросхем просто взять и использовать живые нейроны?

Австралийская компания
Cortical Labs уже сделала это: подключила лабораторно выращенные клетки к биокомпьютеру и заставила их пройти трёхмерный шутер DOOM
Причём речь не о клетках мыши или дрозофилы — нейроны были получены методом репрограммирования из клеток кожи и крови обычных взрослых людей
Этот крошечный сгусток человеческой ткани в чашке Петри превзошёл GPT-4 по скорости реакции
То, на что у кремниевого AML уходят мегаватты энергии, кусочек чьего-то бывшего эпидермиса делает мгновенно

Пентагон тоже решил этим заняться
DARPA объявило о будущей программе
O-CIRCUIT по созданию «биологических процессоров» для боевых дронов
Цель — создать принципиально новый класс боевых систем
Логика у американских стратегов проста: дрон-убийца на передовой требует мощного процессора, тот требует тяжёлых аккумуляторов, те убивают автономность
Замкнутый круг
Решение — выбросить кремний и вырастить вместо него живые нейронные сгустки из нервных, глиальных и иммунных клеток

В качестве эталона эффективности DARPA приводит мозг плодовой мушки: 140.000 нейронов, всего 6 милливатт-часов в сутки, маневрирует лучше любого квадрокоптера

Программа разбита на две задачи:

Первая — вырастить биопроцессор, который будет играть в «Ms. Pac-Man» на уровне человека и удерживать этот навык сутками
Pac-Man по своей математической сути — это навигация в замкнутом лабиринте, непрерывный поиск целей и уклонение от угроз. Переведите это на язык войны — и получите автономный живой контроллер для зачистки подземных тоннелей, траншейных сетей, городских кварталов

Вторая — скрестить живой мозг с биологическим обонятельным сенсором и встроить его в дрон
Цель — идти по химическому следу
Электронный нос уступает собачьему в чувствительности на порядки, никакой кремниевый газоанализатор не сравнится с живой обонятельной тканью. Но главное нечувствительность
Дрон, идущий на запах взрывчатки, пороховых газов или человеческого метаболизма — пота, выдыхаемого CO₂, адреналина — физически невозможно заглушить радиопомехами

Американцы десятилетиями продавали миру культ кремния — чипы, процессоры, цифровое превосходство
А потом пришли к тому, что природа придумала лучше

Только это открытие они сделали в военной лаборатории, а не в философской
2512.24873.pdf
11.7 MB
AML – цепочка из пяти уровней, от чипов и облаков до моделей и приложений
И все больше этих уровней концентрируется в руках одних и тех же глобальных компаний

Каждый из уровней требует значительных инвестиций и выигрывает от масштаба и вертикальной интеграции
В результате именно крупнейшие игроки получают системные преимущества

Среди 20 крупнейших мировых компаний в сфере AML семь базируются в США, и их совокупная капитализация более чем вдвое превышает капитализацию остальных 13 и представлены пятью юрисдикциями: США, Китай, Тайвань, Южная Корея и Нидерланды

Американские и китайские компании присутствуют сразу на нескольких или на всех уровнях цепочки, от вычислительных ресурсов до приложений

TSMC или ASML, сохраняют узкую специализацию на критически важных компонентах (например, чипах)

OpenAI и Anthropic – лидируют в разработке моделей, но опираются на партнерства для доступа к инфраструктуре
К концу 2025 г. на их долю приходилось до 40 % рыночной капитализации в США, на Тайване, в Южной Корее и Нидерландах и формируют существенную часть корпоративных инвестиций и выручки в этих юрисдикциях

Это означает влияние на инвестиционные циклы мировой экономики, формирование совокупного спроса, производительность

«Когда движутся гиганты, земля может двигаться вместе с ними»

Масштабы и вертикальная интеграция позволяют гигантам поглощать издержки и ускорять инновации
Однако высокая концентрация усложняет вход на рынок новых компаний и ограничивает конкуренцию

Вопрос ближайших лет – смогут ли регуляторы и национальные стратегии «суверенного AML» поддержать конкуренцию, не замедлив инновации

AML становится инфраструктурой
А инфраструктура всегда имеет системное значение
«Вообще, если не знать, что Риман был очень умный человек, а посмотреть только на интеграл Римана, то это кажется сомнительным

Вот Вы идете вдоль забора из реек одинаковой ширины, но разной длины, и хотите посчитать площадь забора
Что делает Риман?
Измеряет длину каждой рейки, умножает на ширину и складывает
Кто же так делает?

Надо пойти в прорабскую и узнать, сколько реек каждой длины пошло на забор
Это то, что делает Лебег»


воспоминания И.Д. Новикова
"Студенты, которые занимались удаленно с AML, усвоили материал в два раза лучше тех, кто работал в аудитории с преподавателем по методике активного обучения, <...> на физическом факультете Гарварда <...>"

- по статье Kestin, G., Miller, K., Klales, A. et al. AI tutoring outperforms in-class active learning: an RCT introducing a novel research-based design in an authentic educational setting. Sci Rep 15, 17458 (2025)
https://doi.org/10.1038/s41598-025-97652-6

<...> через несколько лет <...> AML заберет первое объяснение и тренировку базовых шагов, а очное время с преподавателем освободится для того, на что раньше катастрофически не хватало времени: разбора ошибок, живых дискуссий, синтеза идей, межпредметных проектов и задач без единственно правильного ответа <...>

Одни университеты просто купят готовый сервис и встроят его в расписание
Но, наверное, найдутся и другие, которые постараются сами стать «немножечко EdTech-ом»
То есть попробуют обучить «домашние» модели, оцифровать накопленную экспертизу <...>


https://t.me/aireformer/38 (Scientific Reports соображения представляются мне в целом здравыми, статья в Sci Rep, от которой они отталкиваются, вышла в июне прошлого года и на данный момент, как подсказывает AML-сервис Elict, нет полной ясности, насколько воспроизводимы её результаты)
Интернет переполнен анонимусами, но ольшие языковые модели (LLM) могут массово устанавливать личности владельцев

LLM анализирует посты пользователя, изучая неструктурированный текст: комментарии, шутки, упоминания об образовании и стиль письма
Затем он преобразует данные в математическое представление профиля (профайл) и ищет совпадения среди миллионов других профилей, включая LinkedIn

Исследователи
протестировали систему на почти 1.000 профилях LinkedIn и сопоставили их с аккаунтами на Hacker News и Reddit

«Практическая незаметность, которая долгое время защищала пользователей под никами... больше не работает, — резюмируют авторы исследования. — Пользователи, которые пишут под постоянными никами, должны исходить из того, что злоумышленники могут связать их аккаунты с реальными личностями или друг с другом, и что вероятность этого растет с каждым фрагментом публикуемых ими микроданных»


Результаты показывают, что такая система может быть полезна мстителям и всему, что имеет отношение к внутренним органам
OpenAI не контролирует, что Пентагон делает с их AML
AGI — Superhuman Adaptable Intelligence (SAI): система, которая умеет быстро адаптироваться к новым задачам, а не просто имитирует человека

Аргумент: человеческий интеллект эволюционно специализирован, а не универсален — мы просто не видим собственных слепых зон
Существующие определения AGI не выдерживают критики: одни нарушают теорему No Free Lunch, другие неизмеримы
Технически авторы ставят на модели мира и самообучение — и критикуют монополию GPT-архитектур: «Однородность убивает исследования»
Cовременные конфликты ведутся преимущественно в сфере мышления

Индустриальная модель массового поражения уступила место борьбе за восприятие и формирование «нарративного контекста»

Применение смертоносной силы сохраняет свою эффективность, но ее стратегический эффект зависит от того, укрепляет ли она доверие и способствует ли достижению последовательных политических целей

Зато в обществах, связанных цифровыми технологиями, население интерпретирует события в режиме реального времени и соответствующим образом формирует политические результаты

В центре разработки военных кампаний теперь находятся давние противостояния (противоречия) населения, влияющие на операции, стратегическую коммуникацию, психологические операции, киберпространственную пропаганду и экономическую политику

Фрагментация социальных сетей, дезинформация и искусственный интеллект усилили борьбу за доминирование в информационном пространстве

Тактический успех, подрывающий доверие или подпитывающий пропаганду противника, может подорвать более широкие цели
🤔1
Клод Opus 4.6 только что решил открытую задачу, над которой работал неделями — гипотезу о разложении графа из книги "Искусство компьютерного программирования"

Он назвал статью "Циклы Клода"
31 исследование. ~1 час
Кнут прочитал результат, написал формальное доказательство и в конце добавил: «Похоже, в ближайшее время мне придется пересмотреть свое отношение к генеративному искусственному интеллекту»

Так сказал человек, написавший библию информатики
В статье, названной в честь искусственного интеллекта

Статья:
https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf
Минцифры может закрепить право граждан на отказ от обслуживания с применением искусственного интеллекта

Если клиент не хочет взаимодействовать с нейросетями, организация обязана будет предоставить ему услугу без их использования

Документ в настоящее время проходит межведомственное согласование, его вступление в силу предварительно планируется на 1 сентября 2027 года
В начале марта 2026 года в открытой базе патентов США появился документ, который финансировался одновременно DARPA и IARPA
В нём описывается новый тип микрочипа для искусственного интеллекта
Когда оба ведомства вместе вкладываются в один чип — это не про батарею смартфона

Что они изобрели, если объяснять без формул?

Обычные чипы работают как открытый кран: через миллионы транзисторов непрерывно течёт ток, всё греется, тратится колоссальная энергия

Авторы патента сделали другое — они «заглушили трубу»
Внутри транзистора находится особый материал — оксид гафния, который умеет запоминать электрическое поле без питания, как намагниченный магнит
Чтобы такой чип «подумал», на него подают крошечный сигнал в одну десятую вольта и просто измеряют, сколько заряда он удерживает

Никакого тока — только физика конденсатора
Из сотен тысяч таких ячеек, собранных в матрицу, получается устройство, которое по законам электростатики само решает уравнения нейросетей внутри памяти

Заявленная цель технологии — «энергоэффективные вычисления для мобильных устройств»
Но в 10–100 раз меньше энергии означает не просто долгую батарею
Это значит — почти нулевое выделение тепла

Разведывательный беспилотник с таким чипом распознаёт цели тяжёлыми нейросетями в автономном режиме и при этом остаётся практически невидимым для тепловизоров противника

Разведывательный спутник анализирует снимки прямо на орбите, не передавая терабайты данных по перехватываемому каналу
Именно здесь появляется IARPA

Отдельная деталь, о которой патент молчит, но физика говорит сама: один импульс обратного напряжения — минус 3.5 вольта, менее 100 наносекунд — стирает всю нейросеть без следа
Если дрон сбивают над чужой территорией, он выжигает себе мозг быстрее, чем коснётся земли
Это называется «Zeroize» — протокол аппаратного самоубийства

Хороший оборонный патент раскрывает принцип, но прячет рецепт
Мы провели полный реверс-инжиниринг: из законов физики, известных констант материала и данных самого патента восстановили все критические параметры, которые авторы намеренно скрыли

Толщина ферроэлектрического слоя нигде не указана — мы вычислили: 10–12 нанометров
Отклонение на 2 нм в любую сторону — и устройство либо не переключается, либо пробивается насквозь
Концентрация легирующего кремния в оксиде гафния скрыта — рабочее окно 4.3 %
Шаг на процент в сторону — нужная кристаллическая фаза не образуется, и перед вами обычное стекло
Температура отжига не указана — а без неё материал остаётся аморфным
Скрыт алгоритм записи промежуточных состояний, без которого многоуровневое хранение данных превращается в лотерею

При этом у патента есть архитектурная ловушка: вся юридическая защита намертво привязана к конкретному типу считывающей схемы — операционному усилителю

Любой конкурент, который заменит его на цифровой преобразователь временного типа и поднимет напряжение считывания с 99 до 120 милливольт, легально обходит всю монополию — и получает при этом более быстрый и защищённый чип

— Подробный технический разбор с расчётами и таблицами — в прикреплённом
документе
AML в вузах становится частью повседневной академической практики

Преподаватели делегируют технологиям рутинные этапы исследований и подготовку занятий, высвобождая время для аналитической и методической работы

Исследование, проведенное Центром научной коммуникации ИТМО, Яндекс Образованием и Центром технологий для общества Yandex Cloud среди преподавателей и ученых из 16 университетов, показало, что:

• 66 % преподавателей и учёных постоянно используют AML в работе
• 58 % считает, что подготовка материалов к занятиям вместе с нейросетями стала проще и быстрее
• 84 % опрошенных отметили, что AML помог ускорить этапы исследований — от поиска литературы до обработки данных
• 54 % чаще всего используют AML для обработки профильных текстов и изображений
• 52 % генерируют задания, кейсы и тесты
• 45% готовят презентации и визуализируют информацию, треть автоматизируют административные задачи
• большинство респондентов осваивали AML самостоятельно
• 38 % проходили обучение

При этом университетское сообщество ожидает от вузов понятной интеграции AML в рабочие процессы
Как и в начале века, во времена массовой цифровизации, оказывается, что не новые технологии виноваты в отсутствии ROI, а сами компании, которые почему-то думают, что внедрение технологии само по себе, без трансформации бизнес-процессов и корпоративной культуры, в состоянии что-то ощутимо улучшить

Исследователи даже выделили семь важных препятствий, которые на “последней миле” внедрения убивают всю пользу

1. Любовь к отдельным пилотам, будто они что-то меняют
“pilot-rich but transformation-poor” внедрения — это просто трата денег

2. Разрыв в производительности
Повышение производительности сотрудников внутри отдельных изолированных процессов без структурныз перемен ни на что не может повлиять

3. Неподъемная ноша устаревших процессов
Новые технологии — отличный диагностический инструмент для выявления самых замшелых мест в процессах
Но изменить они сами эти процессы не могут

4. Проблема идентичности и неформального знания
Роль “знающего человека” начинает вредить: это внутреннее знание должно преобразоваться в знание, доступное AML и воплощенное в нем
Понятно, почему “знающие люди” саботируют процесс внедрения

5. Управление мультиагентныи системами куда больше похоже на HR-задачу, чем на задачу инженерную, у этой задачи вообще нет инженерного решения
Leaders must now ask questions that resemble human resources more than IT, such as how to onboard, evaluate, secure, and eventually retire a digital worker

6. Архитектурная сложность
Пестрота агентов, зачастую от разных вендоров, приводит к необходимости организовать их эффективную совместную работу
При неправильной организации любое обновление или изменение одного из агентов заставляет переделывать весть процесс взаимодействия

7. Ловушка эффективности
Попытка рассматривать внедрение AML как средства снижения костов ожидаемо встречает сопротивление менеджеров среднего звена. Эффективный AML не просто ускоряет процессы, он меняет всю цепочку создания ценности
Завершается статья списком организационных мероприятий, вполне внешне очевидных, но почему-то не проводимых руководством, мечтающим о волшебной таблетке
AML — не она

https://hbr.org/2026/03/the-last-mile-problem-slowing-ai-transformation
Доступность суперчипов для ИИ (NVIDIA B200, H100, A100) упала до критических уровней (<5 %)
Попросту говоря:
• купить их по новым контрактам практически невозможно
• а по старым, всё скуплено китами (CAPEX 2026: Amazon и Alphabet – по $200B, Microsoft – по $120B и т.д.)
Цитата –
«есть железо, участвуй в гонке; нет железа – кури в сторонке», – предполагаю: мелкоте без $100B здесь не место, а в 2027 суперчипы станут еще дефицитней

Good News:
• Критический дефицит влечет за собой запредельные цены
• Запредельные цены на суперчипы влекут запредельную стоимость вычислений
• Запредельная стоимость вычислений означает, что за исключением областей, где AML уже (!) сильно превосходит по производительности людей, дешевле оставить работу за человеком

N.B. Сказанное выше относится к 2026-2027 годам
Стэнфорд и Принстон выпустили LabOS, где AML работает рядом с учёным в физической лаборатории

Исследователь надевает AR-очки которые видят то, что видит он
Каждые 5–10 секунд система анализирует происходящее и выдаёт обратную связь:

1. Следующий шаг протокола, предупреждение об ошибке, коррекция техники

2. Нарушил стерильность, получил сигнал немедленно

3. Перепутал время инкубации, система это заметит раньше тебя

Архитектура состоит из трёх слоёв:

LabOS — физический слой: AR/XR-очки, специально обученная VLM, роботы-коботы для рутинных операций

OpenClaw — среда, которая загружает навыки и управляет выполнением задач

LabClaw — библиотека из 206 готовых навыков для биомедицинских агентов

Параллельно развивается MedOS - та же логика, но для клиники и хирургии

• XR, коботы, автономное медицинское восприятие. Партнёры экосистемы - NVIDIA и Nebius

• LabClaw работает как постоянно включённый агент