Cерафимодальность
546 subscribers
72 photos
36 videos
62 links
Head of product research at Yandex Search & AI. dm: @bdndjcmf
Download Telegram
Это же буквально Ralph Wiggum луп
Forwarded from Авва
Дональд Кнут, знаменитый американский ученый-алгоритмист, написал несколько дней назад заметку о том, как LLM помогла ему, точнее его соавтору, решить алгоритмическую задачу, над которой Кнут работал несколько недель. Заметка начинается словами "Shock! shock!"

Задача, которую решил Клод, не какая-то знаменитая, и у нее нет, насколько мне известно, важных применений. Мне кажется, интересно даже не столько то, что ИИ ее решил, сколько *как* решил. Это подробнее описано в статье Кнута, но если вкратце - перед Клодом поставили задачу и он работал над ней примерно в 30 подходов-итераций. После каждой итерации он записывал в файл для самого себя краткое описание того, что он только что попробовал и что из этого вышло, и это помогало ему искать новые подходы и не зацикливаться. В процессе решения он испробовал много разных идей, как математических, так и программистских, и в конце концов нашел одну работающую, проверив ее на куче вариантов (хоть и не доказал ее строго, доказательство написал позже сам Кнут). Весь процесс занял около часа, и был почти автоматическим - человеку пришлось несколько раз останавливать или подправлять итерации, в которой Клод путался в своих следах и терял контекст.

Мне кажется, что работа ИИ в этом случае вполне сравнима с тем, как мог над такой задачей работать талантливый студент-аспирант, которому дал ее научный руководитель. Конечное решение не супер сложное и до него вполне можно дойти с помощью упорства и дисциплины (важно проверять свои идеи путем написания тест-программ, не заходя слишком далеко в теорию). Те же 30 итераций аспирант мог сделать за неделю-две; только ИИ сделал за час и без аспиранта.

Это возможно здесь и сейчас, в 2026 году. Обратите внимание, вглядитесь хорошенько. Будущее продолжает наступать на настоящее ударными темпами. Полгода или год назад модели еще не могли настолько самостоятельно работать над математическими задачами на таком уровне.

Теперь попытаюсь вкратце объяснить и показать суть проблемы, которую решил Клод для Кнута.👇
6
Физический AI и Атомы

Тревис Каланик, создатель Убера, опубликовал манифест своей новой компании «Атомы» — дистопичный текст о достижении физического AI. Текст написан дьявольски хорошо, советую прочитать целиком хотя бы как короткий сайфай рассказ.

Всё, что нас окружает, произведено из ресурсов, собрано и доставлено. Ультимативная цель — автоматизировать этот процесс, подойти к физическому миру как к компьютеру: CPU — производство, Память — Хранилища, Сеть —транспорт. Оцифровку физического мира Каланик начинает с трёх фундаментальных производств: еда, добыча ресурсов, транспорт. Всё это — первые, но необходимые шаги на пути к грядущему золотому веку (который обеспечат нам самосовершенствующиеся машины) и, неизбежно, сингулярности.

Where do the materials and minerals come from? Where do we manufacture? Where do we harvest and store energy? Land as a critical resource and the competency of real estate development of that land are dramatically underappreciated ingredients for Physical world AI. 

Producing more minerals that power the chemistry for state change and the materials for machines to manufacture will be an urgent imperative. Acquiring and developing the land that produces these minerals and materials is a critical competency.


В этом канале любят роботику и физический AI. Стратегически Каланик прав, но быть даже не винтиком, а просто резистором, распаянным на шине Земли, почему-то не хочется.

Последний месяц я много питчил другой путь — основанный на идее, что физический AI позволит передать обычным людям производство, так же, как нынешняя волна AI демократизировала написание кода.
У скрипта на питоне и табуретки есть общее свойство: если они не соберутся, модель, которая их сгенерила, можно щёлкнуть по носу и дообучить (проверить табурет на собираемость можно не выходя из блендера). Вместо того, чтобы ждать, пока Тревис Каланик и Илон Маск построят свои робофабрики, люди могут вайбкрафтить себе вещи за 0,3% стоимости из стандартных материалов. Причем в отличие от бесплодного вайбкодинга, такая система бустит реальную экономику, потому что компоненты для табуретки всё ещё нужно заказать и доставить, а подтверждённый настоящим человеком чертёж можно перепродать дальше. Но это длинный разговор для другого раза.

(Если вы инвестор, пишите).
12👍1
Media is too big
VIEW IN TELEGRAM
Очередной бешеный апдейт Клода: управление курсором и клавиатурой на удалённом компе.
7👏2
Ещё Luma показала свою первую объединённую image-model. Ну, не нанобананой единой, возможно именно там лежит AGI (я по-прежнему больше люблю текстовые модели).

https://lumalabs.ai/uni-1/
5
Современный AI ужасно текстоцентричный. У этого есть неожиданные последствия: когда нам пришлось работать с огромным количеством генерируемого на лету текста, выяснилось, что дизайнерские усилия последних лет значительно больше уделяли внимания изображениям. Текст плохо анимируется, сложно растягивается, в него безумно дорого вписывать объекты — вспомните бесконечные грустные мемы про вставку картинок в ворд.

При этом LLM подразумевает, что текста будет много, появляться он будет постепенно, длина его будет непредсказуема, и всё это должно работать не только в специализированных средах, но и простом браузере. А у тебя один новый токен, и всё, меняется перенос, страницу надо перерисовывать, длина и ширина покорежились, винтовка это праздник.

Глядя на всё это, Ченг Лу (один из авторов fb мессенджера и фронтенд в Миджорни) написал и опубликовал вчера ai-нейтив тайпскрипт движок для дешевой, надёжной и быстрой раскладки текста без DOM. В комментарии конечно пришли знающие люди, и объяснили, что всё это не ново, бессмысленно, и никому не нужно. (Например, неожиданно, Давид Френкель, который делает всякие крутые штуки для Медиазоны, написал ядовитый твит в духе вау, спустя 15 лет они нашли measureText)

А потом понеслись примеры, и, ну, я всё-таки думаю, что сделать такое количество прикольных экспериментов за сутки бы не вышло. Много ли в этом смысла? Нет, но на то они и шоукейсы. Думаю, нас ждет много интересных сайтов в ближайшие дни.
7
Антропики нечаянно слили исходный код КлодКода. Внутри куча нерелизнутых фич за флагами — KAIROS (always-on Claude), ULTRAPLAN (30-минутное удалённое планирование), система Buddy (Тамагочи-питомец) и так далее.

https://github.com/Kuberwastaken/claude-code
🤔2👍1
Серафимодальность