Дорожная карта развития железа для ИИ на ближайшие 10 лет. Хотим ускорения в 1000 раз: 10x от инноваций в алгоритмах, 20x от архитектурных улучшений и утилизации кремния, и 5x от оркестрации на уровне системы.
AI+HW 2035: Shaping the Next Decade
Deming Chen, Jason Cong, Azalia Mirhoseini, Christos Kozyrakis, Subhasish Mitra, Jinjun Xiong, Cliff Young, Anima Anandkumar, Michael Littman, Aron Kirschen, Sophia Shao, Serge Leef, Naresh Shanbhag, Dejan Milojicic, Michael Schulte, Gert Cauwenberghs, Jerry M. Chow, Tri Dao, Kailash Gopalakrishnan, Richard Ho, Hoshik Kim, Kunle Olukotun, David Z. Pan, Mark Ren, Dan Roth, Aarti Singh, Yizhou Sun, Yusu Wang, Yann LeCun, and Ruchir Puri
Статья: https://arxiv.org/abs/2603.05225
Ревью: https://arxiviq.substack.com/p/aihw-2035-shaping-the-next-decade
# TL;DR
ЧТО сделали: Масштабный консорциум лидеров индустрии и академии составил комплексную 10-летнюю дорожную карту для объединения разработки ИИ-алгоритмов и железа. Цель — улучшить эффективность обучения и инференса в 1000 раз.
ПОЧЕМУ это важно: Экспоненциальное масштабирование foundation-моделей столкнулось с жёсткими физическими, температурными и инфраструктурными ограничениями. Энергия на перемещение данных теперь превышает энергию на сами вычисления, создавая суровую "стену памяти". Решить эту проблему математически и практически необходимо, чтобы глобальная нехватка энергии в дата-центрах не остановила прогресс ИИ.
Для практиков: Для стратегов по железу, проектировщиков архитектур и ML-исследователей эта дорожная карта — срочная директива. Она описывает переход от изолированной разработки, сфокусированной на вычислениях, к парадигме кросс-уровневого совместного проектирования (co-design). Требуя внедрения 3D-интеграции вычислений в памяти (CIM), алгоритмической устойчивости к шуму смешанных сигналов и использования ИИ для автоматизации проектирования электроники (EDA), статья намечает путь к устойчивому агентному ИИ. Такой ИИ будет способен эффективно работать везде: от гигаваттных облаков до милливаттных физических edge-устройств.
Ковать железо тут: https://t.me/gonzo_ML_podcasts/3148
AI+HW 2035: Shaping the Next Decade
Deming Chen, Jason Cong, Azalia Mirhoseini, Christos Kozyrakis, Subhasish Mitra, Jinjun Xiong, Cliff Young, Anima Anandkumar, Michael Littman, Aron Kirschen, Sophia Shao, Serge Leef, Naresh Shanbhag, Dejan Milojicic, Michael Schulte, Gert Cauwenberghs, Jerry M. Chow, Tri Dao, Kailash Gopalakrishnan, Richard Ho, Hoshik Kim, Kunle Olukotun, David Z. Pan, Mark Ren, Dan Roth, Aarti Singh, Yizhou Sun, Yusu Wang, Yann LeCun, and Ruchir Puri
Статья: https://arxiv.org/abs/2603.05225
Ревью: https://arxiviq.substack.com/p/aihw-2035-shaping-the-next-decade
# TL;DR
ЧТО сделали: Масштабный консорциум лидеров индустрии и академии составил комплексную 10-летнюю дорожную карту для объединения разработки ИИ-алгоритмов и железа. Цель — улучшить эффективность обучения и инференса в 1000 раз.
ПОЧЕМУ это важно: Экспоненциальное масштабирование foundation-моделей столкнулось с жёсткими физическими, температурными и инфраструктурными ограничениями. Энергия на перемещение данных теперь превышает энергию на сами вычисления, создавая суровую "стену памяти". Решить эту проблему математически и практически необходимо, чтобы глобальная нехватка энергии в дата-центрах не остановила прогресс ИИ.
Для практиков: Для стратегов по железу, проектировщиков архитектур и ML-исследователей эта дорожная карта — срочная директива. Она описывает переход от изолированной разработки, сфокусированной на вычислениях, к парадигме кросс-уровневого совместного проектирования (co-design). Требуя внедрения 3D-интеграции вычислений в памяти (CIM), алгоритмической устойчивости к шуму смешанных сигналов и использования ИИ для автоматизации проектирования электроники (EDA), статья намечает путь к устойчивому агентному ИИ. Такой ИИ будет способен эффективно работать везде: от гигаваттных облаков до милливаттных физических edge-устройств.
Ковать железо тут: https://t.me/gonzo_ML_podcasts/3148
arXiv.org
AI+HW 2035: Shaping the Next Decade
Artificial intelligence (AI) and hardware (HW) are advancing at unprecedented rates, yet their trajectories have become inseparably intertwined. The global research community lacks a cohesive,...
❤7🥴5👍3🤓1
В продолжение темы про Thrust2 и ThrustSSC.
Bloodhound LSR/SSC (https://en.wikipedia.org/wiki/Bloodhound_LSR) -- машина с реактивным двигателем Rolls-Royce Eurojet EJ200, призвана преодолеть порог в 1000 миль в час (это будет 1,609 км/ч). Пока достигли только 628 миль в час (1,011 км/ч). Выглядит уже почти как спейс шаттл в миниатюре (но всё равно немаленькая).
К сожалению, проект преследуют финансовые трудности, так что если среди читателей есть миллиардеры или миллионеры, то рассмотрите вариант помощи этому проекту! Зыкий же!
Сайт проекта: https://www.bloodhoundlsr.com/
В чате Шамиль Чанкаев привёл ещё разные интересные факты про эти скоростные машины, копирую тут с его разрешения:
Bloodhound LSR/SSC (https://en.wikipedia.org/wiki/Bloodhound_LSR) -- машина с реактивным двигателем Rolls-Royce Eurojet EJ200, призвана преодолеть порог в 1000 миль в час (это будет 1,609 км/ч). Пока достигли только 628 миль в час (1,011 км/ч). Выглядит уже почти как спейс шаттл в миниатюре (но всё равно немаленькая).
К сожалению, проект преследуют финансовые трудности, так что если среди читателей есть миллиардеры или миллионеры, то рассмотрите вариант помощи этому проекту! Зыкий же!
Сайт проекта: https://www.bloodhoundlsr.com/
В чате Шамиль Чанкаев привёл ещё разные интересные факты про эти скоростные машины, копирую тут с его разрешения:
Кстати, пару фанфактов:
1. SSC в имени Thrust и Bloodhound означал Super Sonic Car. LSR же означает Land Speed Record.
2. Практически все заезды на максимальную скорость делаются в пустынях, на дне высохших озёр - это самое ровное и большое место, которое можно найти на суше.
3. При этом сильно влияет выбор пустыни - на разной высоте разная плотность воздуха => разное сопротивление, испытываемое болидом. Thrust и его предшественники тестировались в Неваде. Bloodhound хотели поставить рекорд где-то в ЮАР. Я помню, как в 2019-21 компания нанимала рабочих из ближайших деревень, чтобы они подготавливали трассу - убирали камни, размечали путь и т.д.
4. Из предыдущих пунктов - если присмотреться на фотографии колёс, можно заметить, что там у них нет резины - просто металлическая болванка. К концу заезда она стирается почти в 0.
5. Ну и насчёт двигателя - в 2019 году Ягуар выпускали топовый двигатель на 585 л.с. Так вот - для LSR этот двигатель выполнял роль компрессора - закачивал топливо в основной реактивный двигатель. А полная мощность превышала 100 000 л.с.
Вообще, это только одна категория рекордов - абсолютный рекорд на суше. Есть и другие категории - самый быстрый наземный транспорт с приводом на колёса, самый быстрый мотоцикл и т.д. Они не так расхайплены, но там тоже есть много чего интересного. Например, самый быстрый мотоцикл, поставивший рекорд в 2010 году, недавно продавался за ~200K$.
Telegram
gonzo-обзоры ML статей
Что мы всё про агентов, да про ИИ. Вот вам для разнообразия пара чудес инженерной мысли из музея транспорта в Ковентри. Рекордсмены среди самых быстрых машин, которые ещё ездят по земле.
Thrust2 (https://en.wikipedia.org/wiki/Thrust2) -- реактивная машина…
Thrust2 (https://en.wikipedia.org/wiki/Thrust2) -- реактивная машина…
😁5❤3🔥3
ИИ-исследователи всё более полного цикла.
ASI-Evolve: AI Accelerates AI
Weixian Xu, Tiantian Mi, Yixiu Liu, Yang Nan, Zhimeng Zhou, Lyumanshan Ye, Lin Zhang, Yu Qiao, Pengfei Liu
Paper: https://arxiv.org/abs/2603.29640
Code: https://github.com/GAIR-NLP/ASI-Evolve
Review: https://arxiviq.substack.com/p/asi-evolve-ai-accelerates-ai
# TL;DR
ЧТО сделали: Авторы представили ASI-EVOLVE — агентный фреймворк, созданный для автоматизации дорогих и длительных исследовательских циклов, которые двигают вперёд фундаментальный прогресс в ИИ. Система реализует непрерывную петлю «обучение–дизайн–эксперимент–анализ», усиленную когнитивной базой из априорных человеческих знаний и отдельным модулем-анализатором. Этот анализатор умеет дистиллировать многомерные логи обучения в понятные причинно-следственные инсайты.
ПОЧЕМУ это важно: Хотя предыдущие эволюционные агенты преуспевали в узких алгоритмических задачах или автоматической генерации статей, этот фреймворк демонстрирует унифицированный и полностью автономный поиск сразу в трёх главных столпах современного ИИ: архитектурах моделей, курировании датасетов предобучения и алгоритмах обучения с подкреплением (RL). Успешно перекладывая бремя оптимизации с плеч исследователей на агентный пайплайн, работа создаёт прецедент для рекурсивного самосовершенствования ИИ с замкнутым циклом.
Для практиков: Для опытных специалистов и руководителей, управляющих масштабными исследованиями, ASI-EVOLVE представляет собой структурный сдвиг в подходе к разработке ИИ. Вместо ручной настройки механизмов внимания или формул функции потерь (лосса) в RL, можно развернуть этот фреймворк для автоматического прочёсывания огромных пространств гипотез. Используя семантический поиск по прошлой литературе и программный анализ логов, система уже нашла 105 новых архитектур линейного внимания, превосходящих устоявшиеся бейзлайны, вывела стратегии курирования данных, которые подняли MMLU более чем на 18 пунктов, и сформулировала новые правила обновления для RL. Это прямо указывает на ближайшее будущее, где роль человека сведётся не к инженерному решению задач, а к заданию правильных ограничений для автономного поиска.
Исследовать тут: https://t.me/gonzo_ML_podcasts/3157
ASI-Evolve: AI Accelerates AI
Weixian Xu, Tiantian Mi, Yixiu Liu, Yang Nan, Zhimeng Zhou, Lyumanshan Ye, Lin Zhang, Yu Qiao, Pengfei Liu
Paper: https://arxiv.org/abs/2603.29640
Code: https://github.com/GAIR-NLP/ASI-Evolve
Review: https://arxiviq.substack.com/p/asi-evolve-ai-accelerates-ai
# TL;DR
ЧТО сделали: Авторы представили ASI-EVOLVE — агентный фреймворк, созданный для автоматизации дорогих и длительных исследовательских циклов, которые двигают вперёд фундаментальный прогресс в ИИ. Система реализует непрерывную петлю «обучение–дизайн–эксперимент–анализ», усиленную когнитивной базой из априорных человеческих знаний и отдельным модулем-анализатором. Этот анализатор умеет дистиллировать многомерные логи обучения в понятные причинно-следственные инсайты.
ПОЧЕМУ это важно: Хотя предыдущие эволюционные агенты преуспевали в узких алгоритмических задачах или автоматической генерации статей, этот фреймворк демонстрирует унифицированный и полностью автономный поиск сразу в трёх главных столпах современного ИИ: архитектурах моделей, курировании датасетов предобучения и алгоритмах обучения с подкреплением (RL). Успешно перекладывая бремя оптимизации с плеч исследователей на агентный пайплайн, работа создаёт прецедент для рекурсивного самосовершенствования ИИ с замкнутым циклом.
Для практиков: Для опытных специалистов и руководителей, управляющих масштабными исследованиями, ASI-EVOLVE представляет собой структурный сдвиг в подходе к разработке ИИ. Вместо ручной настройки механизмов внимания или формул функции потерь (лосса) в RL, можно развернуть этот фреймворк для автоматического прочёсывания огромных пространств гипотез. Используя семантический поиск по прошлой литературе и программный анализ логов, система уже нашла 105 новых архитектур линейного внимания, превосходящих устоявшиеся бейзлайны, вывела стратегии курирования данных, которые подняли MMLU более чем на 18 пунктов, и сформулировала новые правила обновления для RL. Это прямо указывает на ближайшее будущее, где роль человека сведётся не к инженерному решению задач, а к заданию правильных ограничений для автономного поиска.
Исследовать тут: https://t.me/gonzo_ML_podcasts/3157
arXiv.org
ASI-Evolve: AI Accelerates AI
Can AI accelerate the development of AI itself? While recent agentic systems have shown strong performance on well-scoped tasks with rapid feedback, it remains unclear whether they can tackle the...
🔥7🤔3👍2❤1
Структура свободного времени сильно изменилась за последние месяцы. Теперь есть миллион проектов, которые наконец можно не закапывать в списки на будущее, а делать агентами, и сейчас типовое время за компом выглядит так, что, например, в одном окне я проверяю и готовлю к публикации разбор очередной свежей статьи (сделанный агентами, конечно), в другом антигравити гоняет эксперименты на TPU, а ещё висят пара Клод кодов, куда я периодически захожу чтобы попушить другие проекты. На работе аналогично, пока идут звонки, Курсор или Клод код пишут код, что-то проверяют, готовят документацию или генерят репорты. Узкое место уже давно не код как таковой, а продуктовая проработка и другая осмысленная валидация. Во всём этом богатстве главный челлендж теперь -- находить достаточно непрерывного времени для глубокого обдумывания. Нормальное человеческое внимание -- очень редкий и дорогой ресурс.
2💯81❤14👍7👌2🔥1🤔1🤯1