Google говорят, что это иллюзия, когда агент смотрит на свой результат, исправляет ошибки и становится лучше
Свежая работа Google DeepMind ставит неудобный вопрос к одному из главных паттернов агентной архитектуры.
Исследователи сравнили 2 способа масштабировать качество ответов LRM: запускать модель несколько раз параллельно и выбирать лучшее или запускать последовательно, давая модели видеть свои прошлые ответы и улучшать их.
Последовательный подход проигрывает стабильно на всех моделях.
Qwen3, DeepSeek-R1, Gemini 2.5 - математика и код. Везде одно и то же.
Причина не в длине контекста и не в отсутствии агрегации, а в том, что модель, видя свой прошлый ответ, перестаёт искать альтернативы и начинает воспроизводить прежнее решение с косметическими правками.
Авторы называют это ленью.
Из этого следует практический вывод:
Цикл, где агент сделал > посмотрел на результат > исправил работает, только если среда не даёт ему соврать самому себе.
В экспериментах единственное, что помогло последовательному режиму догнать параллельный - ошибки на скрытых тестах, которые модель не могла проигнорировать.
Это смещает акценты в архитектуре агентных систем.
Качество агента определяется не столько его интеллектом, сколько честностью среды, в которой он работает. Слой верификации - не дополнение к агенту, а то, без чего он вообще не функционирует как улучшающаяся система.
Агент без внешнего заземления не рефлексирует, он просто становится увереннее в своей ошибке.
Свежая работа Google DeepMind ставит неудобный вопрос к одному из главных паттернов агентной архитектуры.
Исследователи сравнили 2 способа масштабировать качество ответов LRM: запускать модель несколько раз параллельно и выбирать лучшее или запускать последовательно, давая модели видеть свои прошлые ответы и улучшать их.
Последовательный подход проигрывает стабильно на всех моделях.
Qwen3, DeepSeek-R1, Gemini 2.5 - математика и код. Везде одно и то же.
Причина не в длине контекста и не в отсутствии агрегации, а в том, что модель, видя свой прошлый ответ, перестаёт искать альтернативы и начинает воспроизводить прежнее решение с косметическими правками.
Авторы называют это ленью.
Из этого следует практический вывод:
Цикл, где агент сделал > посмотрел на результат > исправил работает, только если среда не даёт ему соврать самому себе.
В экспериментах единственное, что помогло последовательному режиму догнать параллельный - ошибки на скрытых тестах, которые модель не могла проигнорировать.
Это смещает акценты в архитектуре агентных систем.
Качество агента определяется не столько его интеллектом, сколько честностью среды, в которой он работает. Слой верификации - не дополнение к агенту, а то, без чего он вообще не функционирует как улучшающаяся система.
Агент без внешнего заземления не рефлексирует, он просто становится увереннее в своей ошибке.
1👍16❤7🤔3💯2
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Ооо, халява опен-сорса закончилась!) Alibaba и Zhipu решили не открывать исходный код некоторых своих топовых ИИ-моделей За последние дни Alibaba выпустила Qwen3.5-Omni и Qwen3.6-Plus. Обе доступны только через официальный API Alibaba Cloud. Zhipu AI…
Время дешевого ИИ закончилось: Alibaba закрыла свой дешёвый тариф для ИИ-программирования через 2 месяца после запуска.
Ранее, компания стала закрывать часть своих открытых моделей.
Сегодня Alibaba Cloud закрыли свой тариф Coding Plan Lite, который стоил ~$5.5 в месяц. Внутри был пакет из моделей: Qwen, GLM, Kimi, MiniMax. 18 000 запросов в месяц. Запустили тариф в феврале. С 20 марта перестали принимать новых пользователей, а сейчас отрезали и продление для существующих.
Остался только тариф Pro ~27-28$.
Многие пользователи на Reddit и в китайских сообществах уже жалуются, что Pro часто sold out и его приходится ловить по утрам в ограниченном количестве.
Все это про то, что конец бесплатному /очень дешевому ИИ. Вместо того, чтобы продолжать субсидировать убыточный для себя сегмент, Alibaba предпочла быстро свернуть его.
ИИ-компании нащупывают ценовое дно, ниже которого бизнес не работает. Дешёвые входные тарифы выглядят привлекательно для роста пользовательской базы, но если средний пользователь такого плана генерирует запросов на сумму, превышающую его подписку, то субсидия бесконечной быть не может.
Ранее, компания стала закрывать часть своих открытых моделей.
Сегодня Alibaba Cloud закрыли свой тариф Coding Plan Lite, который стоил ~$5.5 в месяц. Внутри был пакет из моделей: Qwen, GLM, Kimi, MiniMax. 18 000 запросов в месяц. Запустили тариф в феврале. С 20 марта перестали принимать новых пользователей, а сейчас отрезали и продление для существующих.
Остался только тариф Pro ~27-28$.
Многие пользователи на Reddit и в китайских сообществах уже жалуются, что Pro часто sold out и его приходится ловить по утрам в ограниченном количестве.
Все это про то, что конец бесплатному /очень дешевому ИИ. Вместо того, чтобы продолжать субсидировать убыточный для себя сегмент, Alibaba предпочла быстро свернуть его.
ИИ-компании нащупывают ценовое дно, ниже которого бизнес не работает. Дешёвые входные тарифы выглядят привлекательно для роста пользовательской базы, но если средний пользователь такого плана генерирует запросов на сумму, превышающую его подписку, то субсидия бесконечной быть не может.
Aliyun
Coding Plan Lite 基础套餐停止续费和升级通知-阿里云官网公告
计划和影响 尊敬的阿里云用户您好,非常感谢您对阿里云百炼Coding Plan产品的支持,由于产品策略调整,自2026年4月13日起,Coding P
👍9❤6👎1🤔1
Google представил ИИ для развития человеческих навыков будущего
По мере того, как развивается ИИ, всё большую ценность для человека имеют устойчивые мягкие навыки, которые сложно автоматизировать:
- критическое мышление,
- сотрудничество,
- креативное мышление,
- разрешение конфликтов,
- управление проектами и другие мягкие навыки.
Google Research представил Vantage, который с помощью ИИ помогает развивать и оценивать эти навыки.
Как это происходит?
Вы попадаете в симулированную среду, где есть команда с ИИ-аватарами. Один LLM специально провоцирует вас на конфликты, возражения и сложные ситуации, чтобы вы начали проявлять свои навыки.
А другая модель в это время анализирует весь диалог и выдаёт детальную оценку + обратную связь.
В будущем такие симуляции могут помочь сделать образование более адаптированным к миру, где ИИ берёт на себя рутину.
По мере того, как развивается ИИ, всё большую ценность для человека имеют устойчивые мягкие навыки, которые сложно автоматизировать:
- критическое мышление,
- сотрудничество,
- креативное мышление,
- разрешение конфликтов,
- управление проектами и другие мягкие навыки.
Google Research представил Vantage, который с помощью ИИ помогает развивать и оценивать эти навыки.
Как это происходит?
Вы попадаете в симулированную среду, где есть команда с ИИ-аватарами. Один LLM специально провоцирует вас на конфликты, возражения и сложные ситуации, чтобы вы начали проявлять свои навыки.
А другая модель в это время анализирует весь диалог и выдаёт детальную оценку + обратную связь.
В будущем такие симуляции могут помочь сделать образование более адаптированным к миру, где ИИ берёт на себя рутину.
Google Research
Towards developing future-ready skills with generative AI
Our new research demonstrates a novel approach to assess “future-ready” skills using GenAI. The results of our study with New York University found the AI scoring to be on par with human experts. This research experiment, Vantage, is now available on Google…
👍19🤣5
Похоже, Anthropic скоро выпустит конкурента Lovable, вайб кодинг охватил всех
Уже какое-то время мы замечаем, что продуктовая стратегия Anthropic и у других больших лаб строится вокруг вайб кодинга, который находится на пересечении их фокуса, потребительского спроса и той зоны, где огромные субсидии на токены склоняют чашу весов в их пользу.
Когда ты Anthropic и у тебя есть модель, инфраструктура и желание захватить потреб рынок, то логика продуктового движения очевидна.
Конечно, вайб кодинг миру дали Lovable, Replit, Rork, они сделали его раньше всех и стараются теперь стать платформами для малого бизнеса. Сейчас они ушли выше по стеку, куда Anthropic пока не идёт.
Но это пока… Anthropic контролирует цену токена. Они могут субсидировать своих пользователей и сделать маржу партнёров математически невозможной. Им не нужно копировать продукт, достаточно изменить прайсинг.
С другой стороны, это индустрия, а не рынок.
Выживут те, кто строит не обёртку над моделью, а собственный слой ценности.
Вопрос только в том, у кого из них есть на это время, деньги и своих пользователей, чтобы не зависеть от милости Anthropic?
Уже какое-то время мы замечаем, что продуктовая стратегия Anthropic и у других больших лаб строится вокруг вайб кодинга, который находится на пересечении их фокуса, потребительского спроса и той зоны, где огромные субсидии на токены склоняют чашу весов в их пользу.
Когда ты Anthropic и у тебя есть модель, инфраструктура и желание захватить потреб рынок, то логика продуктового движения очевидна.
Конечно, вайб кодинг миру дали Lovable, Replit, Rork, они сделали его раньше всех и стараются теперь стать платформами для малого бизнеса. Сейчас они ушли выше по стеку, куда Anthropic пока не идёт.
Но это пока… Anthropic контролирует цену токена. Они могут субсидировать своих пользователей и сделать маржу партнёров математически невозможной. Им не нужно копировать продукт, достаточно изменить прайсинг.
С другой стороны, это индустрия, а не рынок.
Выживут те, кто строит не обёртку над моделью, а собственный слой ценности.
Вопрос только в том, у кого из них есть на это время, деньги и своих пользователей, чтобы не зависеть от милости Anthropic?
Telegram
All about AI, Web 3.0, BCI
Sneak leak at something coming soon to Claude. This could be a fullstack vibe coding competitor to the likes of lovable.
It’s been apparent for some time that Anthropic's consumer story would be vibe coding as it's at the intersection of where they focus…
It’s been apparent for some time that Anthropic's consumer story would be vibe coding as it's at the intersection of where they focus…
👍7😁1🤔1
Просто посмотрите и сравните действия в части крипты в РФ/Германии/США
Сегодня Deutsche Börse крупнейшая фондовая группа Германии объявила, что инвестирует $200 млн в головную компанию крипто биржи Kraken, получая 1,5% компании, при оценке $13,3млрд.
Параллельно, вчера, в США SEC выпустила заявление, в котором говорится, что многие DeFi-интерфейсы, агрегаторы свопов и фронтенды кошельков могут работать без регистрации как брокер-дилер.
Срок действия 5 лет.
И вчера же в России одобрили поправки в Уголовный кодекс, где говорится, что с 1 июля 2027 года за организацию оборота крипты без лицензии ЦБ при доходе от 3,5 млн руб. будут сажать в тюрьму до 7 лет + штраф до 1 млн руб.
Это касается в первую очередь криптообменников, P2P-платформ, агрегаторов и посредников, которые системно организуют оборот вне российского регулируемого контура.
Выводы делайте самостоятельно.
Сегодня Deutsche Börse крупнейшая фондовая группа Германии объявила, что инвестирует $200 млн в головную компанию крипто биржи Kraken, получая 1,5% компании, при оценке $13,3млрд.
Параллельно, вчера, в США SEC выпустила заявление, в котором говорится, что многие DeFi-интерфейсы, агрегаторы свопов и фронтенды кошельков могут работать без регистрации как брокер-дилер.
Срок действия 5 лет.
И вчера же в России одобрили поправки в Уголовный кодекс, где говорится, что с 1 июля 2027 года за организацию оборота крипты без лицензии ЦБ при доходе от 3,5 млн руб. будут сажать в тюрьму до 7 лет + штраф до 1 млн руб.
Это касается в первую очередь криптообменников, P2P-платформ, агрегаторов и посредников, которые системно организуют оборот вне российского регулируемого контура.
Выводы делайте самостоятельно.
Bloomberg.com
Deutsche Börse Takes $200 Million Stake in Crypto Exchange Kraken
Deutsche Börse AG invested $200 million in Payward Inc., the parent of crypto trading platform Kraken, as the Frankfurt stock exchange operator moves to offer access to a wider array of securities over blockchain rails.
🤬7😢5❤1😍1
Amazon представила платформу для создания новых лекарств, где ИИ-агенты инициируют физические действия
AWS сегодня представила Amazon Bio Discovery - агентная инфраструктура, в которой специализированные ИИ-агенты управляют физическими процессами: заказывают синтез молекул, запускают ассеи, забирают результаты.
AWS строит вертикальные агентные приложения поверх своей инфраструктуры и биотех здесь первый полигон.
Кстати, у AWS есть конкуренты, например, Isomorphic Labs работает с фармацевтическими гигантами напрямую, без доступа внешних исследователей. А Recursion Pharmaceuticals строит собственный вертикально интегрированный стек: роботизированные лаборатории + ИИ, но фокус на внутреннем пайплайне, а не на платформе для рынка.
А AWS хочет стать инфраструктурой для всех остальных.
Physical AI начинается не с роботов, а с агентов, которые управляют лабораторными партнёрами через API.
AWS сегодня представила Amazon Bio Discovery - агентная инфраструктура, в которой специализированные ИИ-агенты управляют физическими процессами: заказывают синтез молекул, запускают ассеи, забирают результаты.
AWS строит вертикальные агентные приложения поверх своей инфраструктуры и биотех здесь первый полигон.
Кстати, у AWS есть конкуренты, например, Isomorphic Labs работает с фармацевтическими гигантами напрямую, без доступа внешних исследователей. А Recursion Pharmaceuticals строит собственный вертикально интегрированный стек: роботизированные лаборатории + ИИ, но фокус на внутреннем пайплайне, а не на платформе для рынка.
А AWS хочет стать инфраструктурой для всех остальных.
Physical AI начинается не с роботов, а с агентов, которые управляют лабораторными партнёрами через API.
Amazon
Introducing Amazon Bio Discovery | Amazon Web Services
Learn about the general availability of Amazon Bio Discovery, a unified application that closes the experimental loop between your dry and wet lab, enabling you to collaborate more efficiently with your computational colleagues, compress discovery cycles…
🔥6👍4❤2
О том, что сегодня индустрия ИИ застряла в своем развитии. Причина в том, что на рынке заморожен найм людей
Мы тут прочитали интересный пост Стива Йегге, известного инженера, который раньше работал в Google и Amazon. Он поделился разговором со своим другом СТО из Google и выяснил следующее - большинство компаний в ИТ сейчас примерно на одном уровне внедрения ИИ внутри своих инженерных команд:
- 20% - пользователи, которые активно используют продвинутые инструменты Cursor, Claude Code и т.п., и сильно ускоряются.
- 20% - отказники, которые вообще не хотят ничего менять и пишут код по-старому.
- 60% - середнячки, которые используют только чат (типа Cursor в простом режиме или GitHub Copilot) и не переходят на полноценные агентные рабочие пространства.
По словам друга Йегге, в Google уровень внедрения на среднем уровне, несмотря на то, что они один из лидеров.
Но почему Google и конкуренты застряли на этом уровне?
Йегге приводит несколько причин:
1. Очень долгий период заморозки найма людей по всей индустрии уже 18+ месяцев. Люди почти не переходят из компании в компанию. Из-за этого в Google не приходят новые инженеры из других фирм, которые могли бы сказать: «Ребята, вы сильно отстаёте, снаружи уже всё по-другому». Все сидят в своём вакууме и не видят реальной картины.
2. В Google нельзя использовать Claude Code, считается конкурентом и врагом. А собственный Gemini до сих пор не смог зайти в рабочие процессы инженеров так же сильно, как Claude. Поэтому полноценное агентное программирование внутри Google так и не взлетел. Инженеры плетутся на старом уровне.
3. Отсутствие осознания проблемы. Компания не только не решает вопрос, но даже не понимает, насколько она посредственна в этом аспекте, они увязли и не могут выбраться.
Что касается всей ИИ-индустрии в целом, то вот какая ситуация:
- Большинство компаний на таком же уровне или даже хуже. Некоторые вообще не могут выбить бюджет на ИИ и сидят с почти нулевым внедрением.
- Есть редкие исключения-компании, которые агрессивно переходят на агентный подход. Например, одна лидерская компания отменила IntelliJ для тысячи инженеров и полностью перешла на AI-native инструменты. Йегге считает, что они получат огромный отрыв.
А многие уже просто ставят галочку себе, когда включат Copilot/Cursor всем сотрудникам, празднуют так, как будто решили проблему.
На деле же это почти ничего не меняет - настоящая производительность растёт только у тех, кто уходит в глубокий агентный режим.
Главный вывод Йегге в том, что все это - последствия большой изоляции. Из-за заморозки найма компании летят вслепую и не знают, где они находятся относительно конкурентов. Никто не видит реального отрыва лидеров.
Это хороший и показательный пример какие результаты дает изоляция, отсутствие передвижения людей.
Мы тут прочитали интересный пост Стива Йегге, известного инженера, который раньше работал в Google и Amazon. Он поделился разговором со своим другом СТО из Google и выяснил следующее - большинство компаний в ИТ сейчас примерно на одном уровне внедрения ИИ внутри своих инженерных команд:
- 20% - пользователи, которые активно используют продвинутые инструменты Cursor, Claude Code и т.п., и сильно ускоряются.
- 20% - отказники, которые вообще не хотят ничего менять и пишут код по-старому.
- 60% - середнячки, которые используют только чат (типа Cursor в простом режиме или GitHub Copilot) и не переходят на полноценные агентные рабочие пространства.
По словам друга Йегге, в Google уровень внедрения на среднем уровне, несмотря на то, что они один из лидеров.
Но почему Google и конкуренты застряли на этом уровне?
Йегге приводит несколько причин:
1. Очень долгий период заморозки найма людей по всей индустрии уже 18+ месяцев. Люди почти не переходят из компании в компанию. Из-за этого в Google не приходят новые инженеры из других фирм, которые могли бы сказать: «Ребята, вы сильно отстаёте, снаружи уже всё по-другому». Все сидят в своём вакууме и не видят реальной картины.
2. В Google нельзя использовать Claude Code, считается конкурентом и врагом. А собственный Gemini до сих пор не смог зайти в рабочие процессы инженеров так же сильно, как Claude. Поэтому полноценное агентное программирование внутри Google так и не взлетел. Инженеры плетутся на старом уровне.
3. Отсутствие осознания проблемы. Компания не только не решает вопрос, но даже не понимает, насколько она посредственна в этом аспекте, они увязли и не могут выбраться.
Что касается всей ИИ-индустрии в целом, то вот какая ситуация:
- Большинство компаний на таком же уровне или даже хуже. Некоторые вообще не могут выбить бюджет на ИИ и сидят с почти нулевым внедрением.
- Есть редкие исключения-компании, которые агрессивно переходят на агентный подход. Например, одна лидерская компания отменила IntelliJ для тысячи инженеров и полностью перешла на AI-native инструменты. Йегге считает, что они получат огромный отрыв.
А многие уже просто ставят галочку себе, когда включат Copilot/Cursor всем сотрудникам, празднуют так, как будто решили проблему.
На деле же это почти ничего не меняет - настоящая производительность растёт только у тех, кто уходит в глубокий агентный режим.
Главный вывод Йегге в том, что все это - последствия большой изоляции. Из-за заморозки найма компании летят вслепую и не знают, где они находятся относительно конкурентов. Никто не видит реального отрыва лидеров.
Это хороший и показательный пример какие результаты дает изоляция, отсутствие передвижения людей.
X (formerly Twitter)
Steve Yegge (@Steve_Yegge) on X
I was chatting with my buddy at Google, who's been a tech director there for about 20 years, about their AI adoption. Craziest convo I've had all year.
The TL;DR is that Google engineering appears to have the same AI adoption footprint as John Deere, the…
The TL;DR is that Google engineering appears to have the same AI adoption footprint as John Deere, the…
👍13🤔3❤2👎1😁1💊1
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Время дешевого ИИ закончилось: Alibaba закрыла свой дешёвый тариф для ИИ-программирования через 2 месяца после запуска. Ранее, компания стала закрывать часть своих открытых моделей. Сегодня Alibaba Cloud закрыли свой тариф Coding Plan Lite, который стоил…
Anthropic переходит от фикс подписок к оплате по фактическому использованию. Более того, компанию оценили в $800млрд
Anthropic меняет модель. Эра дешевого и безлимитного ИИ закончилась, как мы писали ранее на примере Alibaba. А тут про OpenAI.
Фиксированная подписка предполагала предсказуемое потребление. Но реальность оказалась другой, как пишет The Information, один из подписчиков, у кого был Claude Max сгенерировал токенов на $5,600, и за это заплатил Anthropic, а сам пользователь 100$ за подписку.
Такие пользователи в основном -разработчики, которые много работают с Claude Code. А простые пользователи при этом субсидируют их, потому что фиксированная подписка не отражает реальные затраты Anthropic на сервера, электричество и GPU.
В итоге Anthropic больше не хочет терять деньги и перекладывать риски и затраты с одних клиентов на других.
Одновременно с этим
CTO Uber сказал, что их годовой бюджет на ИИ полностью потрачен уже сейчас и все деньги ушли на Claude Code. За два месяца доля использования выросла с 32% до 63%. Их внутренний агент компании делает 1 800 правок кода в неделю без участия человека.
Claude Code оказался настолько эффективным и удобным, что инженеры начали использовать его в огромных объёмах, что привело к колоссальному потреблению токенов и ресурсов.
Между тем Anthropic получила предложения от инвесторов на новый раунд инвестиций, где компанию оценивают свыше $800 млрд. - более чем в два раза выше текущей оценки.
Anthropic пока отказывается от этих предложений, они не спешат проводить новый раунд на таких условиях.
Anthropic меняет модель. Эра дешевого и безлимитного ИИ закончилась, как мы писали ранее на примере Alibaba. А тут про OpenAI.
Фиксированная подписка предполагала предсказуемое потребление. Но реальность оказалась другой, как пишет The Information, один из подписчиков, у кого был Claude Max сгенерировал токенов на $5,600, и за это заплатил Anthropic, а сам пользователь 100$ за подписку.
Такие пользователи в основном -разработчики, которые много работают с Claude Code. А простые пользователи при этом субсидируют их, потому что фиксированная подписка не отражает реальные затраты Anthropic на сервера, электричество и GPU.
В итоге Anthropic больше не хочет терять деньги и перекладывать риски и затраты с одних клиентов на других.
Одновременно с этим
CTO Uber сказал, что их годовой бюджет на ИИ полностью потрачен уже сейчас и все деньги ушли на Claude Code. За два месяца доля использования выросла с 32% до 63%. Их внутренний агент компании делает 1 800 правок кода в неделю без участия человека.
Claude Code оказался настолько эффективным и удобным, что инженеры начали использовать его в огромных объёмах, что привело к колоссальному потреблению токенов и ресурсов.
Между тем Anthropic получила предложения от инвесторов на новый раунд инвестиций, где компанию оценивают свыше $800 млрд. - более чем в два раза выше текущей оценки.
Anthropic пока отказывается от этих предложений, они не спешат проводить новый раунд на таких условиях.
The Information
Anthropic Changes Pricing to Bill Firms Based on AI Use Amid Compute Crunch
Businesses whose employees are heavy users of Anthropic’s Claude products are likely to pay significantly more for them after the company changed its pricing model in recent weeks to charge business customers based on the amount of AI they use. The shift…
1👍7❤2👎1
Всего 5 компаний в мире владеют 2/3 всего мирового ИИ-вычислительного ресурса
Google, Microsoft, Meta, Amazon и Oracle(все они гиперскейлеры) контролируют ~2/3 ИИ-вычислительных мощностей в мире.
А китайские компании владеют чуть более 5 % мирового ИИ-выч мощностей, и их доля сокращается из-за американских экспортных ограничений.
ИИ- вычислительная мощность- один из критических ресурсов в развитии ИИ наравне с данными и алгоритмами. Когда небольшая группа компаний контролирует большую часть этого для ИИ, то из этого следует:
- Высокая концентрация влияния на рынок.
- Зависимость большинства ИИ-стартапов от нескольких крупных игроков.
- Возможные вопросы о ценах, доступности и даже геополитике.
Google в этом списке абсолютный лидер. Он владеет примерно 25 % всего мирового ИИ-выч мощностей. Это эквивалентно ~ 5 млн чипов Nvidia H100.
Большая часть мощностей Google - это не Nvidia, а собственные кастомные TPU, которые компания разрабатывает и производит сама.
А Microsoft, Amazon, Meta(запрещена в РФ) и др. в основном полагаются на чипы Nvidia, хотя тоже активно закупают и другие решения.
Внутри Китая Huawei уже обогнал Nvidia по объёму поставок, но глобально это почти не влияет на мировой рынок.
Большинство ИИ-лабораторий такиe как OpenAI, Anthropic и др. не владеют своими дата-центрами, а арендуют compute у этих же гиперскейлеров через облачные сервисы. Но они планируют свои ЦОДы.
Гиперскейлеры используют свои мощности в 3-х направлениях:
1. Аренда клиентам.
2. Собственные исследования и разработка моделей.
3. Продажа/перепродажа вычислений.
Google, Microsoft, Meta, Amazon и Oracle(все они гиперскейлеры) контролируют ~2/3 ИИ-вычислительных мощностей в мире.
А китайские компании владеют чуть более 5 % мирового ИИ-выч мощностей, и их доля сокращается из-за американских экспортных ограничений.
ИИ- вычислительная мощность- один из критических ресурсов в развитии ИИ наравне с данными и алгоритмами. Когда небольшая группа компаний контролирует большую часть этого для ИИ, то из этого следует:
- Высокая концентрация влияния на рынок.
- Зависимость большинства ИИ-стартапов от нескольких крупных игроков.
- Возможные вопросы о ценах, доступности и даже геополитике.
Google в этом списке абсолютный лидер. Он владеет примерно 25 % всего мирового ИИ-выч мощностей. Это эквивалентно ~ 5 млн чипов Nvidia H100.
Большая часть мощностей Google - это не Nvidia, а собственные кастомные TPU, которые компания разрабатывает и производит сама.
А Microsoft, Amazon, Meta(запрещена в РФ) и др. в основном полагаются на чипы Nvidia, хотя тоже активно закупают и другие решения.
Внутри Китая Huawei уже обогнал Nvidia по объёму поставок, но глобально это почти не влияет на мировой рынок.
Большинство ИИ-лабораторий такиe как OpenAI, Anthropic и др. не владеют своими дата-центрами, а арендуют compute у этих же гиперскейлеров через облачные сервисы. Но они планируют свои ЦОДы.
Гиперскейлеры используют свои мощности в 3-х направлениях:
1. Аренда клиентам.
2. Собственные исследования и разработка моделей.
3. Продажа/перепродажа вычислений.
Epoch AI
Five hyperscalers now own over two-thirds of global AI compute
Amazon, Google, Meta, Microsoft, and Oracle collectively hold an estimated 67% of the world's cumulative AI compute as of Q4 2025, up from 60% in Q1 2024.
❤🔥8❤4👍2🤔1
Google представила Sparse Selective Caching: память без квадратичной цены
Трансформеры хороши тем, что помнят всё - каждый токен остаётся в KV-кэше, и при необходимости модель может к нему обратиться. Но именно это делает их дорогими: чем длиннее контекст, тем дороже каждый следующий шаг.
RNN устроены наоборот - фиксированный размер памяти, линейная стоимость, но информация вытесняется по мере поступления новой.
Исследователи Google предложили смотреть на это как на спектр между двумя операциями: кэшированием и сжатием. Трансформер кэширует всё, не сжимая ничего. RNN сжимает всё в один скрытый вектор.
Подробности тут.
Трансформеры хороши тем, что помнят всё - каждый токен остаётся в KV-кэше, и при необходимости модель может к нему обратиться. Но именно это делает их дорогими: чем длиннее контекст, тем дороже каждый следующий шаг.
RNN устроены наоборот - фиксированный размер памяти, линейная стоимость, но информация вытесняется по мере поступления новой.
Исследователи Google предложили смотреть на это как на спектр между двумя операциями: кэшированием и сжатием. Трансформер кэширует всё, не сжимая ничего. RNN сжимает всё в один скрытый вектор.
Подробности тут.
Telegram
All about AI, Web 3.0, BCI
Google presented Sparse Selective Caching, an architecture with growing effective memory (similar to attention) but with almost constant inference cost per token (similar to RNNs).
In the paper team mainly discuss:
1) the shared foundation for both softmax…
In the paper team mainly discuss:
1) the shared foundation for both softmax…
👍5
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Конкурент Neuralink - Science строит платформу, чтобы другие компании могли строить свои продукты быстрее и дешевле. Компания экс-президента Neuralink Макса Ходака, Science и швейцарская компания Neurosoft Bioelectronics объявили о партнёрстве, которое очень…
Экс-президент Neuralink в 2027г. планирует вживить в мозг пациента биогибридный нейроинтерфейс
Компания разработала уникальную технологию, в которой специально выращенные из стволовых клеток нейроны интегрируются с электроникой, а затем имплантируются в мозг.
Компания Science Макса Ходака сегодня работает над двумя разными направлениями нейроинтерфейсов:
1. PRIMA - это имплант, который вставляется под сетчатку глаза человека. Даже в этом году ожидается коммерческий запуск этих имплантов в Европе, а в США ждут решения FDA.
Компания открыла офис в Париже и оттуда уже начинается работа со многими мед учреждениями, как нам рассказывают сами сотрудники Science. Недавно они привлекли новый раунд инвестиций при оценке в $1.25млрд.
2. Создают биогибридный нейроинтерфейс, который будет вживлен на поверхность коры мозга.
В будущем нейроинтерфейс будет состоять из лабораторно выращенных живых нейронов. Их можно будет стимулировать светом, и они должны срастись с нейронами пациента. Это создаст естественный биологический мост между электроникой и мозгом без жёсткого повреждения тканей металлическими электродами.
Об этом писали тут.
Компания разработала уникальную технологию, в которой специально выращенные из стволовых клеток нейроны интегрируются с электроникой, а затем имплантируются в мозг.
Компания Science Макса Ходака сегодня работает над двумя разными направлениями нейроинтерфейсов:
1. PRIMA - это имплант, который вставляется под сетчатку глаза человека. Даже в этом году ожидается коммерческий запуск этих имплантов в Европе, а в США ждут решения FDA.
Компания открыла офис в Париже и оттуда уже начинается работа со многими мед учреждениями, как нам рассказывают сами сотрудники Science. Недавно они привлекли новый раунд инвестиций при оценке в $1.25млрд.
2. Создают биогибридный нейроинтерфейс, который будет вживлен на поверхность коры мозга.
В будущем нейроинтерфейс будет состоять из лабораторно выращенных живых нейронов. Их можно будет стимулировать светом, и они должны срастись с нейронами пациента. Это создаст естественный биологический мост между электроникой и мозгом без жёсткого повреждения тканей металлическими электродами.
Об этом писали тут.
TechCrunch
Max Hodak’s Science Corp. is preparing to place its first sensor in a human brain | TechCrunch
The device could help address multiple neurological conditions if it proves successful. One early use could be delivering gentle electrical stimulation to damaged brain or spinal cord cells to encourage healing.
❤9🤯2
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Экс-президент Neuralink в 2027г. планирует вживить в мозг пациента биогибридный нейроинтерфейс Компания разработала уникальную технологию, в которой специально выращенные из стволовых клеток нейроны интегрируются с электроникой, а затем имплантируются в мозг.…
Media is too big
VIEW IN TELEGRAM
Что такое биогибридный нейроинтерфейс, который Макс Ходак предлагает имплантировать в мозг людей?
А самое главное, что с этим потом можно сделать?
Объясняет буквально на пальцах наш уважаемый и почитаемый профессор М. Лебедев, у кого Ходак учился в свое время.
По мнению, Михаила Альбертовича, если вживить такие импланты в мозг, то после можно дистанционно ими управлять, например, говорить как прорастить связи, за счёт этого люди смогут умнеть.
А самое главное, что с этим потом можно сделать?
Объясняет буквально на пальцах наш уважаемый и почитаемый профессор М. Лебедев, у кого Ходак учился в свое время.
По мнению, Михаила Альбертовича, если вживить такие импланты в мозг, то после можно дистанционно ими управлять, например, говорить как прорастить связи, за счёт этого люди смогут умнеть.
❤🔥8👍3😍2