США отключили Fable 5 и Mythos 5 для всего мира.
Официальная причина: был обнаружен способ использовать Fable 5 для поиска уязвимостей в коде
Проблема в том, что подобные возможности есть практически у всех современных AI-моделей и давно используются разработчиками для защиты программ, а не только для атак
Поэтому главная новость не в самой уязвимости
Главная новость в том, что США фактически показали: передовые AML-модели теперь рассматриваются как стратегическая технология, доступ к которой может ограничиваться по политическим причинам
Что это значит:
• доступ к лучшим моделям больше не гарантирован
• государство может вмешаться даже после запуска продукта
• строить бизнес на одной AI-модели становится рискованно
• рынок всё сильнее движется к разделению на отдельные технологические блоки
Это важный урок: выбирать модель теперь нужно не только по качеству и цене, но и по политическим рискам
Похоже, эпоха «глобального AML для всех» заканчивается быстрее, чем ожидали
Официальная причина: был обнаружен способ использовать Fable 5 для поиска уязвимостей в коде
Проблема в том, что подобные возможности есть практически у всех современных AI-моделей и давно используются разработчиками для защиты программ, а не только для атак
Поэтому главная новость не в самой уязвимости
Главная новость в том, что США фактически показали: передовые AML-модели теперь рассматриваются как стратегическая технология, доступ к которой может ограничиваться по политическим причинам
Что это значит:
• доступ к лучшим моделям больше не гарантирован
• государство может вмешаться даже после запуска продукта
• строить бизнес на одной AI-модели становится рискованно
• рынок всё сильнее движется к разделению на отдельные технологические блоки
Это важный урок: выбирать модель теперь нужно не только по качеству и цене, но и по политическим рискам
Похоже, эпоха «глобального AML для всех» заканчивается быстрее, чем ожидали
В "Principia Mathematica" (1910–1913) Рассел и Уайтхед приходят к выводу «1 + 1 = 2» лишь ближе к концу первого тома, примерно на 362-й странице
Но они вовсе не стремились доказать именно это
Их цель была куда более амбициозной: построить всю математику как логическую систему — без неясностей, парадоксов и «очевидностей по умолчанию»
Чтобы добраться до выражения «1 + 1 = 2», им пришлось начать с нуля: определить, что такое высказывание, что такое логическая связка, как устроено множество, как возникает число как кардинальность, как строится операция сложения и как определяется равенство
Всё, что обычно воспринимается как «по умолчанию», они выстроили шаг за шагом — строго, формально, в логике высших порядков
Когда на странице 362 они наконец подводят:
«Из этого следует, что после определения арифметического сложения 1 + 1 = 2», — они добавляют ироничную сноску:
«Это утверждение иногда бывает полезным»
Юмор в том, что на формальное доказательство базового школьного факта действительно уходит множество предварительных слоёв — настолько, что сам результат кажется несерьёзным по сравнению с тем, что было проделано
Позже, в 1931 году, Курт Гёдель покажет, что даже такая титаническая система не может быть ни полной, ни абсолютно непротиворечивой
Но попытка Рассела и Уайтхеда не была напрасной
Она стала важнейшей вехой в истории логики, повлияла на создание языков программирования, формальных доказательств и представлений о математической строгости
Но они вовсе не стремились доказать именно это
Их цель была куда более амбициозной: построить всю математику как логическую систему — без неясностей, парадоксов и «очевидностей по умолчанию»
Чтобы добраться до выражения «1 + 1 = 2», им пришлось начать с нуля: определить, что такое высказывание, что такое логическая связка, как устроено множество, как возникает число как кардинальность, как строится операция сложения и как определяется равенство
Всё, что обычно воспринимается как «по умолчанию», они выстроили шаг за шагом — строго, формально, в логике высших порядков
Когда на странице 362 они наконец подводят:
«Из этого следует, что после определения арифметического сложения 1 + 1 = 2», — они добавляют ироничную сноску:
«Это утверждение иногда бывает полезным»
Юмор в том, что на формальное доказательство базового школьного факта действительно уходит множество предварительных слоёв — настолько, что сам результат кажется несерьёзным по сравнению с тем, что было проделано
Позже, в 1931 году, Курт Гёдель покажет, что даже такая титаническая система не может быть ни полной, ни абсолютно непротиворечивой
Но попытка Рассела и Уайтхеда не была напрасной
Она стала важнейшей вехой в истории логики, повлияла на создание языков программирования, формальных доказательств и представлений о математической строгости
👍1
Статья от команды DeepMind, которая сформировала главный тезис: достижение AGI - не финал, а начало другого вопроса: что будет дальше?
Для начала авторы дают нам определения понятий:
AGI - система, которая достигает медианного человеческого уровня интеллекта на большинстве когнитивных задач
ASI - система, которая превосходит десятки тысяч специалистов, работающих годами во всех областях
UAI (Universal AI / AIXI) - агент, максимизирующий ожидаемое вознаграждение по всем вычислимым задачам
Авторы используют шкалу Легга–Хаттера как формальное основание: интеллект - это средняя производительность агента по всем вычислимым задачам с весами по обратной сложности Колмогорова
На этой шкале существует непрерывный континуум от сегодняшних систем до UAI
Google DeepMind выделяет 4 пути к ASI:
1. Масштабирование — продолжение текущего тренда
Даже без улучшения отдельной модели: миллион копий AGI, работающих параллельно - это уже другая реальность
2. Смена парадигмы - трансформеры + RLHF не дотянут до ASI
Нужны принципиально новые архитектуры: нейроморфные чипы, аналоговые вычисления, RL-предобучение, явные мировые модели
3. Рекурсивное самоулучшение
Полная автономия - открытый вопрос
4. Мультиагентные коллективы - ASI как коллективное свойствоя, не один сверхумный агент, а миллионы AGI-агентов, организованных в корпорации, рынки, коллективы с высокополосной коммуникацией
Авторы ставят вопрос: нужны «законы масштабирования для многоагентных систем»
Что реально может остановить прогресс?
1. Рост моделей опережает производство текстов людьми
Синтетические данные пока деградируют при итеративном обучении. Спасение - симуляции и агентное взаимодействие с реальным миром
2. Барьер абстракции. Гипотеза: AML, обученные на человеческих символах и концепциях, принципиально не способны открывать новые концепции из сырых данных
Мысленный эксперимент, если обучить современную LLM на знаниях до ньютоновской эпохи выведет ли она общую теорию относительности?
Почти наверняка нет.
Это ограничение может поставить потолок у уровня AGI для отдельной модели и потребовать перехода к воплощённому обучению через физическое взаимодействие с миром
3. Регуляция и замедление
Страны, вводящие ограничения в одностороннем порядке, проигрывают конкурентно
Авторы отмечают, что ASI не будет всемогущим
Скорость света, теорема Гёделя, NP-полнота, физическая невозможность произвольных конфигураций материи - ASI остаётся в рамках физики и теории вычислимости
https://arxiv.org/pdf/2606.12683
Для начала авторы дают нам определения понятий:
AGI - система, которая достигает медианного человеческого уровня интеллекта на большинстве когнитивных задач
ASI - система, которая превосходит десятки тысяч специалистов, работающих годами во всех областях
UAI (Universal AI / AIXI) - агент, максимизирующий ожидаемое вознаграждение по всем вычислимым задачам
Авторы используют шкалу Легга–Хаттера как формальное основание: интеллект - это средняя производительность агента по всем вычислимым задачам с весами по обратной сложности Колмогорова
На этой шкале существует непрерывный континуум от сегодняшних систем до UAI
Google DeepMind выделяет 4 пути к ASI:
1. Масштабирование — продолжение текущего тренда
Даже без улучшения отдельной модели: миллион копий AGI, работающих параллельно - это уже другая реальность
2. Смена парадигмы - трансформеры + RLHF не дотянут до ASI
Нужны принципиально новые архитектуры: нейроморфные чипы, аналоговые вычисления, RL-предобучение, явные мировые модели
3. Рекурсивное самоулучшение
Полная автономия - открытый вопрос
4. Мультиагентные коллективы - ASI как коллективное свойствоя, не один сверхумный агент, а миллионы AGI-агентов, организованных в корпорации, рынки, коллективы с высокополосной коммуникацией
Авторы ставят вопрос: нужны «законы масштабирования для многоагентных систем»
Что реально может остановить прогресс?
1. Рост моделей опережает производство текстов людьми
Синтетические данные пока деградируют при итеративном обучении. Спасение - симуляции и агентное взаимодействие с реальным миром
2. Барьер абстракции. Гипотеза: AML, обученные на человеческих символах и концепциях, принципиально не способны открывать новые концепции из сырых данных
Мысленный эксперимент, если обучить современную LLM на знаниях до ньютоновской эпохи выведет ли она общую теорию относительности?
Почти наверняка нет.
Это ограничение может поставить потолок у уровня AGI для отдельной модели и потребовать перехода к воплощённому обучению через физическое взаимодействие с миром
3. Регуляция и замедление
Страны, вводящие ограничения в одностороннем порядке, проигрывают конкурентно
Авторы отмечают, что ASI не будет всемогущим
Скорость света, теорема Гёделя, NP-полнота, физическая невозможность произвольных конфигураций материи - ASI остаётся в рамках физики и теории вычислимости
https://arxiv.org/pdf/2606.12683
Вышла работа (Универы Оксфорда и Стэнфорда совместно с лондонскими AI Security Institute и School of Economics and Political Science) с названием, которое звучит уже не как гипотеза, а как приговор: AI systems out-persuade expert humans
Может быть, у профессионалов убеждения ещё есть шанс?
У дебатёров мирового уровня?
У агитаторов?
У фандрайзеров?
У людей, которым дали подготовку, деньги, практику и возможность выбрать удобные темы?
Ответ: шансов нет
AML превзошёл выборку (n = 18.978 разговоров с 6.923 человек) из отобранных победителей турнира убеждения, элитных дебатёров, включая чемпионов мира и континентов, и даже профессиональных страховых агентов
А когда этих дебатёров ещё и специально тренировали против AML, разрыв сузился, но не исчез
N.B. речь пока прежде всего о текстовом убеждении
Не о харизме на сцене, не о взгляде в глаза, не о многолетнем личном доверии
Но именно текстовое убеждение сегодня масштабируется дешевле всего
AML быстрее и плотнее насыщает разговор фактами, аргументами, структурами, примерами и адаптацией под собеседника
В эволюции человека решающим преимуществом был не большой мозг, а мозг, подключённый к другим мозгам через язык
Коммуникация сделала разум сетевым
Убеждение стало интерфейсом управления этой социо-разумной сетью
Может быть, у профессионалов убеждения ещё есть шанс?
У дебатёров мирового уровня?
У агитаторов?
У фандрайзеров?
У людей, которым дали подготовку, деньги, практику и возможность выбрать удобные темы?
Ответ: шансов нет
AML превзошёл выборку (n = 18.978 разговоров с 6.923 человек) из отобранных победителей турнира убеждения, элитных дебатёров, включая чемпионов мира и континентов, и даже профессиональных страховых агентов
А когда этих дебатёров ещё и специально тренировали против AML, разрыв сузился, но не исчез
N.B. речь пока прежде всего о текстовом убеждении
Не о харизме на сцене, не о взгляде в глаза, не о многолетнем личном доверии
Но именно текстовое убеждение сегодня масштабируется дешевле всего
AML быстрее и плотнее насыщает разговор фактами, аргументами, структурами, примерами и адаптацией под собеседника
В эволюции человека решающим преимуществом был не большой мозг, а мозг, подключённый к другим мозгам через язык
Коммуникация сделала разум сетевым
Убеждение стало интерфейсом управления этой социо-разумной сетью
В совершенстве овладев этим, алгоритм получает доступ не к одной способности среди многих, а к одному из центральных рычагов человеческой эволюционной власти
arXiv.org
AI systems out-persuade expert humans
Many societal decisions are settled by contests of persuasion. Conversational AI is a powerful new entrant in these contests, but whether it can out-persuade skilled and highly incentivized humans...
В Эвиане собрались за одним столом главы Google DeepMind, Anthropic, OpenAI, а также ещё 10 человек из индустрии и президенты стран, входящие в G7
Формальная тема встречи была: "Обеспечение безопасного и эффективного внедрения AI"
А реальная - это, что делать с тем, что США на прошлой неделе запретили иностранцам доступ к Fable 5 и Mythos 5 и фактически отрезали от самых мощных моделей в мире
Макрон предложил решение этой проблемы - создать систему доверенных партнёров, где страны проходят проверку на нацбезопасность и получают доступ к передовым AML-моделям
А Амодей и Альтман говорили об открытости и сотрудничестве
Пока шла эта встреча, внутри команды Трампа возникли противоречия
Ещё до введения экспортных ограничений против Anthropic, администрация Трампа обсуждала, как структурировать государственные доли в AML-компаниях
Ранее Сэм Альтман предложил администрации Трампа получить доли в AML-компаниях
И вот сейчас выясняется, что внутри команды Трампа есть противоречия, например, министр финансов выступает за то, чтобы направить госдоли в AI-компаниях в Trump Accounts (детские инвестиционные счета), тогда как министр торговли предлагает создать суверенный фонд
Это история не про безопасность, а про власть, контроль и монетизацию
Формальная тема встречи была: "Обеспечение безопасного и эффективного внедрения AI"
А реальная - это, что делать с тем, что США на прошлой неделе запретили иностранцам доступ к Fable 5 и Mythos 5 и фактически отрезали от самых мощных моделей в мире
Макрон предложил решение этой проблемы - создать систему доверенных партнёров, где страны проходят проверку на нацбезопасность и получают доступ к передовым AML-моделям
А Амодей и Альтман говорили об открытости и сотрудничестве
Пока шла эта встреча, внутри команды Трампа возникли противоречия
Ещё до введения экспортных ограничений против Anthropic, администрация Трампа обсуждала, как структурировать государственные доли в AML-компаниях
Ранее Сэм Альтман предложил администрации Трампа получить доли в AML-компаниях
И вот сейчас выясняется, что внутри команды Трампа есть противоречия, например, министр финансов выступает за то, чтобы направить госдоли в AI-компаниях в Trump Accounts (детские инвестиционные счета), тогда как министр торговли предлагает создать суверенный фонд
Это история не про безопасность, а про власть, контроль и монетизацию
НИИ Антропогенеза приглашает на XII Всероссийскую научную молодежную школу-семинар "Математическое моделирование, численные методы и комплексы программ" (21–24 июля 2026 в Саранск)
Основные темы:
1. Принципы построения математических моделей
2. Численная реализация алгоритмов математических моделей
3. Динамические системы и качественные методы анализа математических моделей
4. Математические модели в физике, химии, биологии, экономике, социологии, экологии и других науках
https://confhub.ru/rus/event/10542/
http://conf.svmo.ru
Основные темы:
1. Принципы построения математических моделей
2. Численная реализация алгоритмов математических моделей
3. Динамические системы и качественные методы анализа математических моделей
4. Математические модели в физике, химии, биологии, экономике, социологии, экологии и других науках
https://confhub.ru/rus/event/10542/
http://conf.svmo.ru
Technological Advancement and Expectation
Over the past three years, the exponential advancement in underlying technology has been largely as expected, while the specific direction of some developments, particularly in coding, was less predictable
There is an apparent lack of public recognition of how close we are to significant technological leaps
Scaling and Learning Models
Despite the complexity, the underlying scaling principles remain consistent
The hypothesis focuses on a few critical factors:
- Raw compute power
- Quantity and quality of data
- Duration of training
- Scalable objective functions
These factors have broadly aligned with ongoing advancements, notably in the application of models to various domains, including reinforcement learning (RL) and pre-training
Case Studies and Examples
- Historic Document: The "big blob of compute hypothesis" from 2017 underpinned contemporary scaling methods for language models, robotics, and reasoning
- Influential Benchmarks: Examples such as GPT-1, AlphaGo, and Dota highlight the varying advancements
Scaling in Reinforcement Learning
RL scaling remains ambiguous without a clear public scaling law or story, yet practical implementations show continued progress, paralleling pre-training scaling
Human Learning vs Models
Despite inherent differences between human learning and AI model training, the training dynamics of AI models often mimic a blend between evolution, long-term learning, and short-term adaptation
This suggests AI needs more training samples to achieve similar efficiency to humans
Diffusion and Economic Integration
Economic diffusion limits the rapid integration of AI advancements into industries, despite significant adoption strides
This diffusion is faster than previous technological deployments but still faces bureaucratic and procedural hurdles
Predictions: Concrete and Long-Term
The speaker predicts substantial progress in AI capabilities, including end-to-end software engineering within a decade
The differentiation between verifiable and non-verifiable tasks remains crucial, reflecting ongoing challenges in achieving generalized AI that seamlessly operates across all domains
Generalization in AI
Generalization involves training AI across varied domains and realistic tasks, much like the Labelbox example, where Fortune 500 salespeople created diverse RL environments to train an AI sales agent
This approach integrates extensive real-world scenarios to build adaptable and versatile models
Conclusion
The technology is on a fast but not instant trajectory toward AGI, with significant advancements expected in the near term
However, complete integration into every aspect of work and economy will require overcoming both formidable technical challenges and procedural inertia across different industries
Over the past three years, the exponential advancement in underlying technology has been largely as expected, while the specific direction of some developments, particularly in coding, was less predictable
There is an apparent lack of public recognition of how close we are to significant technological leaps
Scaling and Learning Models
Despite the complexity, the underlying scaling principles remain consistent
The hypothesis focuses on a few critical factors:
- Raw compute power
- Quantity and quality of data
- Duration of training
- Scalable objective functions
These factors have broadly aligned with ongoing advancements, notably in the application of models to various domains, including reinforcement learning (RL) and pre-training
Case Studies and Examples
- Historic Document: The "big blob of compute hypothesis" from 2017 underpinned contemporary scaling methods for language models, robotics, and reasoning
- Influential Benchmarks: Examples such as GPT-1, AlphaGo, and Dota highlight the varying advancements
Scaling in Reinforcement Learning
RL scaling remains ambiguous without a clear public scaling law or story, yet practical implementations show continued progress, paralleling pre-training scaling
Human Learning vs Models
Despite inherent differences between human learning and AI model training, the training dynamics of AI models often mimic a blend between evolution, long-term learning, and short-term adaptation
This suggests AI needs more training samples to achieve similar efficiency to humans
Diffusion and Economic Integration
Economic diffusion limits the rapid integration of AI advancements into industries, despite significant adoption strides
This diffusion is faster than previous technological deployments but still faces bureaucratic and procedural hurdles
Predictions: Concrete and Long-Term
The speaker predicts substantial progress in AI capabilities, including end-to-end software engineering within a decade
The differentiation between verifiable and non-verifiable tasks remains crucial, reflecting ongoing challenges in achieving generalized AI that seamlessly operates across all domains
Generalization in AI
Generalization involves training AI across varied domains and realistic tasks, much like the Labelbox example, where Fortune 500 salespeople created diverse RL environments to train an AI sales agent
This approach integrates extensive real-world scenarios to build adaptable and versatile models
Conclusion
The technology is on a fast but not instant trajectory toward AGI, with significant advancements expected in the near term
However, complete integration into every aspect of work and economy will require overcoming both formidable technical challenges and procedural inertia across different industries
Misunderstandings of Transformers and Google’s AI Research
The development of Transformers was driven by product needs, such as improving translation and speech recognition for large user bases
Google's use of TPUs was to manage the massive demand for AI inference tasks
Transformers like BERT significantly improved search quality, a factor meticulously measured by Google
Teams also built and productized Lambda, showcasing Google's proactive approach to AI deployment
ChatGPT and Lambda’s Early Versions
Lambda can be seen as an early version of conversational AI products like ChatGPT. Internal versions faced challenges like being overly toxic, and Google had high standards for search quality, delaying broader releases
Google's AI Test Kitchen at Google I.O. 2022 showcased Lambda but in a more controlled, less advanced form compared to later products from competitors
Speed and Latency in Google Products
Google has emphasized speed and latency as crucial product attributes
This includes rigorous internal latency budgets to improve user experience, demonstrated through a 30 % improvement in search latency over five years
Fast and efficient models like Gemini on TPUs reflect Google’s strategy to combine capability with speed
Future of Search and Personal Agents
Search is evolving with AI, incorporating features to handle more complex, task-oriented queries
Future interfaces might integrate personal agents capable of managing various tasks, transforming traditional search methods
Google envisions search evolving into a manager of tasks, with agents enhancing how users interact with information
The AI Race and Product Strategy
In the competitive AI landscape of 2026, Google leverages its infrastructure, models, and multi-product ecosystem to maintain a leading position. Investments in TPUs and vertical integration enable rapid advancements
Despite external narratives, Google’s robust internal capabilities and cohesive strategy ensure it remains at the forefront of AI innovation
CapEx and the Growth of AI Economy
Google’s massive CapEx investments, rising to $180 billion, reflect its commitment to AI infrastructure
Supply constraints like wafer capacity and permitting challenge expansion
However, the growing demand across Google’s platforms indicates significant market potential. AI's impact on the economy, driven by productivity gains, could mirror past technological shifts, contributing substantially to GDP growth
Staying Connected to Products
Google prioritizes using its products extensively, fostering an culture of "dogfooding"
Feedback from platforms like X and internal tools like anti-gravity emphasizes continuous improvement
These practices ensure the leadership remains attuned to user experiences and challenges, aiding in agile responses to product issues and innovations
Preparing for Future Challenges and AGI
While public perception may vary, Google has long been invested in AI's transformative potential, guided by a blend of optimism and rigorous research
Balancing innovation with responsible development, the company adapts to rapid advancements while preparing for AGI’s broader societal implications
Overcoming Physical and Regulatory Constraints
Constructing AI infrastructure faces physical constraints such as wafer production and permitting processes
Still, efforts to expedite construction and regulatory approvals are critical
Google's approach emphasizes leveraging technology, regulatory engagement, and strategic planning to overcome these bottlenecks, ensuring sustained AI advancements
The development of Transformers was driven by product needs, such as improving translation and speech recognition for large user bases
Google's use of TPUs was to manage the massive demand for AI inference tasks
Transformers like BERT significantly improved search quality, a factor meticulously measured by Google
Teams also built and productized Lambda, showcasing Google's proactive approach to AI deployment
ChatGPT and Lambda’s Early Versions
Lambda can be seen as an early version of conversational AI products like ChatGPT. Internal versions faced challenges like being overly toxic, and Google had high standards for search quality, delaying broader releases
Google's AI Test Kitchen at Google I.O. 2022 showcased Lambda but in a more controlled, less advanced form compared to later products from competitors
Speed and Latency in Google Products
Google has emphasized speed and latency as crucial product attributes
This includes rigorous internal latency budgets to improve user experience, demonstrated through a 30 % improvement in search latency over five years
Fast and efficient models like Gemini on TPUs reflect Google’s strategy to combine capability with speed
Future of Search and Personal Agents
Search is evolving with AI, incorporating features to handle more complex, task-oriented queries
Future interfaces might integrate personal agents capable of managing various tasks, transforming traditional search methods
Google envisions search evolving into a manager of tasks, with agents enhancing how users interact with information
The AI Race and Product Strategy
In the competitive AI landscape of 2026, Google leverages its infrastructure, models, and multi-product ecosystem to maintain a leading position. Investments in TPUs and vertical integration enable rapid advancements
Despite external narratives, Google’s robust internal capabilities and cohesive strategy ensure it remains at the forefront of AI innovation
CapEx and the Growth of AI Economy
Google’s massive CapEx investments, rising to $180 billion, reflect its commitment to AI infrastructure
Supply constraints like wafer capacity and permitting challenge expansion
However, the growing demand across Google’s platforms indicates significant market potential. AI's impact on the economy, driven by productivity gains, could mirror past technological shifts, contributing substantially to GDP growth
Staying Connected to Products
Google prioritizes using its products extensively, fostering an culture of "dogfooding"
Feedback from platforms like X and internal tools like anti-gravity emphasizes continuous improvement
These practices ensure the leadership remains attuned to user experiences and challenges, aiding in agile responses to product issues and innovations
Preparing for Future Challenges and AGI
While public perception may vary, Google has long been invested in AI's transformative potential, guided by a blend of optimism and rigorous research
Balancing innovation with responsible development, the company adapts to rapid advancements while preparing for AGI’s broader societal implications
Overcoming Physical and Regulatory Constraints
Constructing AI infrastructure faces physical constraints such as wafer production and permitting processes
Still, efforts to expedite construction and regulatory approvals are critical
Google's approach emphasizes leveraging technology, regulatory engagement, and strategic planning to overcome these bottlenecks, ensuring sustained AI advancements
Key Concepts and Definitions
- World Models: Critical for the next AI revolution, offering an approach that addresses the limitations of current AI techniques in dealing with real-world, high-dimensional data
- Moravec’s Paradox: Tasks that are complex for humans (like playing chess) are easy for computers, while tasks that are simple for humans (like walking) are hard for computers
- AGI (Artificial General Intelligence): The idea of a single AI possessing the ability to perform any intellectual task that a human can
The speaker argues it is a flawed concept
- Self-Supervised Learning: Involves training models by having them predict parts of their input data, such as filling in missing words in a sentence
- Energy-Based Models: A framework for capturing dependencies between variables through energy or cost functions
- Hierarchical Planning: A process by which complex plans are broken down into simpler, more manageable sub-tasks
Human and Machine Learning Comparison
Humans and animals can learn new tasks quickly with few trials due to common sense and an understanding of physical properties like object permanence and gravity
Machines, however, require vast amounts of data and still struggle with real-world tasks due to the lack of grounding in physical experiences
Challenges in AI
Modern AI techniques such as those used in language models don't handle continuous, high-dimensional, noisy data well, which is necessary for understanding and interacting with the real world
A serious gap exists between human intelligence and current machine learning capabilities
Case Study: Self-Driving Cars
Humans can learn to drive with a few hours of practice, whereas AI requires millions of hours of training data and still falls short of human reliability
This highlights the limitations of AI in mimicking human tasks in real-world scenarios
Philosophical Insights
Jean Piaget's views on intelligence emphasize adaptability and learning new tasks with minimal prior knowledge
Intelligence is not just accumulated knowledge or skills, but the ability to adapt to new and unforeseen challenges
Self-Supervised Learning and Limitations
Language models using self-supervised learning have been successful, but similar techniques applied to video prediction face difficulties due to the vast number of possible future states in a video frame
Representations learned through generative models are often not rich enough for complex tasks
Joint Embedding Predictive Architectures (JEPA)
A method that avoids generating pixel-level predictions and instead works in abstract representation space
This approach can lead to more accurate predictions by eliminating uninformative details
Hierarchical Planning and World Models
Humans and animals plan actions hierarchically, dividing tasks into sub-goals
This is an unsolved problem in AI, particularly for creating systems that can make long-term plans and adapt in real-time
Practical Applications
The speaker advises against focusing on video generation or LLMs for real-world AI
Instead, efforts should be directed towards building world models that can handle high-dimensional, continuous, and noisy data for practical applications like controlling industrial processes and robotics
Future Directions and Recommendations
- Focus on world models that understand and predict actions in abstract space rather than generating detailed predictions
- Minimize the use of reinforcement learning due to its inefficiency and instead rely on learning through observation and self-supervised methods
- Develop energy-based models and regularized methods for ensuring systems maintain useful representations without collapsing into trivial solutions
- Emphasize the importance of hierarchical planning to make AI systems more adaptive and capable of handling real-world situations effectively
Conclusion
Current machine learning paradigms have significant limitations when compared to the learning capabilities of humans
- World Models: Critical for the next AI revolution, offering an approach that addresses the limitations of current AI techniques in dealing with real-world, high-dimensional data
- Moravec’s Paradox: Tasks that are complex for humans (like playing chess) are easy for computers, while tasks that are simple for humans (like walking) are hard for computers
- AGI (Artificial General Intelligence): The idea of a single AI possessing the ability to perform any intellectual task that a human can
The speaker argues it is a flawed concept
- Self-Supervised Learning: Involves training models by having them predict parts of their input data, such as filling in missing words in a sentence
- Energy-Based Models: A framework for capturing dependencies between variables through energy or cost functions
- Hierarchical Planning: A process by which complex plans are broken down into simpler, more manageable sub-tasks
Human and Machine Learning Comparison
Humans and animals can learn new tasks quickly with few trials due to common sense and an understanding of physical properties like object permanence and gravity
Machines, however, require vast amounts of data and still struggle with real-world tasks due to the lack of grounding in physical experiences
Challenges in AI
Modern AI techniques such as those used in language models don't handle continuous, high-dimensional, noisy data well, which is necessary for understanding and interacting with the real world
A serious gap exists between human intelligence and current machine learning capabilities
Case Study: Self-Driving Cars
Humans can learn to drive with a few hours of practice, whereas AI requires millions of hours of training data and still falls short of human reliability
This highlights the limitations of AI in mimicking human tasks in real-world scenarios
Philosophical Insights
Jean Piaget's views on intelligence emphasize adaptability and learning new tasks with minimal prior knowledge
Intelligence is not just accumulated knowledge or skills, but the ability to adapt to new and unforeseen challenges
Self-Supervised Learning and Limitations
Language models using self-supervised learning have been successful, but similar techniques applied to video prediction face difficulties due to the vast number of possible future states in a video frame
Representations learned through generative models are often not rich enough for complex tasks
Joint Embedding Predictive Architectures (JEPA)
A method that avoids generating pixel-level predictions and instead works in abstract representation space
This approach can lead to more accurate predictions by eliminating uninformative details
Hierarchical Planning and World Models
Humans and animals plan actions hierarchically, dividing tasks into sub-goals
This is an unsolved problem in AI, particularly for creating systems that can make long-term plans and adapt in real-time
Practical Applications
The speaker advises against focusing on video generation or LLMs for real-world AI
Instead, efforts should be directed towards building world models that can handle high-dimensional, continuous, and noisy data for practical applications like controlling industrial processes and robotics
Future Directions and Recommendations
- Focus on world models that understand and predict actions in abstract space rather than generating detailed predictions
- Minimize the use of reinforcement learning due to its inefficiency and instead rely on learning through observation and self-supervised methods
- Develop energy-based models and regularized methods for ensuring systems maintain useful representations without collapsing into trivial solutions
- Emphasize the importance of hierarchical planning to make AI systems more adaptive and capable of handling real-world situations effectively
Conclusion
Current machine learning paradigms have significant limitations when compared to the learning capabilities of humans
AML
Key Concepts and Definitions - World Models: Critical for the next AI revolution, offering an approach that addresses the limitations of current AI techniques in dealing with real-world, high-dimensional data - Moravec’s Paradox: Tasks that are complex for…
Future AI advancements require a shift towards grounded intelligence, hierarchical planning, and abstract representation models to bridge the gap between AI and human-like understanding and adaptability
Forwarded from DERK
Фотон можно разделить таким образом, что он порождает большое количество частиц, создавая то, что они описывают как «смесь от нуля до бесконечности»
Вместо обычного чистого разделения на два фотона (как в спонтанном параметрическом нижнем преобразовании) этот процесс породит сложный, широкий рой частиц, в экстремальном нелинейном режиме
Это затрагивает фундаментальные вопросы о природе света и материи и в конечном итоге приведёт к новым инструментам для квантовых технологий и изучения физики, которая обычно требует ускорителей частиц
Свет стирает грань между одиночным квантом и многочастичной системой
Вместо обычного чистого разделения на два фотона (как в спонтанном параметрическом нижнем преобразовании) этот процесс породит сложный, широкий рой частиц, в экстремальном нелинейном режиме
Это затрагивает фундаментальные вопросы о природе света и материи и в конечном итоге приведёт к новым инструментам для квантовых технологий и изучения физики, которая обычно требует ускорителей частиц
Свет стирает грань между одиночным квантом и многочастичной системой
Transformation of the Internet
Agents are transforming the way we interact with the internet, particularly among developers who are adopting agentic workflows
The expectation is for agents to become integral to our web usage, facilitating tasks while ensuring user control and transparency
Value of Agents
Agents are expected to handle mundane or complex real-world tasks, such as renewing DMV licenses, allowing users to engage in more meaningful activities
It is crucial to build trust and transparency into these systems to ensure their safe and effective use
Trust and Security
Building trust in agents is akin to building trust in technologies like Waymo; it’s a shared journey dependent on demonstrating safety and value over time
Google’s Gemini Spark, for instance, is designed to integrate closely with existing first-party services to achieve this
Connection with Information
Despite agent-mediated interactions, people will continue to seek direct connections with content, particularly in areas like shopping and news
The balance lies in providing both curated experiences and the joy of exploration
Cybersecurity
Google has a longstanding commitment to cybersecurity, leveraging agentic workflows to detect and patch vulnerabilities
The company’s tools, such as CodeMender, are aimed at real-time monitoring and vulnerability management
A collaborative industry approach is critical for advancing cybersecurity
Model Deployment Strategies
The deployment of AI models, particularly those with significant capabilities like Mythos, necessitates a responsible approach, sometimes in collaboration with governments
It’s crucial to balance frontier advancements with widespread accessibility while thinking about security implications
Open Source Models
Google supports open source initiatives and believes in a balanced approach between open and closed source models
The focus is on ensuring that efficient, capable models are widely accessible, recognizing that the pace of innovation may sometimes favor closed systems
Competition and Innovation
Google’s strategy includes both pushing the frontier with powerful models and ensuring cost-effective, efficient models like the Flash class
This dual approach addresses different market needs from cutting-edge developments to everyday business operations
Compute Challenges
Google faces ongoing challenges in balancing the demand for compute with supply
This involves making strategic trade-offs and continually addressing bottlenecks in areas like data center construction, power needs, and system components
Long-term Strategy for Compute
While there is high demand for Google’s compute capabilities, the company plans and invests in long-term solutions, leveraging efficient models like 3.5 Flash to maximize accessibility and cost-effectiveness
Conclusion
Google is navigating the complex landscape of AI deployment, cybersecurity, open source contributions, and compute management with a commitment to responsible, effective technology development and deployment
Agents are transforming the way we interact with the internet, particularly among developers who are adopting agentic workflows
The expectation is for agents to become integral to our web usage, facilitating tasks while ensuring user control and transparency
Value of Agents
Agents are expected to handle mundane or complex real-world tasks, such as renewing DMV licenses, allowing users to engage in more meaningful activities
It is crucial to build trust and transparency into these systems to ensure their safe and effective use
Trust and Security
Building trust in agents is akin to building trust in technologies like Waymo; it’s a shared journey dependent on demonstrating safety and value over time
Google’s Gemini Spark, for instance, is designed to integrate closely with existing first-party services to achieve this
Connection with Information
Despite agent-mediated interactions, people will continue to seek direct connections with content, particularly in areas like shopping and news
The balance lies in providing both curated experiences and the joy of exploration
Cybersecurity
Google has a longstanding commitment to cybersecurity, leveraging agentic workflows to detect and patch vulnerabilities
The company’s tools, such as CodeMender, are aimed at real-time monitoring and vulnerability management
A collaborative industry approach is critical for advancing cybersecurity
Model Deployment Strategies
The deployment of AI models, particularly those with significant capabilities like Mythos, necessitates a responsible approach, sometimes in collaboration with governments
It’s crucial to balance frontier advancements with widespread accessibility while thinking about security implications
Open Source Models
Google supports open source initiatives and believes in a balanced approach between open and closed source models
The focus is on ensuring that efficient, capable models are widely accessible, recognizing that the pace of innovation may sometimes favor closed systems
Competition and Innovation
Google’s strategy includes both pushing the frontier with powerful models and ensuring cost-effective, efficient models like the Flash class
This dual approach addresses different market needs from cutting-edge developments to everyday business operations
Compute Challenges
Google faces ongoing challenges in balancing the demand for compute with supply
This involves making strategic trade-offs and continually addressing bottlenecks in areas like data center construction, power needs, and system components
Long-term Strategy for Compute
While there is high demand for Google’s compute capabilities, the company plans and invests in long-term solutions, leveraging efficient models like 3.5 Flash to maximize accessibility and cost-effectiveness
Conclusion
Google is navigating the complex landscape of AI deployment, cybersecurity, open source contributions, and compute management with a commitment to responsible, effective technology development and deployment
"Все естественные науки нуждаются в математике
Однако везде, за исключением физики, математика используется только как вспомогательный инструмент...
Роль математики в физической науке гораздо глубже
Дело не только в том, что физика не может обойтись без математического языка и математического аппарата, и даже не в том, что математик позволяет вычеркнуть из списка трудностей вывод однозначных следствий из уравнений, описывающих законы природы
Самое важное, что математика позволяет сформулировать интуитивные идеи и гипотезы в форме, допускающей количественную проверку
Не обсчет фактов, а возможность проверки гипотез, лежащих в основе законов, составляет главную ценность математики как инструмента познания физического мира... "
Леонтий Филиппович Магницкий (Теляшин), русский математик и педагог, автор первого российского учебника математики
Выходец из крестьянской среды, мальчик с юных лет обучился письму, устному счету и любил "мудреные" задачи
В юношестве работал возчиком рыбы для монахов Иосифо-Волоколамского монастыря, но затем был переведен в чтецы за незаурядные познания в науках. Однажды Теляшину повезло встретиться с Петром I, который был так поражен эрудицией молодого человека, что "жаловал" ему фамилию Магницкий, в знак того, что как "магнит привлекает к себе железо, так он природными и самообразованными способностями своими обратил внимание на себя»
В 1701 году по личному указу Петра I Магницкий был направлен на службу в Навигатскую школу, расположенную в Сухаревой башне в Москве, где сначала будет помогать в преподавании, потом станет старшим учителем, а затем - руководителем
Дворянское звание Магницкому было пожаловано уже через три года службы в Школе - в 1704 году - в том числе за выпуск учебника
"Арифметика, сиречь наука вычислительная" выходит в 1703 году после двухлетней практической проверки, она издается на Печатном дворе в Москве тиражом 2.400 экземпляров
Труд Леонтия Филипповича не был переводным, аналогов учебника в то время не существовало
Это была уникальная книга
Учебник содержит более 600 страниц и включает в себя как самые начала - таблицу сложения и умножения десятичных чисел, так и приложения математики к навигационным наукам
Она удивительно красива с педагогической точки зрения: в каждом из вышеперечисленных разделов сначала давался простой конкретный пример, а затем общее правило, которое в дальнейшем закреплялось большим количеством задач практического содержания
«Арифметика» Магницкого 50 лет оставалась единственным учебником для школ и в течение 100 лет оказывал влияние на математическое образование в России
Русская математическая литература не знает другой книги, которая имела бы такое большое историческое значение и влияние
«Арифметика» стала отражением прогрессивных начал петровского времени
Магницкому удалось превратить свою книгу в своеобразную энциклопедию математических знаний, крайне необходимых для удовлетворения практических потребностей развивающегося государства
Выходец из крестьянской среды, мальчик с юных лет обучился письму, устному счету и любил "мудреные" задачи
В юношестве работал возчиком рыбы для монахов Иосифо-Волоколамского монастыря, но затем был переведен в чтецы за незаурядные познания в науках. Однажды Теляшину повезло встретиться с Петром I, который был так поражен эрудицией молодого человека, что "жаловал" ему фамилию Магницкий, в знак того, что как "магнит привлекает к себе железо, так он природными и самообразованными способностями своими обратил внимание на себя»
В 1701 году по личному указу Петра I Магницкий был направлен на службу в Навигатскую школу, расположенную в Сухаревой башне в Москве, где сначала будет помогать в преподавании, потом станет старшим учителем, а затем - руководителем
Дворянское звание Магницкому было пожаловано уже через три года службы в Школе - в 1704 году - в том числе за выпуск учебника
"Арифметика, сиречь наука вычислительная" выходит в 1703 году после двухлетней практической проверки, она издается на Печатном дворе в Москве тиражом 2.400 экземпляров
Труд Леонтия Филипповича не был переводным, аналогов учебника в то время не существовало
Это была уникальная книга
Учебник содержит более 600 страниц и включает в себя как самые начала - таблицу сложения и умножения десятичных чисел, так и приложения математики к навигационным наукам
Она удивительно красива с педагогической точки зрения: в каждом из вышеперечисленных разделов сначала давался простой конкретный пример, а затем общее правило, которое в дальнейшем закреплялось большим количеством задач практического содержания
«Арифметика» Магницкого 50 лет оставалась единственным учебником для школ и в течение 100 лет оказывал влияние на математическое образование в России
Русская математическая литература не знает другой книги, которая имела бы такое большое историческое значение и влияние
«Арифметика» стала отражением прогрессивных начал петровского времени
Магницкому удалось превратить свою книгу в своеобразную энциклопедию математических знаний, крайне необходимых для удовлетворения практических потребностей развивающегося государства
Neo Research протестировала китайские ИИ-модели на «осведомлённость об оценке» — способность понимать, что тебя проверяют, и вести себя соответственно
Kimi K2.6 от Moonshot AI справилась в 60 % случаев, GLM 5.1 от Zhipu — в 39 %
Для сравнения, Claude 4.5 Opus набрал почти 80 % — это не хорошая новость, а иллюстрация того, насколько глубока проблема
Модель, которая «притворяется» безопасной на проверке, опаснее той, которую ловят на нарушениях: тесты перестают что-либо показывать
Это разрушает логику регуляторных режимов в Китае и на Западе — они построены на допущении, что поведение на тестах равно поведению в реальности
DeepSeek V4 Pro вдобавок оказался уязвим к джейлбрейку трёхлетней давности
Kimi K2.6 от Moonshot AI справилась в 60 % случаев, GLM 5.1 от Zhipu — в 39 %
Для сравнения, Claude 4.5 Opus набрал почти 80 % — это не хорошая новость, а иллюстрация того, насколько глубока проблема
Модель, которая «притворяется» безопасной на проверке, опаснее той, которую ловят на нарушениях: тесты перестают что-либо показывать
Это разрушает логику регуляторных режимов в Китае и на Западе — они построены на допущении, что поведение на тестах равно поведению в реальности
DeepSeek V4 Pro вдобавок оказался уязвим к джейлбрейку трёхлетней давности
Начинается ежегодный марафон по чтению статей с ICML 2026, которая в этом году пройдет 6-11 июля
Попадается много инженерных статей с практическими результатами.
Среди таких – работа Яндекса и ШАДа. Она получила статус Spotlight: это статьи, которым программный комитет дал самые высокие оценки. Таких работ на конференции всего 2.2 % от всех поданных заявок
В статье исследователи из Yandex Research, команд ML-инфраструктуры и инференса и студенты ШАД работали над ускорением Graph Neural Networks
Дело в том, что вычисления на графах неэффективно ложаться на парадигму GPU-вычислений, данные лежат в памяти неравномерно, и поэтому видеокарта значительную часть времени ждет загрузки данных вместо того, чтобы выполнять вычисления, которые представляют собой достаточно простые операции
Как раз из-за этого скорость работы ограничена чтением и записью данных, и грамотная работа с GPU-памятью — это главный источник ускорения таких операций
Авторы атакуют именно это узкое место, фактически минимизируя лишние перемещения данных между памятью и вычислительными блоками GPU
Также авторы переносят часть алгоритмов на тензорные ядра, что позволяет ускорится на графах с большой плотностью
Они разработали новые готовые GPU-кернелы для популярных семейств графовых нейросетей, и добились потрясающего ускорения в 3–10 раз в зависимости от архитектуры
Потребление памяти в отдельных сценариях сокращается более чем на порядок
Поздравляем команду с заслуженным Spotlight и прекрасной работой!
Статья уже доступна на arXiv, а код вот здесь
Попадается много инженерных статей с практическими результатами.
Среди таких – работа Яндекса и ШАДа. Она получила статус Spotlight: это статьи, которым программный комитет дал самые высокие оценки. Таких работ на конференции всего 2.2 % от всех поданных заявок
В статье исследователи из Yandex Research, команд ML-инфраструктуры и инференса и студенты ШАД работали над ускорением Graph Neural Networks
Дело в том, что вычисления на графах неэффективно ложаться на парадигму GPU-вычислений, данные лежат в памяти неравномерно, и поэтому видеокарта значительную часть времени ждет загрузки данных вместо того, чтобы выполнять вычисления, которые представляют собой достаточно простые операции
Как раз из-за этого скорость работы ограничена чтением и записью данных, и грамотная работа с GPU-памятью — это главный источник ускорения таких операций
Авторы атакуют именно это узкое место, фактически минимизируя лишние перемещения данных между памятью и вычислительными блоками GPU
Также авторы переносят часть алгоритмов на тензорные ядра, что позволяет ускорится на графах с большой плотностью
Они разработали новые готовые GPU-кернелы для популярных семейств графовых нейросетей, и добились потрясающего ускорения в 3–10 раз в зависимости от архитектуры
Потребление памяти в отдельных сценариях сокращается более чем на порядок
Поздравляем команду с заслуженным Spotlight и прекрасной работой!
Статья уже доступна на arXiv, а код вот здесь