AML
Key Concepts and Definitions - World Models: Critical for the next AI revolution, offering an approach that addresses the limitations of current AI techniques in dealing with real-world, high-dimensional data - Moravec’s Paradox: Tasks that are complex for…
Future AI advancements require a shift towards grounded intelligence, hierarchical planning, and abstract representation models to bridge the gap between AI and human-like understanding and adaptability
Forwarded from DERK
Фотон можно разделить таким образом, что он порождает большое количество частиц, создавая то, что они описывают как «смесь от нуля до бесконечности»
Вместо обычного чистого разделения на два фотона (как в спонтанном параметрическом нижнем преобразовании) этот процесс породит сложный, широкий рой частиц, в экстремальном нелинейном режиме
Это затрагивает фундаментальные вопросы о природе света и материи и в конечном итоге приведёт к новым инструментам для квантовых технологий и изучения физики, которая обычно требует ускорителей частиц
Свет стирает грань между одиночным квантом и многочастичной системой
Вместо обычного чистого разделения на два фотона (как в спонтанном параметрическом нижнем преобразовании) этот процесс породит сложный, широкий рой частиц, в экстремальном нелинейном режиме
Это затрагивает фундаментальные вопросы о природе света и материи и в конечном итоге приведёт к новым инструментам для квантовых технологий и изучения физики, которая обычно требует ускорителей частиц
Свет стирает грань между одиночным квантом и многочастичной системой
Transformation of the Internet
Agents are transforming the way we interact with the internet, particularly among developers who are adopting agentic workflows
The expectation is for agents to become integral to our web usage, facilitating tasks while ensuring user control and transparency
Value of Agents
Agents are expected to handle mundane or complex real-world tasks, such as renewing DMV licenses, allowing users to engage in more meaningful activities
It is crucial to build trust and transparency into these systems to ensure their safe and effective use
Trust and Security
Building trust in agents is akin to building trust in technologies like Waymo; it’s a shared journey dependent on demonstrating safety and value over time
Google’s Gemini Spark, for instance, is designed to integrate closely with existing first-party services to achieve this
Connection with Information
Despite agent-mediated interactions, people will continue to seek direct connections with content, particularly in areas like shopping and news
The balance lies in providing both curated experiences and the joy of exploration
Cybersecurity
Google has a longstanding commitment to cybersecurity, leveraging agentic workflows to detect and patch vulnerabilities
The company’s tools, such as CodeMender, are aimed at real-time monitoring and vulnerability management
A collaborative industry approach is critical for advancing cybersecurity
Model Deployment Strategies
The deployment of AI models, particularly those with significant capabilities like Mythos, necessitates a responsible approach, sometimes in collaboration with governments
It’s crucial to balance frontier advancements with widespread accessibility while thinking about security implications
Open Source Models
Google supports open source initiatives and believes in a balanced approach between open and closed source models
The focus is on ensuring that efficient, capable models are widely accessible, recognizing that the pace of innovation may sometimes favor closed systems
Competition and Innovation
Google’s strategy includes both pushing the frontier with powerful models and ensuring cost-effective, efficient models like the Flash class
This dual approach addresses different market needs from cutting-edge developments to everyday business operations
Compute Challenges
Google faces ongoing challenges in balancing the demand for compute with supply
This involves making strategic trade-offs and continually addressing bottlenecks in areas like data center construction, power needs, and system components
Long-term Strategy for Compute
While there is high demand for Google’s compute capabilities, the company plans and invests in long-term solutions, leveraging efficient models like 3.5 Flash to maximize accessibility and cost-effectiveness
Conclusion
Google is navigating the complex landscape of AI deployment, cybersecurity, open source contributions, and compute management with a commitment to responsible, effective technology development and deployment
Agents are transforming the way we interact with the internet, particularly among developers who are adopting agentic workflows
The expectation is for agents to become integral to our web usage, facilitating tasks while ensuring user control and transparency
Value of Agents
Agents are expected to handle mundane or complex real-world tasks, such as renewing DMV licenses, allowing users to engage in more meaningful activities
It is crucial to build trust and transparency into these systems to ensure their safe and effective use
Trust and Security
Building trust in agents is akin to building trust in technologies like Waymo; it’s a shared journey dependent on demonstrating safety and value over time
Google’s Gemini Spark, for instance, is designed to integrate closely with existing first-party services to achieve this
Connection with Information
Despite agent-mediated interactions, people will continue to seek direct connections with content, particularly in areas like shopping and news
The balance lies in providing both curated experiences and the joy of exploration
Cybersecurity
Google has a longstanding commitment to cybersecurity, leveraging agentic workflows to detect and patch vulnerabilities
The company’s tools, such as CodeMender, are aimed at real-time monitoring and vulnerability management
A collaborative industry approach is critical for advancing cybersecurity
Model Deployment Strategies
The deployment of AI models, particularly those with significant capabilities like Mythos, necessitates a responsible approach, sometimes in collaboration with governments
It’s crucial to balance frontier advancements with widespread accessibility while thinking about security implications
Open Source Models
Google supports open source initiatives and believes in a balanced approach between open and closed source models
The focus is on ensuring that efficient, capable models are widely accessible, recognizing that the pace of innovation may sometimes favor closed systems
Competition and Innovation
Google’s strategy includes both pushing the frontier with powerful models and ensuring cost-effective, efficient models like the Flash class
This dual approach addresses different market needs from cutting-edge developments to everyday business operations
Compute Challenges
Google faces ongoing challenges in balancing the demand for compute with supply
This involves making strategic trade-offs and continually addressing bottlenecks in areas like data center construction, power needs, and system components
Long-term Strategy for Compute
While there is high demand for Google’s compute capabilities, the company plans and invests in long-term solutions, leveraging efficient models like 3.5 Flash to maximize accessibility and cost-effectiveness
Conclusion
Google is navigating the complex landscape of AI deployment, cybersecurity, open source contributions, and compute management with a commitment to responsible, effective technology development and deployment
"Все естественные науки нуждаются в математике
Однако везде, за исключением физики, математика используется только как вспомогательный инструмент...
Роль математики в физической науке гораздо глубже
Дело не только в том, что физика не может обойтись без математического языка и математического аппарата, и даже не в том, что математик позволяет вычеркнуть из списка трудностей вывод однозначных следствий из уравнений, описывающих законы природы
Самое важное, что математика позволяет сформулировать интуитивные идеи и гипотезы в форме, допускающей количественную проверку
Не обсчет фактов, а возможность проверки гипотез, лежащих в основе законов, составляет главную ценность математики как инструмента познания физического мира... "
Леонтий Филиппович Магницкий (Теляшин), русский математик и педагог, автор первого российского учебника математики
Выходец из крестьянской среды, мальчик с юных лет обучился письму, устному счету и любил "мудреные" задачи
В юношестве работал возчиком рыбы для монахов Иосифо-Волоколамского монастыря, но затем был переведен в чтецы за незаурядные познания в науках. Однажды Теляшину повезло встретиться с Петром I, который был так поражен эрудицией молодого человека, что "жаловал" ему фамилию Магницкий, в знак того, что как "магнит привлекает к себе железо, так он природными и самообразованными способностями своими обратил внимание на себя»
В 1701 году по личному указу Петра I Магницкий был направлен на службу в Навигатскую школу, расположенную в Сухаревой башне в Москве, где сначала будет помогать в преподавании, потом станет старшим учителем, а затем - руководителем
Дворянское звание Магницкому было пожаловано уже через три года службы в Школе - в 1704 году - в том числе за выпуск учебника
"Арифметика, сиречь наука вычислительная" выходит в 1703 году после двухлетней практической проверки, она издается на Печатном дворе в Москве тиражом 2.400 экземпляров
Труд Леонтия Филипповича не был переводным, аналогов учебника в то время не существовало
Это была уникальная книга
Учебник содержит более 600 страниц и включает в себя как самые начала - таблицу сложения и умножения десятичных чисел, так и приложения математики к навигационным наукам
Она удивительно красива с педагогической точки зрения: в каждом из вышеперечисленных разделов сначала давался простой конкретный пример, а затем общее правило, которое в дальнейшем закреплялось большим количеством задач практического содержания
«Арифметика» Магницкого 50 лет оставалась единственным учебником для школ и в течение 100 лет оказывал влияние на математическое образование в России
Русская математическая литература не знает другой книги, которая имела бы такое большое историческое значение и влияние
«Арифметика» стала отражением прогрессивных начал петровского времени
Магницкому удалось превратить свою книгу в своеобразную энциклопедию математических знаний, крайне необходимых для удовлетворения практических потребностей развивающегося государства
Выходец из крестьянской среды, мальчик с юных лет обучился письму, устному счету и любил "мудреные" задачи
В юношестве работал возчиком рыбы для монахов Иосифо-Волоколамского монастыря, но затем был переведен в чтецы за незаурядные познания в науках. Однажды Теляшину повезло встретиться с Петром I, который был так поражен эрудицией молодого человека, что "жаловал" ему фамилию Магницкий, в знак того, что как "магнит привлекает к себе железо, так он природными и самообразованными способностями своими обратил внимание на себя»
В 1701 году по личному указу Петра I Магницкий был направлен на службу в Навигатскую школу, расположенную в Сухаревой башне в Москве, где сначала будет помогать в преподавании, потом станет старшим учителем, а затем - руководителем
Дворянское звание Магницкому было пожаловано уже через три года службы в Школе - в 1704 году - в том числе за выпуск учебника
"Арифметика, сиречь наука вычислительная" выходит в 1703 году после двухлетней практической проверки, она издается на Печатном дворе в Москве тиражом 2.400 экземпляров
Труд Леонтия Филипповича не был переводным, аналогов учебника в то время не существовало
Это была уникальная книга
Учебник содержит более 600 страниц и включает в себя как самые начала - таблицу сложения и умножения десятичных чисел, так и приложения математики к навигационным наукам
Она удивительно красива с педагогической точки зрения: в каждом из вышеперечисленных разделов сначала давался простой конкретный пример, а затем общее правило, которое в дальнейшем закреплялось большим количеством задач практического содержания
«Арифметика» Магницкого 50 лет оставалась единственным учебником для школ и в течение 100 лет оказывал влияние на математическое образование в России
Русская математическая литература не знает другой книги, которая имела бы такое большое историческое значение и влияние
«Арифметика» стала отражением прогрессивных начал петровского времени
Магницкому удалось превратить свою книгу в своеобразную энциклопедию математических знаний, крайне необходимых для удовлетворения практических потребностей развивающегося государства
Neo Research протестировала китайские ИИ-модели на «осведомлённость об оценке» — способность понимать, что тебя проверяют, и вести себя соответственно
Kimi K2.6 от Moonshot AI справилась в 60 % случаев, GLM 5.1 от Zhipu — в 39 %
Для сравнения, Claude 4.5 Opus набрал почти 80 % — это не хорошая новость, а иллюстрация того, насколько глубока проблема
Модель, которая «притворяется» безопасной на проверке, опаснее той, которую ловят на нарушениях: тесты перестают что-либо показывать
Это разрушает логику регуляторных режимов в Китае и на Западе — они построены на допущении, что поведение на тестах равно поведению в реальности
DeepSeek V4 Pro вдобавок оказался уязвим к джейлбрейку трёхлетней давности
Kimi K2.6 от Moonshot AI справилась в 60 % случаев, GLM 5.1 от Zhipu — в 39 %
Для сравнения, Claude 4.5 Opus набрал почти 80 % — это не хорошая новость, а иллюстрация того, насколько глубока проблема
Модель, которая «притворяется» безопасной на проверке, опаснее той, которую ловят на нарушениях: тесты перестают что-либо показывать
Это разрушает логику регуляторных режимов в Китае и на Западе — они построены на допущении, что поведение на тестах равно поведению в реальности
DeepSeek V4 Pro вдобавок оказался уязвим к джейлбрейку трёхлетней давности
Начинается ежегодный марафон по чтению статей с ICML 2026, которая в этом году пройдет 6-11 июля
Попадается много инженерных статей с практическими результатами.
Среди таких – работа Яндекса и ШАДа. Она получила статус Spotlight: это статьи, которым программный комитет дал самые высокие оценки. Таких работ на конференции всего 2.2 % от всех поданных заявок
В статье исследователи из Yandex Research, команд ML-инфраструктуры и инференса и студенты ШАД работали над ускорением Graph Neural Networks
Дело в том, что вычисления на графах неэффективно ложаться на парадигму GPU-вычислений, данные лежат в памяти неравномерно, и поэтому видеокарта значительную часть времени ждет загрузки данных вместо того, чтобы выполнять вычисления, которые представляют собой достаточно простые операции
Как раз из-за этого скорость работы ограничена чтением и записью данных, и грамотная работа с GPU-памятью — это главный источник ускорения таких операций
Авторы атакуют именно это узкое место, фактически минимизируя лишние перемещения данных между памятью и вычислительными блоками GPU
Также авторы переносят часть алгоритмов на тензорные ядра, что позволяет ускорится на графах с большой плотностью
Они разработали новые готовые GPU-кернелы для популярных семейств графовых нейросетей, и добились потрясающего ускорения в 3–10 раз в зависимости от архитектуры
Потребление памяти в отдельных сценариях сокращается более чем на порядок
Поздравляем команду с заслуженным Spotlight и прекрасной работой!
Статья уже доступна на arXiv, а код вот здесь
Попадается много инженерных статей с практическими результатами.
Среди таких – работа Яндекса и ШАДа. Она получила статус Spotlight: это статьи, которым программный комитет дал самые высокие оценки. Таких работ на конференции всего 2.2 % от всех поданных заявок
В статье исследователи из Yandex Research, команд ML-инфраструктуры и инференса и студенты ШАД работали над ускорением Graph Neural Networks
Дело в том, что вычисления на графах неэффективно ложаться на парадигму GPU-вычислений, данные лежат в памяти неравномерно, и поэтому видеокарта значительную часть времени ждет загрузки данных вместо того, чтобы выполнять вычисления, которые представляют собой достаточно простые операции
Как раз из-за этого скорость работы ограничена чтением и записью данных, и грамотная работа с GPU-памятью — это главный источник ускорения таких операций
Авторы атакуют именно это узкое место, фактически минимизируя лишние перемещения данных между памятью и вычислительными блоками GPU
Также авторы переносят часть алгоритмов на тензорные ядра, что позволяет ускорится на графах с большой плотностью
Они разработали новые готовые GPU-кернелы для популярных семейств графовых нейросетей, и добились потрясающего ускорения в 3–10 раз в зависимости от архитектуры
Потребление памяти в отдельных сценариях сокращается более чем на порядок
Поздравляем команду с заслуженным Spotlight и прекрасной работой!
Статья уже доступна на arXiv, а код вот здесь
Знание — это геометрия
Рассуждение — это перемещение по геометрии
Интеллект — это приобретение и стабилизация эффективных траекторий по этой геометрии
Рассуждение — это перемещение по геометрии
Интеллект — это приобретение и стабилизация эффективных траекторий по этой геометрии
Anthropic's CEO just went on record saying the people who tested their most powerful AI model came back asking them not to release it, calling it a super weapon that should require a license to operate
Here's what it actually did in testing
Against Firefox alone, it found 271 vulnerabilities and turned 181 of them into working exploits, the previous best model managed 2 under identical conditions
It hit a 72 % exploit success rate, autonomously chained vulnerabilities into multi step attack paths and found a 17-year-old remote code execution flaw that gave unauthenticated attackers root access
99 % of what it discovered is still unpatched and the oldest flaw had been sitting in production software for 27 years without any human researcher ever finding it
The part that makes this a different category of concern is not the vulnerability discovery, scanners have done that for years
Mythos doesn’t just find the flaw, it turns it into a working exploit automatically, at scale, and faster than patches can ship
Anthropic's red team rated Mythos at more than five times the cybersecurity capability of their prior generation, which had itself already autonomously discovered over 500 high-severity zero-days
The external world caught up fast
In May, Google's Threat Intelligence Group confirmed the first AI crafted zero day found in active use in the wild, a cybercrime group had used an AI model to find and weaponize a 2FA bypass
The time between a vulnerability being found and being exploited has collapsed from 2.3 years in 2019 to under one day in 2026
Anthropic's response was to not release Mythos publicly at all, and instead launch Project Glasswing, a controlled access program with roughly 52 vetted organizations including Amazon, Apple, Google, Microsoft, and CrowdStrike, backed by $100 million in usage credits, restricted entirely to defensive use
The logic is to give defenders a head start before equivalent offensive capabilities show up at labs with fewer guardrails and these capabilities are coming regardless
Anthropic just decided that buying defenders more time was worth more than the commercial upside of a full release
Here's what it actually did in testing
Against Firefox alone, it found 271 vulnerabilities and turned 181 of them into working exploits, the previous best model managed 2 under identical conditions
It hit a 72 % exploit success rate, autonomously chained vulnerabilities into multi step attack paths and found a 17-year-old remote code execution flaw that gave unauthenticated attackers root access
99 % of what it discovered is still unpatched and the oldest flaw had been sitting in production software for 27 years without any human researcher ever finding it
The part that makes this a different category of concern is not the vulnerability discovery, scanners have done that for years
Mythos doesn’t just find the flaw, it turns it into a working exploit automatically, at scale, and faster than patches can ship
Anthropic's red team rated Mythos at more than five times the cybersecurity capability of their prior generation, which had itself already autonomously discovered over 500 high-severity zero-days
The external world caught up fast
In May, Google's Threat Intelligence Group confirmed the first AI crafted zero day found in active use in the wild, a cybercrime group had used an AI model to find and weaponize a 2FA bypass
The time between a vulnerability being found and being exploited has collapsed from 2.3 years in 2019 to under one day in 2026
Anthropic's response was to not release Mythos publicly at all, and instead launch Project Glasswing, a controlled access program with roughly 52 vetted organizations including Amazon, Apple, Google, Microsoft, and CrowdStrike, backed by $100 million in usage credits, restricted entirely to defensive use
The logic is to give defenders a head start before equivalent offensive capabilities show up at labs with fewer guardrails and these capabilities are coming regardless
Anthropic just decided that buying defenders more time was worth more than the commercial upside of a full release