Forwarded from Институт AIRI
AIRI на ICLR 2026 🔥
23 апреля в Рио-де-Жанейро, Бразилия, стартовала конференция ICLR — одно из важнейших мероприятий в мире машинного обучения. В этом году исследователи AIRI представляют на ней 31 статью:
⚫️ Tighter Performance Theory of FedExProx
⚫️ Unraveling the Complexity of Memory in RL Agents: an Approach for Classification and Evaluation
⚫️ Obfuscated Activations Bypass LLM Latent-Space Defenses
⚫️ A Statistical Learning Perspective on Semi-dual Adversarial Neural Optimal Transport Solvers
⚫️ InfoBridge: Mutual Information estimation via Bridge Matching
⚫️ Birch SGD: A Tree Graph Framework for Local and Asynchronous SGD Methods
⚫️ Locally Subspace-Informed Neural Operators for Efficient Multiscale PDE Solving
⚫️ Curse of Slicing: Why Sliced Mutual Information is a Deceptive Measure of Statistical Dependence
⚫️ Interaction Field Matching: Overcoming Limitations of Electrostatic Models
⚫️ Proving the Limited Scalability of Centralized Distributed Optimization via a New Lower Bound Construction
⚫️ LoRA meets Riemannion: Muon Optimizer for Parametrization-independent Low-Rank Adapters
⚫️ Speech-to-LaTeX: New Models and Datasets for Converting Spoken Equations and Sentences
⚫️ Asynchronous Policy Gradient Aggregation for Efficient Distributed Reinforcement Learning
⚫️ Deep Learning for Subspace Regression
⚫️ Universal Inverse Distillation for Matching Models with Real-Data Supervision (No GANs)
⚫️ Entering the Era of Discrete Diffusion Models: A Benchmark for Schrödinger Bridges and Entropic Optimal Transport
⚫️ GAS: Improving Discretization of Diffusion ODEs via Generalized Adversarial Solver
⚫️ Q-RAG: Long Context Multi-step Retrieval via Value-based Embedder Training
⚫️ MMReD: a Cross-Modal Benchmark for Dense Context Reasoning
⚫️ Logit‑KL Flow Matching: Non‑Autoregressive Text Generation via Sampling‑Hybrid Inference
⚫️ VINTIX II: Decision Pre-Trained Transformer is a Scalable in-Context Reinforcement Learner
⚫️ Modeling the Density of Pixel-level Self-supervised Embeddings for Unsupervised Pathology Segmentation in Medical CT
⚫️ ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL Problems
⚫️ Memory, Benchmark & Robots: A Benchmark for Solving Complex Tasks with Reinforcement Learning
⚫️ Recurrent Action Transformer with Memory
⚫️ Learning of Population Dynamics: Inverse Optimization Meets JKO Scheme
⚫️ GeomMotif: A Benchmark for Arbitrary Geometric Preservation in Protein Generation
⚫️ Zero-Shot Adaptation of Behavioral Foundation Models to Unseen Dynamics
⚫️ cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning
⚫️ HOTA: Hamiltonian framework for Optimal Transport Advection
⚫️ Diffusion & Adversarial Schrödinger Bridges via Iterative Proportional Markovian Fitting
Делимся фотографиями с первых дней конференции📷
P. S. Про воркшопы расскажем отдельно.
#AIRIнаКонфе
23 апреля в Рио-де-Жанейро, Бразилия, стартовала конференция ICLR — одно из важнейших мероприятий в мире машинного обучения. В этом году исследователи AIRI представляют на ней 31 статью:
Делимся фотографиями с первых дней конференции
P. S. Про воркшопы расскажем отдельно.
#AIRIнаКонфе
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11👍2
Forwarded from Неискусственный интеллект (Oleg Salmanov)
ЛеКун и нелекуны. Часть 2 репортажа с ICLR 2026
Если прочесть расписание мероприятий ICLR, можно потеряться в Джанах и Вонах — китайцев на конференции большинство. Но всеобщее внимание привлекал перешедший из бизнеса в академию и заземлившийся в New York University француз Ян ЛеКун. Он активно бродил по постерной сессии и общался с коллегами, при этом у своих постеров (1, 2) про JEPы в разных вариациях стоять оставил соавторов.
У маркерной доски Майкрософта нами был взят русский след и привел сюда:
Уже упомянутые ребята из AIRI привезли на ICLR 31 статью и 17 воркшопных работ в соло и соавторстве с коллегами из Сколтеха, НИУ ВШЭ, МФТИ и МГУ. Яндекс представил 6 статей на основном треке и 1 на воркшопе, а еще повесил на въезде в конгрессцентр баннер с приглашением на свою конференцию 19 сентября в Москве (делаем ставки, приедет ли ЛеКун?) . В коридорах постерных сессий мелькали лица из Сбера, на воркшопах засветились Т-Технологии и ИТМО.
Отобрали немного опенсорса с основного трека:
Метод SwD — снижает вычислительную нагрузку и на порядок ускоряет генерацию изображений в диффузионных моделях — с 2-3 до 0,3–0,4 секунды без потери качества (вау!). Yandex Research и НИУ ВШЭ
В жизни встречаются задачи, для решения которых роботам нужно помнить, где какой-то предмет расположен и что было до того, как его подвинули. AIRI и Физтех представили ELMUR — архитектуру системы управления для роботов и других агентов, которым нужно принимать решения, опираясь на события из далекого прошлого, и рекуррентную модель RATE для офлайн-обучения с подкреплением.
Модель для обучения медицинских алгоритмов сегментации патологий без учителя представили AIRI, Yandex и МГУ.
Фича ICLR — новый и ещё не привычный многим формат статей под названием «блогпост». Вместо перегруженной формулами подачи эти работы раскрывают основную идею, мотивацию и тезисы. Блоги свободны по структуре, часто включают в себя мультимедиа, ориентированы на широкую аудиторию исследователей, а не только на тех, кто глубоко в теме. Главная фишка — наличие в них объяснения не только того, «что сделано», но и того, «почему это важно и как это работает» (наша любимая рубрика!).
Российскими блогерами, прошедшими ревью, в этом году стали Максим Рахуба и команда из ВШЭ с методом ускорения вычислений разложения матриц на GPU, а также Иван Оселедец с Владимиром Фанасковым, безжалостно предлагавшие читателям оставить автограф прямо на их постере (см. фото).
🔤 🔤 задумались о создании аффилиации @Anti_AGI
Внештатный спецкор @anti_agi на ICLR 2026
Если прочесть расписание мероприятий ICLR, можно потеряться в Джанах и Вонах — китайцев на конференции большинство. Но всеобщее внимание привлекал перешедший из бизнеса в академию и заземлившийся в New York University француз Ян ЛеКун. Он активно бродил по постерной сессии и общался с коллегами, при этом у своих постеров (1, 2) про JEPы в разных вариациях стоять оставил соавторов.
У маркерной доски Майкрософта нами был взят русский след и привел сюда:
Уже упомянутые ребята из AIRI привезли на ICLR 31 статью и 17 воркшопных работ в соло и соавторстве с коллегами из Сколтеха, НИУ ВШЭ, МФТИ и МГУ. Яндекс представил 6 статей на основном треке и 1 на воркшопе, а еще повесил на въезде в конгрессцентр баннер с приглашением на свою конференцию 19 сентября в Москве
Отобрали немного опенсорса с основного трека:
Метод SwD — снижает вычислительную нагрузку и на порядок ускоряет генерацию изображений в диффузионных моделях — с 2-3 до 0,3–0,4 секунды без потери качества (вау!). Yandex Research и НИУ ВШЭ
В жизни встречаются задачи, для решения которых роботам нужно помнить, где какой-то предмет расположен и что было до того, как его подвинули. AIRI и Физтех представили ELMUR — архитектуру системы управления для роботов и других агентов, которым нужно принимать решения, опираясь на события из далекого прошлого, и рекуррентную модель RATE для офлайн-обучения с подкреплением.
Модель для обучения медицинских алгоритмов сегментации патологий без учителя представили AIRI, Yandex и МГУ.
Фича ICLR — новый и ещё не привычный многим формат статей под названием «блогпост». Вместо перегруженной формулами подачи эти работы раскрывают основную идею, мотивацию и тезисы. Блоги свободны по структуре, часто включают в себя мультимедиа, ориентированы на широкую аудиторию исследователей, а не только на тех, кто глубоко в теме. Главная фишка — наличие в них объяснения не только того, «что сделано», но и того, «почему это важно и как это работает» (наша любимая рубрика!).
Российскими блогерами, прошедшими ревью, в этом году стали Максим Рахуба и команда из ВШЭ с методом ускорения вычислений разложения матриц на GPU, а также Иван Оселедец с Владимиром Фанасковым, безжалостно предлагавшие читателям оставить автограф прямо на их постере (см. фото).
Внештатный спецкор @anti_agi на ICLR 2026
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9🔥1
Forwarded from Center for Cognitive Modeling
🎓 — Семинар 13. Детектирование неоднозначных инструкций на естественном языке | Дарья Гиталова
В докладе рассматривается проблема неоднозначности инструкций на естественном языке роботу, которая приводит к множественности интерпретаций и потенциальным рискам при исполнении.
Рассмотрим два подхода к детектированию неоднозначности: фреймворк GRICE (Grice’s Robotic Instruction Clarity Evaluation), операционализирующий кооперативный принцип Пола Грайса через нарушение максим Количества, Качества, Отношения и Способа на основе комбинации символических признаков и LLM-оценок, и метод SVC (Semantic Valency Conflict), выявляющий конфликты между конкурирующими семантическими фреймами при неспецифицированных аргументных позициях предиката.
👉🏻 Дата: 30.04.26, четверг в 17:00
📹 Трансляция: ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#семинары #LLM
В докладе рассматривается проблема неоднозначности инструкций на естественном языке роботу, которая приводит к множественности интерпретаций и потенциальным рискам при исполнении.
Рассмотрим два подхода к детектированию неоднозначности: фреймворк GRICE (Grice’s Robotic Instruction Clarity Evaluation), операционализирующий кооперативный принцип Пола Грайса через нарушение максим Количества, Качества, Отношения и Способа на основе комбинации символических признаков и LLM-оценок, и метод SVC (Semantic Valency Conflict), выявляющий конфликты между конкурирующими семантическими фреймами при неспецифицированных аргументных позициях предиката.
👉🏻 Дата: 30.04.26, четверг в 17:00
📹 Трансляция: ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#семинары #LLM
🔥5👍1
Forwarded from Институт AIRI
Исследователи AIRI представили модель, которая может запоминать многое, не увеличивая потребность в вычислениях
Робот часто видит важную информацию задолго до того, как её необходимо использовать. Если система не умеет надёжно хранить и вовремя извлекать данные, ей трудно действовать в сложной и меняющейся среде. Обычные трансформеры решают эту задачу не полностью: одни модели становятся слишком дорогими по вычислениям, другие плохо контролируют, что именно забывается.
В ELMUR каждый слой содержит фиксированное количество слотов памяти, которые параллельно взаимодействуют с основным потоком данных. Система может читать информацию из этих ячеек, когда принимает решение, и записывать туда новые данные. Если память начинает заполняться — обновляются те ячейки, которые использовались реже всего. Это даёт ИИ компактное, но устойчивое хранилище, которое может удерживать важную информацию на протяжении 100 тысяч шагов за пределами обычного окна внимания.
О разработке рассказали на ICLR 2026.
Научная статья | CNews
Робот часто видит важную информацию задолго до того, как её необходимо использовать. Если система не умеет надёжно хранить и вовремя извлекать данные, ей трудно действовать в сложной и меняющейся среде. Обычные трансформеры решают эту задачу не полностью: одни модели становятся слишком дорогими по вычислениям, другие плохо контролируют, что именно забывается.
В ELMUR каждый слой содержит фиксированное количество слотов памяти, которые параллельно взаимодействуют с основным потоком данных. Система может читать информацию из этих ячеек, когда принимает решение, и записывать туда новые данные. Если память начинает заполняться — обновляются те ячейки, которые использовались реже всего. Это даёт ИИ компактное, но устойчивое хранилище, которое может удерживать важную информацию на протяжении 100 тысяч шагов за пределами обычного окна внимания.
О разработке рассказали на ICLR 2026.
Научная статья | CNews
👍8
Forwarded from Center for Cognitive Modeling
🦾 — Продолжается набор в магистратуру ФПМИ МФТИ по искусственному интеллекту и робототехнике!
Поступление проходит по 2 направлениям:
— “Фундаментальные методы искусственного интеллекта” – база ЦКМ, 25 мест
— “Мультимодальный искусственный интеллект”– база Институт AIRI, 10 мест
Для поступления необходимо:
🪼 Заполнить заявку на нашем сайте до 1 июня и пройти собеседование в Центре.
🪼 Подать документы на сайте приёмной комиссии МФТИ и успешно пройти вступительные испытания.
В Центре под руководством ведущих специалистов в своих областях вы сможете заниматься написанием статей на передовые конференции А* (NeurIPS, ICLR, ICML, IJCAI и др.), а также работать над прикладными проектами по тематикам:
🪼 Обучение с подкреплением для задач робототехники (манипуляция, навигация)
🪼 Мультимодальные карты знаний в компьютерном зрении и робототехнике
🪼 Компьютерное зрение для задач робототехники и беспилотного транспорта
🪼 Большие языковые и мультимодальные модели для генерации действий в роботототехнике
🪼 Мультимодальные среды и модели в обучении с подкреплением
🪼 Заполняйте зявку на прохождение собеседования до 1 июня!
Информация для поступающих есть на сайтах ЦКМ и приёмной комиссии.
Поступление проходит по 2 направлениям:
— “Фундаментальные методы искусственного интеллекта” – база ЦКМ, 25 мест
— “Мультимодальный искусственный интеллект”– база Институт AIRI, 10 мест
Для поступления необходимо:
В Центре под руководством ведущих специалистов в своих областях вы сможете заниматься написанием статей на передовые конференции А* (NeurIPS, ICLR, ICML, IJCAI и др.), а также работать над прикладными проектами по тематикам:
Информация для поступающих есть на сайтах ЦКМ и приёмной комиссии.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
Forwarded from Center for Cognitive Modeling
🎓 — Семинар 16. Обобщаемость VLA моделей, выравнивание текстово-визуальных представлений в VLA моделях | Никита Качаев
На семинаре разберёмся, почему VLA-модели после дообучения начинают «забывать», терять фокус и тексто-языковое понимание при обучении на малых робототехнических датасетах, и как метод выравнивания визуальных представлений помогает это исправить. А также на примере результатов на бенчмарке VL-Think посмотрим, насколько хорошо VLA модели усваивают знания из повседневной жизни.
📎Github
👉🏻 Дата: 21.05.26, четверг в 17:00
📹 Трансляция: Youtube или ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#семинары #VLA
На семинаре разберёмся, почему VLA-модели после дообучения начинают «забывать», терять фокус и тексто-языковое понимание при обучении на малых робототехнических датасетах, и как метод выравнивания визуальных представлений помогает это исправить. А также на примере результатов на бенчмарке VL-Think посмотрим, насколько хорошо VLA модели усваивают знания из повседневной жизни.
📎Github
👉🏻 Дата: 21.05.26, четверг в 17:00
📹 Трансляция: Youtube или ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#семинары #VLA
👍4🔥1🤡1
Forwarded from Center for Cognitive Modeling
Первый гость интервью: Максим Бредихин, выпускник бакалавриата МГТУ им. Н. Э. Баумана, студент магистратуры ЦКМ. В Центре он занимается full-body control — это методы, которые позволяют мобильным манипуляторам и антропоморфным роботам расширять свои возможности за счет движения всего тела, а не только отдельных частей.
Как узнал о ЦКМ?
На ROS Meetup. Там я пообщался со студентами и сотрудниками Центра, они рассказали про проекты внутри ЦКМ и про магистерскую программу. Решил поступать именно сюда, так как многие темы были близки с моей научной и профессиональной деятельностью.
Почему именно магистратура ЦКМ?
Меня привлёк разнообразный набор дисциплин: можно глубоко погрузиться в предметную область, разобраться в современных SOTA-методах и в дальнейшем начать писать научные статьи. Также для меня важно, что преподаватели — это действующие исследователи, публикующие A* статьи, которые делятся своим опытом и всегда открыты к сотрудничеству и нетворкингу. Отдельно привлекает техническая возможность работать с реальными роботами и оборудованием, чтобы проверять свои гипотезы не только в симуляции, но и на железе.
Следующая история может быть ваша! Подавайте заявку на собеседование в магистратуру ЦКМ до 1 июня. Подробнее.
Поддержим Максима реакциями
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Друзья!
Мы с командой @amazing_research просим помочь с проведением пользовательского исследования для статьи
Задача — оценить реалистичность автоматически сгенерированных текстовых контекстов для персонализированной рекомендации фильмов
Прохождение задания занимает около 5 минут и не требует специальных знаний
Telegram-бот: @RecSysUserStudyBot
Заранее спасибо всем, кто пройдет!
Важно пройти его до 5го июня, чтобы мы успели обработать результаты 🤗
Мы с командой @amazing_research просим помочь с проведением пользовательского исследования для статьи
Задача — оценить реалистичность автоматически сгенерированных текстовых контекстов для персонализированной рекомендации фильмов
Прохождение задания занимает около 5 минут и не требует специальных знаний
Telegram-бот: @RecSysUserStudyBot
Заранее спасибо всем, кто пройдет!
Важно пройти его до 5го июня, чтобы мы успели обработать результаты 🤗
❤3👌1
Forwarded from Институт AIRI
Завершилась конференция AAMAS 2026
Международная конференция по автономным агентам и многоагентным системам в этом году проходила с 25 по 29 мая в городе Пафос, Кипр. На ней исследователи лаборатории когнитивных систем искусственного интеллекта AIRI Александр Панов, Алексей Скрынник, Алексей Ковалёв, Егор Черепанов, Мария Нестерова и Антон Андрейчук представили 3 работы⤵️
📎 Don't Blind Your VLA: Aligning Visual Representations for OOD Generalization
📎 Memory Retention Is Not Enough to Master Memory Tasks in Reinforcement Learning
📎 MARL-GPT: Foundation Model for Multi-Agent Reinforcement Learning
Делимся фотографиями с Кипра📷
#AIRIнаКонфе
Международная конференция по автономным агентам и многоагентным системам в этом году проходила с 25 по 29 мая в городе Пафос, Кипр. На ней исследователи лаборатории когнитивных систем искусственного интеллекта AIRI Александр Панов, Алексей Скрынник, Алексей Ковалёв, Егор Черепанов, Мария Нестерова и Антон Андрейчук представили 3 работы
Делимся фотографиями с Кипра
#AIRIнаКонфе
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8