11:15-11:30 AI Frontiers
Как большие языковые модели учатся планировать и рассуждать с помощью поисковых алгоритмов, Алексей Скрынник от AIRI
Современные большие языковые модели могут значительно расширять возможности автоматического рассуждения и планирования, если их дополнить стратегиями поиска. В докладе рассматриваются три основных подхода: неструктурированный поиск, эволюционный поиск и дерево поиска. Эти методы позволяют моделям исследовать несколько альтернативных траекторий рассуждений, корректировать ошибки на промежуточных шагах и выбирать наиболее перспективные решения.
11:55 - 12:15 Live studio
Рассуждающие модели воплощённого ИИ, Александр Панов
В докладе будет представлен обзор вариантов реализации рассуждений в нейросетевых моделях, используемых в задачах воплощенного ИИ - навигации и манипуляции. Обсудим, как связаны планирование действий и рассуждения, а также ограничения в современных поведенческих моделях (VLA). Разберем также последние работы нашей лаборатории в области интеграции обучаемых и классических подходов для повышения эффективности методов планирования и рассуждений в задачах воплощенного ИИ.
13:00-14:30 Главный зал
Форсайт: каким будет ИИ через 10 лет, Дмитрий Юдин среди участников
15:15-15:30 AI Frontiers
Применение больших языковых и визуально-языковых моделей в робототехнике, Алексей Ковалёв
Большие языковые и визуально-языковые модели (LLM и VLM) получили широкое распространение во множестве приложений и все активнее используются в робототехнике. На лекции мы обсудим, как такие модели помогают роботам распознавать неоднозначные инструкции, формировать планы действий и исправлять ошибки, возникающие при их выполнении.
15:30-15:45 AI Frontiers
Как большие языковые модели понимают 3D-пространство, Дмитрий Юдин
Развитие технологий пространственного ИИ — одно из важнейших современных направлений в робототехнике и беспилотном транспорте. В этом докладе мы рассмотрим концепции пространственного понимания, пространственных рассуждений и связанные с ними задачи. Обсудим потенциал современных MLLM для решения задач, связанных с визуальными ответами на вопросы, поиском трёхмерных объектов, генерацией графов трёхмерных сцен, созданием описаний 3D-сцен и др. Мы также обсудим ограничения популярных LLM в случае описания трёхмерной сцены только текстом. Рассмотрим современные решения для пространственного понимания, использующие модальности изображений, текста, облаков точек и графов. Кратко рассмотрим недавние разработки команд AIRI и МФТИ в этой области. Кроме того, мы обсудим перспективные нерешённые проблемы для дальнейшего развития.
Переходите по ссылкам и смотрите нас онлайн!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9🔥2
Наши сотрудники представляют сразу три трансформерные модели на стенде под общим названием Фундаментальные поведенческие модели:
Nikita Kachaev, Mikhail Kolosov, Daniil Zelezetsky, Alexey Kovalev, Aleksandr Panov
Egor Cherepanov, Nikita Kachaev, Alexey Kovalev, Aleksandr Panov
Maria Nesterova, Mikhail Kolosov, Anton Andreychuk, Egor Cherepanov, Oleg Bulichev, Alexey Kovalev, Konstantin Yakovlev, Aleksandr Panov, Alexey Skrynnik
Для MARL-GPT Олег Буличев создал стенд с джетботами, на котором можно было наглядно увидеть работу модели.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7🔥7
Третью лабораторию в Центре возглавит Алексей Ковалёв, к.ф.-м.н., старший научный сотрудник, руководитель группы “Embodied agents” CAIS AIRI,
доцент ЦКМ МФТИ, куратор нашей магистерской программы.
Тема исследований: фундаментальные и прикладные исследования в ИИ для робототехники и агентных систем.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤3🔥2
RoboJobs — проводит аналитические исследования, создает медиа-проекты, помогает компаниям развиваться на международном рынке, а также размещает вакансии и резюме соискателей.
Знает все о российском и мировом рынке робототехники. Находит специалистов, партнеров, подрядчиков и клиентов в России и за рубежом, создавая успешные и эффективные сотрудничества.
Подписывайтесь на RoboJobs, здесь вы найдете лучшие вакансии по робототехнике, в том числе и наши
#партнерский_пост
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1🔥1
Оплачиваемая стажировка будет длиться 4-6 месяцев, в процессе работы вам будет помогать ментор. Больше 20 проектов на выбор, в том числе и от AIRI, с которыми мы заключили соглашение на совместную работу, на страницах которых вы сможете найти описание и требования.
Два шага для подачи заявки:
Стажировку можно совмещать с написанием диплома, но нельзя совмещать с другой работой. А после успешного окончания возможно трудоустройство в лаборатории Центра, продолжение работы в компаниях-партнерах.
Вопросы можно задать в сообщениях @fissun.
#стажировка
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥4
🎓 — Семинар 13. Интеграция языковых моделей и графов сцены для планирования действий в физической среде | Анатолий Онищенко
Создание универсальных роботов-помощников невозможно без надежных механизмов понимания естественного языка в контексте реального физического мира. Интеллектуальный агент должен корректно интерпретировать и исполнять инструкции в различных средах.
В рамках семинара аспирант нашего Центра обсудит актуальные методы внедрения больших языковых моделей в задачи интерпретации и планирования действий, с акцентом на использование графовых представлений сцены.
Особое внимание будет уделено разработанному нами методу LookPlanGraph, объединяющему LLM с динамическим графовым представлением сцены. Будет продемонстрировано, как симуляция среды в графовом пространстве и механизмы аугментации позволяют решать задачи навигации и манипуляции в условиях изменяющегося окружения.
🪼 Страница проекта
👉🏻 Дата: 27.11.25, четверг в 17:00
📹 Трансляция: Youtube или ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#LLM
Создание универсальных роботов-помощников невозможно без надежных механизмов понимания естественного языка в контексте реального физического мира. Интеллектуальный агент должен корректно интерпретировать и исполнять инструкции в различных средах.
В рамках семинара аспирант нашего Центра обсудит актуальные методы внедрения больших языковых моделей в задачи интерпретации и планирования действий, с акцентом на использование графовых представлений сцены.
Особое внимание будет уделено разработанному нами методу LookPlanGraph, объединяющему LLM с динамическим графовым представлением сцены. Будет продемонстрировано, как симуляция среды в графовом пространстве и механизмы аугментации позволяют решать задачи навигации и манипуляции в условиях изменяющегося окружения.
👉🏻 Дата: 27.11.25, четверг в 17:00
📹 Трансляция: Youtube или ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥5
21 ноября начался отборочный этап по направлению "Искусственный интеллект" для пользователей, прошедших регистрацию на олимпиаду. Он заканчивается 1 декабря в 23:59 по московскому времени.
Если вы ещё не приступили к заданию, советуем поторопиться. На выполнение у вас будет 48 часов, если вы начнёте решение не позднее 23:59 29 ноября.
Напоминаем, что победителям и призёрам предоставляются льготы при поступлении, в том числе и в МФТИ.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍3
В Центре мы создаем работающие технологии для ведущих российских компаний и публикуемся в сильных международных журналах и на топовых конференциях по ИИ и робототехнике.
Наша работа охватывает проекты по обучению больших моделей, робототехнические системы, когнитивные архитектуры и методы эффективного взаимодействия человека и машины.
Вакансии:
В наших проектах — свобода в исследованиях и нетривиальные задачи. Смотрите подробности по ссылкам выше или на нашем сайте и откликайтесь!
#вакансии
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13❤6
🎓 — Семинар 14. Объектно-центричный RL | Денис Васильев
Изучению объектно-центричных представлений уделено много внимания в рамках задач компьютерного зрения. В случае обучения с подкреплением, много внимания уделяется применению объектно-центричных представлений в рамках моделей мира. Однако в случае model-free подходов, большинство методов используют объектно-центричные представления, полученные с помощью замороженных энкодеров.
Дообучение энкодера, в теории, должно обеспечивать ускоренную сходимость алгоритмов обучения с подкреплением и добавлять адаптивности к out-of-distribution сценам. На семинаре аспирантом нашего Центра будет представлен алгоритм для дообучения энкодеров в рамках RL-задач.
👉🏻 Дата: 04.12.25, четверг в 17:00
📹 Трансляция: Youtube или ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#RL
Изучению объектно-центричных представлений уделено много внимания в рамках задач компьютерного зрения. В случае обучения с подкреплением, много внимания уделяется применению объектно-центричных представлений в рамках моделей мира. Однако в случае model-free подходов, большинство методов используют объектно-центричные представления, полученные с помощью замороженных энкодеров.
Дообучение энкодера, в теории, должно обеспечивать ускоренную сходимость алгоритмов обучения с подкреплением и добавлять адаптивности к out-of-distribution сценам. На семинаре аспирантом нашего Центра будет представлен алгоритм для дообучения энкодеров в рамках RL-задач.
👉🏻 Дата: 04.12.25, четверг в 17:00
📹 Трансляция: Youtube или ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#RL
🔥4👍2❤1
🎓 — Семинар 15. Оффлайн и онлайн RL для робототехнической манипуляции с трансформерными моделями | Дмитрий Поярков
Современные подходы к обучению трансформерных нейросетей для задач манипуляции в робототехнике преимущественно базируются на оффлайн-обучении с использованием заранее собранных датасетов. Однако, несмотря на удобство и стабильность такого подхода, он демонстрирует ограниченные возможности в достижении высокой производительности в реалистичных условиях.
На семинаре аспирант нашего Центра расскажет о исследовании потенциала применения онлайн-обучения с подкреплением, которое позволяет агенту адаптироваться к среде в процессе взаимодействия и постепенно улучшать поведение на основе вновь собранных данных.
Несмотря на высокую вычислительную стоимость и сложность настройки такого обучения, его интеграция способна существенно повысить эффективность трансформеров в задачах манипуляции.
🪼 Статья
👉🏻 Дата: 11.12.25, четверг в 17:00
📹 Трансляция Youtube и ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#семинары #RL #robotics
Современные подходы к обучению трансформерных нейросетей для задач манипуляции в робототехнике преимущественно базируются на оффлайн-обучении с использованием заранее собранных датасетов. Однако, несмотря на удобство и стабильность такого подхода, он демонстрирует ограниченные возможности в достижении высокой производительности в реалистичных условиях.
На семинаре аспирант нашего Центра расскажет о исследовании потенциала применения онлайн-обучения с подкреплением, которое позволяет агенту адаптироваться к среде в процессе взаимодействия и постепенно улучшать поведение на основе вновь собранных данных.
Несмотря на высокую вычислительную стоимость и сложность настройки такого обучения, его интеграция способна существенно повысить эффективность трансформеров в задачах манипуляции.
👉🏻 Дата: 11.12.25, четверг в 17:00
📹 Трансляция Youtube и ВК
Подключайтесь к живому обсуждению и задавайте вопросы в прямом эфире! Ждем всех!
#семинары #RL #robotics
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9👍2🔥2
🎓 — Семинар 16. Алгоритмы глобальной локализации роботов с учетом карт знанийи | Александр Мелехин,
Егор Пинкин, Григорий Карташов
Современные задачи автономной навигации роботов требуют высокоточной глобальной локализации в сложных и динамически меняющихся средах. Традиционные подходы, основанные на одном типе сенсоров — будь то лидары или камеры, — часто оказываются недостаточно устойчивыми к изменениям освещения, погоды или структуры пространства.
На семинаре будет представлен обзор и анализ мультимодальных и мультисенсорных нейросетевых методов распознавания места, которые комбинируют данные от лидаров, RGB-камер и их последовательностей для повышения точности и надёжности локализации. Особое внимание будет уделено алгоритмам, таким как OPR-Loc-MM, который демонстрирует значительное улучшение метрик (медианная ошибка позиции всего 0.41 м и ориентации 4.37°) за счёт интеграции визуальных и лидарных данных.
Мы обсудим разные методы — от лидарных (MinkLoc3D) и визуальных (MegaLoc) до мультимодальных (MSSPlace) и последовательностных (OPR-Loc-Seq) — позволяет создавать эффективные пайплайны для реальных робототехнических систем. Также будут затронуты вопросы баланса между точностью и временем инференса, что особенно важно для систем, работающих в реальном времени.
📹 Трансляция Youtube и ВК
Приглашаем всех, кто интересуется навигацией роботов, компьютерным зрением и применением нейросетевых методов в робототехнике! Присоединяйтесь прямо сейчас!
#CV #robotics
Егор Пинкин, Григорий Карташов
Современные задачи автономной навигации роботов требуют высокоточной глобальной локализации в сложных и динамически меняющихся средах. Традиционные подходы, основанные на одном типе сенсоров — будь то лидары или камеры, — часто оказываются недостаточно устойчивыми к изменениям освещения, погоды или структуры пространства.
На семинаре будет представлен обзор и анализ мультимодальных и мультисенсорных нейросетевых методов распознавания места, которые комбинируют данные от лидаров, RGB-камер и их последовательностей для повышения точности и надёжности локализации. Особое внимание будет уделено алгоритмам, таким как OPR-Loc-MM, который демонстрирует значительное улучшение метрик (медианная ошибка позиции всего 0.41 м и ориентации 4.37°) за счёт интеграции визуальных и лидарных данных.
Мы обсудим разные методы — от лидарных (MinkLoc3D) и визуальных (MegaLoc) до мультимодальных (MSSPlace) и последовательностных (OPR-Loc-Seq) — позволяет создавать эффективные пайплайны для реальных робототехнических систем. Также будут затронуты вопросы баланса между точностью и временем инференса, что особенно важно для систем, работающих в реальном времени.
📹 Трансляция Youtube и ВК
Приглашаем всех, кто интересуется навигацией роботов, компьютерным зрением и применением нейросетевых методов в робототехнике! Присоединяйтесь прямо сейчас!
#CV #robotics
🔥10❤4
Please open Telegram to view this post
VIEW IN TELEGRAM
❤27❤🔥13
Вы — главная движущая сила наших лабораторий: когнитивных динамических систем, интеллектуального транспорта и совместной с AIRI.
Мы растем вместе с вами: помимо магистратуры и аспирантуры теперь есть программа для бакалавров ФПМИ. Она стартует уже в этом семестре, и мы с нетерпением ждём февраля, чтобы увидеть первую группу!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤25🎉13👍3🔥3