Сегодня вышло моё интервью для подкаста «Путь покорителя» от студии Иннополиса.
Рассказал про свои студенческие годы, первые исследования, кто помог сформировать научное мировоззрение, как научная степень помогает решать реальные бизнес-задачи и куда движется современная наука об искусственном интеллекте.
Отдельно поделился советами, с чего начать путь в AI-research в эпоху генеративного ИИ👋
Интервью можно посмотреть на каналах:
🔘 VK Video
🔘 YouTube
Рассказал про свои студенческие годы, первые исследования, кто помог сформировать научное мировоззрение, как научная степень помогает решать реальные бизнес-задачи и куда движется современная наука об искусственном интеллекте.
«Современный ученый в области ИИ имеет уникальную возможность — работать на стыке фундаментальной науки и прикладных задач, создавая технологии, которые меняют жизнь миллионов людей. Именно такой синтез дает самые прорывные результаты».
Отдельно поделился советами, с чего начать путь в AI-research в эпоху генеративного ИИ
Интервью можно посмотреть на каналах:
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥18⚡12❤7❤🔥6👍6😁1🌚1🏆1😎1
⚡️⚡️⚡️3 статьи лаборатории приняты на юбилейную 40-ю конференцию AAAI (Core A*)
1) BREPS: Bounding-Box Robustness Evaluation of Promptable Segmentation — о методе синтеза боксов разметки, использование которых позволяет минимизировать или максимизировать ошибку сегментации в зависимости от критерия. Также провели сравнительный анализ современных моделей на 10 наборах данных, содержащих как повседневные сцены, так и медицинские изображения.
Скоро в open source💪
2) NoReGeo: Non-Reasoning Geometry Benchmark — о новом бенчмарке, который показывает, что даже передовые большие языковые модели не способны к прямому геометрическому пониманию без привлечения алгебраических вычислений, и эту проблему нельзя решить простым дообучением. В бенчмарке 2500 задач из 25 категорий.
Скоро в open source💪
3) T-LoRA: Single Image Diffusion Model Customization Without Overfitting — о легковесном методе, который позволяет дообучать диффузионку по одному изображению без переобучения, что актуально, например, для задач персонализированной генерации картинок
👉GitHub
👉Arxiv
1) BREPS: Bounding-Box Robustness Evaluation of Promptable Segmentation — о методе синтеза боксов разметки, использование которых позволяет минимизировать или максимизировать ошибку сегментации в зависимости от критерия. Также провели сравнительный анализ современных моделей на 10 наборах данных, содержащих как повседневные сцены, так и медицинские изображения.
Скоро в open source💪
2) NoReGeo: Non-Reasoning Geometry Benchmark — о новом бенчмарке, который показывает, что даже передовые большие языковые модели не способны к прямому геометрическому пониманию без привлечения алгебраических вычислений, и эту проблему нельзя решить простым дообучением. В бенчмарке 2500 задач из 25 категорий.
Скоро в open source💪
3) T-LoRA: Single Image Diffusion Model Customization Without Overfitting — о легковесном методе, который позволяет дообучать диффузионку по одному изображению без переобучения, что актуально, например, для задач персонализированной генерации картинок
👉GitHub
👉Arxiv
1🔥57🏆9⚡7❤1
💪Не прошло и дня, как говорится
+2 принятых статьи на международную конференцию WACV (Core A)🔥
1) Features Inversion as a Lens on Vision Encoders
2) MaxInfo: A Training-Free Key-Frame Selection Method Using Maximum Volume for Enhanced Video Understanding
Статья
Про эти работы отдельно в ближайшие дни расскажу
+2 принятых статьи на международную конференцию WACV (Core A)🔥
1) Features Inversion as a Lens on Vision Encoders
2) MaxInfo: A Training-Free Key-Frame Selection Method Using Maximum Volume for Enhanced Video Understanding
Статья
Про эти работы отдельно в ближайшие дни расскажу
4❤26🔥18🏆11
Forwarded from Домклик PRO
А следом — еще больше инсайтов! В дискуссии про главные тренды в мире ИИ вместе с теми, кто внедряет умные решения для миллионов пользователей, мы обсудим:
🟢 Как технологии создают новую ценность для бизнеса и клиентов?
🟢 Какие компетенции станут must-have для работы в эпоху AI?
🟢 От экспериментов к реальным кейсам: истории внедрения GenAI и автономных агентов
Среди спикеров:
✔ Андрей Кузнецов, директор лаборатории FusionBrain, AIRI; исполнительный директор по исследованию данных, Sber AI
✔ Алексей Назаренко, лидер дивизиона «Lifestyle сервисы в недвижимости», Домклик
✔ Андрей Рыбинцев, управляющий директор по искусственному интеллекту, Авито
✔ Виктор Тарнавский, директор по искусственному интеллекту, Т-Банк
Модератор — Семён Будённый, управляющий директор, Sber AI; руководитель научной группы, AIRI.
Узнайте, какие умные решения меняют мир и бизнес уже сейчас➡ регистрируйтесь и подключайтесь к трансляции💻
Среди спикеров:
Модератор — Семён Будённый, управляющий директор, Sber AI; руководитель научной группы, AIRI.
Узнайте, какие умные решения меняют мир и бизнес уже сейчас
🔗 Москва, Навка Арена +💻 💻 💻 эксклюзивно в VK Видео
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19❤🔥8🙏4❤1👍1🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
В команде Robotics лаборатории исследователь применил свои навыки для прикладных задач робототехники.
Помните, что курение вредит вашему здоровью, а роботы — нет 😎
@dunnolab video production
@dunnolab video production
😁40🔥10❤7🤔1🆒1
Вчера участвовал в Форуме «Цифровые решения», организованный при поддержке Правительства Российской Федерации. Вместе с коллегами из Яндекса, Авито, Лаборатории Касперского и государственных органов провели дискуссию «Когда ИИ становится взрослым: ответственность, доверие, польза».
Обсудили:
➡️ В чём сегодня фундаментальная ценность искусственного интеллекта для людей, бизнеса и государства?
➡️ Какая роль государства по отношению к отрасли ИИ?
➡️ Развитие ИИ или его регулирование/безопасность?
А какое у вас мнение?
Обсудили:
А какое у вас мнение?
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥28❤15👍10🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
Команда Robotics лаборатории FusionBrain вместе с командой Адаптивных агентов при поддержке отдела научно-технической разработки запустили проект VLA Arena — платформу для оценки моделей управления роботами. Платформа открыта в тестовом режиме на три месяца (как раз, чтобы на новогодних выходных было чем заняться😏).
VLA Arena поддерживает роботов в симуляции и реальные компактные устройства LeRobot SO-100 и SO-101 от Hugging Face. Пользователь может сравнивать модели в 3D-движке прямо в браузере и подключать свои устройства.
Для тестов доступны открытые VLA-модели:
⚫️ π0.5 от Physical Intelligence
⚫️ SmolVLA от Hugging Face
⚫️ Flower от Intuitive Robots Lab и Microsoft Research
⚫️ «Русифицированная» π0.5, адаптированная в AIRI
А для любителей экспериментов и обучения своих моделей для LeRobot мы выложили чистые датасеты из открытых источников, которые были ответственно размечены и переведены на русский язык.
Модели понимают инструкции на естественном языке и могут решать сложные задачи, требующие адаптации к новым объектам и сценам. В сетапе арены пользователи голосуют за модели, которые по их мнению работают лучше, а голоса определяют положение модели в лидерборде.
Поздравляю всех с успешным релизом🦾
Приглашаю активно заходить на арену, оценивать работу моделей, загружать свои, биться за первые места, а мы пока подумаем, как можно порадовать топ лидерборда к Новому Году🏆
@complete_ai
VLA Arena поддерживает роботов в симуляции и реальные компактные устройства LeRobot SO-100 и SO-101 от Hugging Face. Пользователь может сравнивать модели в 3D-движке прямо в браузере и подключать свои устройства.
Для тестов доступны открытые VLA-модели:
А для любителей экспериментов и обучения своих моделей для LeRobot мы выложили чистые датасеты из открытых источников, которые были ответственно размечены и переведены на русский язык.
Модели понимают инструкции на естественном языке и могут решать сложные задачи, требующие адаптации к новым объектам и сценам. В сетапе арены пользователи голосуют за модели, которые по их мнению работают лучше, а голоса определяют положение модели в лидерборде.
Поздравляю всех с успешным релизом🦾
Приглашаю активно заходить на арену, оценивать работу моделей, загружать свои, биться за первые места
@complete_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥22🔥18🏆8❤4👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🦾Продолжаем делиться нашими успехами в области робототехники
Команда Robotics лаборатории FusionBrain выпустила RoboBenchMart — открытый симуляционный ритейл-бенчмарк для роботов. Он включает генератор планов магазина и раскладок товаров, процедуры автоматизированного сбора траекторий, инструменты оценки и набор базовых моделей для сравнения. Показали, что SOTA VLA-модели пока не справляются с ритейл-задачами.
🏠➡️🛒 Сейчас активно развиваются бенчмарки «домашних» помощников, и мы видим наш бенчмарк как их логичное продолжение — шаг к роботу-помощнику, который сможет помочь с покупками, и к работнику для даркстора. В отличие от домашних условий здесь важно надёжное выполнение операций с огромным разнообразием товаров — разных видов, упаковок, форм и размеров — в стеснённых пространствах магазина и склада. Любая ошибка робота — прямой ущерб магазину и клиенту, поэтому критичны надёжность и переносимость решений.
🤖 RoboBenchMart — первый открытый бенчмарк для роботов в ритейле. Он проверяет надёжность выполнения базовых ритейл-задач мобильной манипуляции: взять товар с полки и положить в корзину, достать из холодильника и закрыть дверь, собрать несколько позиций по списку и др.
🧪 Мы проверили VLA-модели общего назначения и смоделировали их реалистичную адаптацию: дообучили на небольшом наборе траекторий, собранных в нашем симуляторе. В обучающих сценариях модели уверенно решают часть простых задач, но на новых раскладках и с незнакомыми товарами качество заметно падает. Это подчёркивает ограничения текущих моделей общего назначения в реальном применении и необходимость дальнейшей проработки ритейл-сценариев.
🚀 Дальше мы будем активно развивать RoboBenchMart: добавлять больше задач, расширять набор воплощений, сцен и товаров, адаптировать новые модели, усиливать базовые решения. Будем рады репостам, звёздочкам на GitHub, цитированиям и коллаборациям — присоединяйтесь!
В рамках этой работы мы очень рады сотрудничать с Центром Робототехники Сбера, чтобы бенчмарк позволял улучшать возможности роботов!
🔗 Ссылки
📍 Препринт (arXiv): https://arxiv.org/abs/2511.10276
📍 GitHub: https://github.com/emb-ai/RoboBenchMart
📍 Project page: https://emb-ai.github.io/robobenchmart-project
@complete_ai
Команда Robotics лаборатории FusionBrain выпустила RoboBenchMart — открытый симуляционный ритейл-бенчмарк для роботов. Он включает генератор планов магазина и раскладок товаров, процедуры автоматизированного сбора траекторий, инструменты оценки и набор базовых моделей для сравнения. Показали, что SOTA VLA-модели пока не справляются с ритейл-задачами.
🏠➡️🛒 Сейчас активно развиваются бенчмарки «домашних» помощников, и мы видим наш бенчмарк как их логичное продолжение — шаг к роботу-помощнику, который сможет помочь с покупками, и к работнику для даркстора. В отличие от домашних условий здесь важно надёжное выполнение операций с огромным разнообразием товаров — разных видов, упаковок, форм и размеров — в стеснённых пространствах магазина и склада. Любая ошибка робота — прямой ущерб магазину и клиенту, поэтому критичны надёжность и переносимость решений.
🤖 RoboBenchMart — первый открытый бенчмарк для роботов в ритейле. Он проверяет надёжность выполнения базовых ритейл-задач мобильной манипуляции: взять товар с полки и положить в корзину, достать из холодильника и закрыть дверь, собрать несколько позиций по списку и др.
🧪 Мы проверили VLA-модели общего назначения и смоделировали их реалистичную адаптацию: дообучили на небольшом наборе траекторий, собранных в нашем симуляторе. В обучающих сценариях модели уверенно решают часть простых задач, но на новых раскладках и с незнакомыми товарами качество заметно падает. Это подчёркивает ограничения текущих моделей общего назначения в реальном применении и необходимость дальнейшей проработки ритейл-сценариев.
🚀 Дальше мы будем активно развивать RoboBenchMart: добавлять больше задач, расширять набор воплощений, сцен и товаров, адаптировать новые модели, усиливать базовые решения. Будем рады репостам, звёздочкам на GitHub, цитированиям и коллаборациям — присоединяйтесь!
В рамках этой работы мы очень рады сотрудничать с Центром Робототехники Сбера, чтобы бенчмарк позволял улучшать возможности роботов!
🔗 Ссылки
📍 Препринт (arXiv): https://arxiv.org/abs/2511.10276
📍 GitHub: https://github.com/emb-ai/RoboBenchMart
📍 Project page: https://emb-ai.github.io/robobenchmart-project
@complete_ai
❤22🔥9⚡7🏆3🎉1
Forwarded from Институт AIRI
Завтра стартует международная конференция по искусственному интеллекту AI Journey 2025 🚀
Событие пройдёт с 19 по 21 ноября и будет включать три тематических блока: общество, бизнес и наука. В этом году Институт AIRI представит 25 докладов, 15 постеров и 6 стендов.
Подробная программа и трансляция на сайте. До встречи в онлайне!
Событие пройдёт с 19 по 21 ноября и будет включать три тематических блока: общество, бизнес и наука. В этом году Институт AIRI представит 25 докладов, 15 постеров и 6 стендов.
Подробная программа и трансляция на сайте. До встречи в онлайне!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤🔥24🏆7🔥5❤3
Forwarded from GigaChat
Мы стремимся не замыкаться в «закрытой» технологии, а строить открытую платформу для всей страны, поэтому мы публикуем веса наших моделей.
Что появилось в открытом доступе ↓
🔷 GigaChat Ultra Preview
Самая мощная модель Сбера. Лучше DeepSeek V3.1 и GigaChat Max 2 в русскоязычных задачах. Подходит для бизнеса, аналитики, разработки и дообучения на своих данных➡ GitHub | HuggingFace |GitVerse
GigaAM-v3
5 моделей, которые превращают голос в текст с пунктуацией, понимают акценты, спонтанную речь и даже музыкальные запросы. Подойдут для голосовых ассистентов, контакт-центров, аналитики звонков➡ GitHub | HuggingFace | GitVerse
🔷 GigaChat Lightning
Лёгкая, компактная и быстрая. Конкурирует с Qwen3-4B, по скорости сравнима с Qwen3-1.7B, но намного умнее и больше по параметрам➡ GitHub | HuggingFace |GitVerse
🔷 Kandinsky 5.0
Создание фото и видео по тексту. Внутри:
• Image Lite — делает изображения в HD, отлично понимает русский язык и культурный контекст
• Video Pro — создаёт до 10 секунд реалистичного HD-видео. Конкурирует с топовыми мировыми моделями
• Video Lite — облегчённая версия для домашней видеокарты (от 12 ГБ)➡️ GitHub | GitVerse | Hugging Face | Технический репорт
🔷 K-VAE 1.0
Ускорение генеративного AI. Это технологии, которые «упаковывают» картинки и видео в скрытое пространство, чтобы модели работали быстрее и требовали меньше ресурсов. Лучшие среди открытых аналогов➡️ GitHub|Hugging Face
Код и веса этих всех моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31👍18❤🔥7😁2
Forwarded from Dendi Math&AI (Денис Димитров)
🚀 Мы с командой открываем всю линейку генеративных моделей Kandinsky 5.0!
В сентябре мы выложили в open source Kandinsky 5.0 Video Lite, получили множество положительных отзывов и полезной обратной связи, большое спасибо всем!
Сегодня мы открываем всю линейку: как Video, так и Image модели. Дальше расскажу все подробности, но можно сначала сходить попробовать: модели доступны всем на открытых поверхностях ГигаЧат: Telegram, Max и giga.chat
🎬 Video Pro – мощные Text-to-Video и Image-to-Video – лучшие в мире open source модели, превосходящие по качеству Wan 2.2 A14B и работающие наравне с Veo 3 от Google по визуалу и динамике (в HD)
🖼 Image Lite – универсальные Text-to-Image и Image Editing модели c 6B параметров, которые нативно поддерживают промты на русском языке, знают культурный код и генерируют картинки с кириллическим текстом. Значительно превосходит FLUX.1 [dev] в задаче генерации изображений и работают на одном уровне с FLUX.1 Kontext [dev] в их редактировании
В открытом доступе: четыре версии Image Lite и пять версий Video Pro для разных задач (для генерации 5 сек и 10 сек видео, разрешение — SD и HD). Доступны как SFT-версии с максимальным качеством, так и Pretrain, для исследователей и дообучения
🔧 Как мы достигли этого (подробнее в нашем большом техрепорте):
🔘 Большой Pretrain-датасет 520 млн изображений и 250 млн видео-сцен
🔘 Фокус на SFT: художники и дизайнеры тщательно выбирали материалы с безупречной композицией, стилем и визуальным качеством
🔘 Разработали метод NABLA для стабильной 10-секундной генерации в HD-разрешении
🔘 Использовали архитектуру Kandinsky-DiT с flow matching
🚀 Доступность и информация:
🔘 Лицензия поддерживает коммерческое использование (MIT)
🔘 Все материалы можно найти на GitHub, HuggingFace и GitVerse
🔘 Техрепорт, кстати, уже сейчас #1 в Daily Papers, но ваша поддержка поможет укрепить эту позицию :)
@dendi_math_ai
В сентябре мы выложили в open source Kandinsky 5.0 Video Lite, получили множество положительных отзывов и полезной обратной связи, большое спасибо всем!
Сегодня мы открываем всю линейку: как Video, так и Image модели. Дальше расскажу все подробности, но можно сначала сходить попробовать: модели доступны всем на открытых поверхностях ГигаЧат: Telegram, Max и giga.chat
🎬 Video Pro – мощные Text-to-Video и Image-to-Video – лучшие в мире open source модели, превосходящие по качеству Wan 2.2 A14B и работающие наравне с Veo 3 от Google по визуалу и динамике (в HD)
🖼 Image Lite – универсальные Text-to-Image и Image Editing модели c 6B параметров, которые нативно поддерживают промты на русском языке, знают культурный код и генерируют картинки с кириллическим текстом. Значительно превосходит FLUX.1 [dev] в задаче генерации изображений и работают на одном уровне с FLUX.1 Kontext [dev] в их редактировании
В открытом доступе: четыре версии Image Lite и пять версий Video Pro для разных задач (для генерации 5 сек и 10 сек видео, разрешение — SD и HD). Доступны как SFT-версии с максимальным качеством, так и Pretrain, для исследователей и дообучения
🔧 Как мы достигли этого (подробнее в нашем большом техрепорте):
🚀 Доступность и информация:
@dendi_math_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥34👍13❤6🆒2👀1
Forwarded from Connect WIT
❗️Ассистент инженера-конструктора в машиностроении
На международной конференции AI Journey («Путешествие в мир искусственного интеллекта») Сбер в партнерстве с Институтом AIRI анонсировали решение для автоматизации конструкторской работы в машиностроении.
Новый ассистент инженера-конструктора на базе модели Cadrille преобразует различные типы данных в готовые цифровые 3D-модели в профессиональной системе автоматизированного проектирования (САПР). Модель конвертирует облака точек, изображения и текстовые описания деталей в сложные инженерные модели. Подробнее на сайте
На международной конференции AI Journey («Путешествие в мир искусственного интеллекта») Сбер в партнерстве с Институтом AIRI анонсировали решение для автоматизации конструкторской работы в машиностроении.
Новый ассистент инженера-конструктора на базе модели Cadrille преобразует различные типы данных в готовые цифровые 3D-модели в профессиональной системе автоматизированного проектирования (САПР). Модель конвертирует облака точек, изображения и текстовые описания деталей в сложные инженерные модели. Подробнее на сайте
Connect-WIT
Ассистент инженера-конструктора в машиностроении - Connect-WIT
На AI Journey Сбер и AIRI представили инструмент для автоматизации конструкторской работы На международной конференции AI Journey («Путешествие в мир искусственного интеллекта») Сбер в партнерстве с Институтом AIRI анонсировали решение для автоматизации конструкторской…
🔥15❤🔥8⚡4