Complete AI
7.85K subscribers
491 photos
35 videos
10 files
268 links
Меня зовут Андрей Кузнецов

Директор лаборатории FusionBrain в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML

Tg: @kuznetsoff87
Linkedin: https://tinyurl.com/y96nmmdd
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
В команде Robotics лаборатории исследователь применил свои навыки для прикладных задач робототехники.

Помните, что курение вредит вашему здоровью, а роботы — нет 😎

@dunnolab video production
😁40🔥107🤔1🆒1
Вчера участвовал в Форуме «Цифровые решения», организованный при поддержке Правительства Российской Федерации. Вместе с коллегами из Яндекса, Авито, Лаборатории Касперского и государственных органов провели дискуссию «Когда ИИ становится взрослым: ответственность, доверие, польза».

Обсудили:
➡️ В  чём сегодня фундаментальная ценность искусственного интеллекта для людей, бизнеса и государства?
➡️ Какая роль государства по отношению к отрасли ИИ?
➡️ Развитие ИИ или его регулирование/безопасность?

А какое у вас мнение?
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥2815👍10🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
Команда Robotics лаборатории FusionBrain вместе с командой Адаптивных агентов при поддержке отдела научно-технической разработки запустили проект VLA Arena — платформу для оценки моделей управления роботами. Платформа открыта в тестовом режиме на три месяца (как раз, чтобы на новогодних выходных было чем заняться😏).

VLA Arena поддерживает роботов в симуляции и реальные компактные устройства LeRobot SO-100 и SO-101 от Hugging Face. Пользователь может сравнивать модели в 3D-движке прямо в браузере и подключать свои устройства.

Для тестов доступны открытые VLA-модели:
⚫️π0.5 от Physical Intelligence
⚫️SmolVLA от Hugging Face
⚫️Flower от Intuitive Robots Lab и Microsoft Research
⚫️«Русифицированная» π0.5, адаптированная в AIRI

А для любителей экспериментов и обучения своих моделей для LeRobot мы выложили чистые датасеты из открытых источников, которые были ответственно размечены и переведены на русский язык.

Модели понимают инструкции на естественном языке и могут решать сложные задачи, требующие адаптации к новым объектам и сценам. В сетапе арены пользователи голосуют за модели, которые по их мнению работают лучше, а голоса определяют положение модели в лидерборде.

Поздравляю всех с успешным релизом🦾

Приглашаю активно заходить на арену, оценивать работу моделей, загружать свои, биться за первые места, а мы пока подумаем, как можно порадовать топ лидерборда к Новому Году🏆

@complete_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥22🔥18🏆84👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🦾Продолжаем делиться нашими успехами в области робототехники

Команда Robotics лаборатории FusionBrain выпустила RoboBenchMart — открытый симуляционный ритейл-бенчмарк для роботов. Он включает генератор планов магазина и раскладок товаров, процедуры автоматизированного сбора траекторий, инструменты оценки и набор базовых моделей для сравнения. Показали, что SOTA VLA-модели пока не справляются с ритейл-задачами.

🏠➡️🛒 Сейчас активно развиваются бенчмарки «домашних» помощников, и мы видим наш бенчмарк как их логичное продолжение — шаг к роботу-помощнику, который сможет помочь с покупками, и к работнику для даркстора. В отличие от домашних условий здесь важно надёжное выполнение операций с огромным разнообразием товаров — разных видов, упаковок, форм и размеров — в стеснённых пространствах магазина и склада. Любая ошибка робота — прямой ущерб магазину и клиенту, поэтому критичны надёжность и переносимость решений.

🤖 RoboBenchMart — первый открытый бенчмарк для роботов в ритейле. Он проверяет надёжность выполнения базовых ритейл-задач мобильной манипуляции: взять товар с полки и положить в корзину, достать из холодильника и закрыть дверь, собрать несколько позиций по списку и др.

🧪 Мы проверили VLA-модели общего назначения и смоделировали их реалистичную адаптацию: дообучили на небольшом наборе траекторий, собранных в нашем симуляторе. В обучающих сценариях модели уверенно решают часть простых задач, но на новых раскладках и с незнакомыми товарами качество заметно падает. Это подчёркивает ограничения текущих моделей общего назначения в реальном применении и необходимость дальнейшей проработки ритейл-сценариев.

🚀 Дальше мы будем активно развивать RoboBenchMart: добавлять больше задач, расширять набор воплощений, сцен и товаров, адаптировать новые модели, усиливать базовые решения. Будем рады репостам, звёздочкам на GitHub, цитированиям и коллаборациям — присоединяйтесь!

В рамках этой работы мы очень рады сотрудничать с Центром Робототехники Сбера, чтобы бенчмарк позволял улучшать возможности роботов!

🔗 Ссылки
📍 Препринт (arXiv): https://arxiv.org/abs/2511.10276
📍 GitHub: https://github.com/emb-ai/RoboBenchMart
📍 Project page: https://emb-ai.github.io/robobenchmart-project

@complete_ai
22🔥97🏆3🎉1
Forwarded from Институт AIRI
Завтра стартует международная конференция по искусственному интеллекту AI Journey 2025 🚀

Событие пройдёт с 19 по 21 ноября и будет включать три тематических блока: общество, бизнес и наука. В этом году Институт AIRI представит 25 докладов, 15 постеров и 6 стендов.

Подробная программа и трансляция на сайте. До встречи в онлайне!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤‍🔥24🏆7🔥53
Forwarded from GigaChat
🔥МЫ ПРЕДСТАВЛЯЕМ КРУПНЕЙШИЙ OPEN-SOURCE AI В ЕВРОПЕ 🔥

Мы стремимся не замыкаться в «закрытой» технологии, а строить открытую платформу для всей страны, поэтому мы публикуем веса наших моделей.

Что появилось в открытом доступе ↓

🔷 GigaChat Ultra Preview
Самая мощная модель Сбера. Лучше DeepSeek V3.1 и GigaChat Max 2 в русскоязычных задачах. Подходит для бизнеса, аналитики, разработки и дообучения на своих данных
GitHub | HuggingFace |GitVerse

GigaAM-v3
5 моделей, которые превращают голос в текст с пунктуацией, понимают акценты, спонтанную речь и даже музыкальные запросы. Подойдут для голосовых ассистентов, контакт-центров, аналитики звонков
GitHub | HuggingFace | GitVerse

🔷 GigaChat Lightning
Лёгкая, компактная и быстрая. Конкурирует с Qwen3-4B, по скорости сравнима с Qwen3-1.7B, но намного умнее и больше по параметрам
GitHub | HuggingFace |GitVerse

🔷 Kandinsky 5.0
Создание фото и видео по тексту. Внутри:
• Image Lite — делает изображения в HD, отлично понимает русский язык и культурный контекст
• Video Pro — создаёт до 10 секунд реалистичного HD-видео. Конкурирует с топовыми мировыми моделями
• Video Lite — облегчённая версия для домашней видеокарты (от 12 ГБ)
➡️ GitHub | GitVerse | Hugging Face | Технический репорт

🔷 K-VAE 1.0
Ускорение генеративного AI. Это технологии, которые «упаковывают» картинки и видео в скрытое пространство, чтобы модели работали быстрее и требовали меньше ресурсов. Лучшие среди открытых аналогов
➡️ GitHub|Hugging Face


Код и веса этих всех моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31👍18❤‍🔥7😁2
Forwarded from Dendi Math&AI (Денис Димитров)
🚀 Мы с командой открываем всю линейку генеративных моделей Kandinsky 5.0!

В сентябре мы выложили в open source Kandinsky 5.0 Video Lite, получили множество положительных отзывов и полезной обратной связи, большое спасибо всем!

Сегодня мы открываем всю линейку: как Video, так и Image модели. Дальше расскажу все подробности, но можно сначала сходить попробовать: модели доступны всем на открытых поверхностях ГигаЧат: Telegram, Max и giga.chat

🎬 Video Pro – мощные Text-to-Video и Image-to-Video – лучшие в мире open source модели, превосходящие по качеству Wan 2.2 A14B и работающие наравне с Veo 3 от Google по визуалу и динамике (в HD)

🖼 Image Lite – универсальные Text-to-Image и Image Editing модели c 6B параметров, которые нативно поддерживают промты на русском языке, знают культурный код и генерируют картинки с кириллическим текстом. Значительно превосходит FLUX.1 [dev] в задаче генерации изображений и работают на одном уровне с FLUX.1 Kontext [dev] в их редактировании

В открытом доступе: четыре версии Image Lite и пять версий Video Pro для разных задач (для генерации 5 сек и 10 сек видео, разрешение — SD и HD). Доступны как SFT-версии с максимальным качеством, так и Pretrain, для исследователей и дообучения

🔧 Как мы достигли этого (подробнее в нашем большом техрепорте):
🔘 Большой Pretrain-датасет 520 млн изображений и 250 млн видео-сцен
🔘 Фокус на SFT: художники и дизайнеры тщательно выбирали материалы с безупречной композицией, стилем и визуальным качеством
🔘 Разработали метод NABLA для стабильной 10-секундной генерации в HD-разрешении
🔘 Использовали архитектуру Kandinsky-DiT с flow matching

🚀 Доступность и информация:
🔘 Лицензия поддерживает коммерческое использование (MIT)
🔘 Все материалы можно найти на GitHub, HuggingFace и GitVerse
🔘 Техрепорт, кстати, уже сейчас #1 в Daily Papers, но ваша поддержка поможет укрепить эту позицию :)

@dendi_math_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥34👍136🆒2👀1
Forwarded from Connect WIT
❗️Ассистент инженера-конструктора в машиностроении
На международной конференции AI Journey («Путешествие в мир искусственного интеллекта») Сбер в партнерстве с Институтом AIRI анонсировали решение для автоматизации конструкторской работы в машиностроении.
Новый ассистент инженера-конструктора на базе модели Cadrille преобразует различные типы данных в готовые цифровые 3D-модели в профессиональной системе автоматизированного проектирования (САПР). Модель конвертирует облака точек, изображения и текстовые описания деталей в сложные инженерные модели. Подробнее на сайте
🔥15❤‍🔥84
Forwarded from Институт AIRI
В финальный научный день AIJ Институт AIRI представил GigaEvo — платформу для автоматизации научных экспериментов по ИИ 🔖

В отличие от существующих решений, GigaEvo использует эволюционный поиск стратегий обучения, что позволяет системе самостоятельно находить и улучшать лучшие подходы без постоянного участия специалистов.

Платформа автоматизирует подбор архитектур, оптимизацию гиперпараметров и тестирование моделей, сокращая время исследований и повышая качество результатов. GigaEvo интегрируется с AutoML и MLOps, поддерживает облачные и корпоративные среды, а также обеспечивает полный контроль над экспериментами в реальном времени.

Тесты показали, что GigaEvo успешно воспроизводит сложные математические задачи и масштабирует исследовательские процессы, которые раньше требовали дорогой инфраструктуры. В перспективе платформа поможет ускорить научные и прикладные разработки в разных сферах — от Data Science до промышленности и финансов.

Интерфейс | GitHub | ТАСС
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥21🔥107🏆3
Я стал соавтором отчёта научно-исследовательского проекта «Горизонты искусственного интеллекта: какими будут технологии ИИ через 10 лет». В проекте приняли участие 270+ ведущих учёных в области ИИ из 36 стран, было проведено 32 глубинных интервью и 21 форсайт-сессия. В составе организаторов сессий была команда моего коллеги Андрея Незнамова из Центра человекоцентричного искусственного интеллекта и стратегическое агентство САПФИР 💪

В исследовании 10 тематических направлений — от алгоритмов машинного обучения до общества в эпоху ИИ. Я отвечал за четвертое направление «Фундаментальные генеративные модели».

Ознакомиться с отчётом можно тут.
4🔥5217❤‍🔥4🏆2👍1😁1
«Смотрели AIJ, мужики? Конечно, круто сделали ребята. Давайте думать, как в следующем году туда попасть хотя бы на стенды…»
😁125🔥116😎3🙊1
Довольно интересную тему поднял Андрей Карпаты в соц сети о различии форм интеллекта: животного и LLM-like.
Перевод, кстати, есть у ребят в @data_secrets.

А я, прочитав, вспомнил, как в этом году дискутировали с коллегой в рамках дня науки на тему эмоций у ИИ. И речь шла примерно в таком же ключе: у человека развитие базируется на выживании в любой ситуации, а ИИ решает задачи так, как ближе к тому, на чём он учился - это ни что иное как имитация (вспоминается фильм 5й элемент, когда Лилу через гигантские объёмы видеоконтента изучала мировую историю).

Эмоции человек «проявляет» по принципу соблюдения заданных в течение жизни шаблонов: родители, друзья, окружение. В процессе жизни только гормоны, необходимость «выжить» в социальном и физическом смысле вносят коррективу в проявление эмоций и формируют отличие homo sapiens от ИИ. Если отключить эти факторы, то будет ли разница между человеком и ИИ?🤔
🔥9🤔8😁2😱2
🔥Ну вот и долгожданный тех репорт о GigaEvo подоспел

https://arxiv.org/abs/2511.17592

GitHub: https://github.com/FusionBrainLab/gigaevo-core

Всем приятного изучения, чуть позже доделаем Хабр💪

Чуть выше делился новостью о релизе фреймворка👆

UPD: ссылка из тех репорта заработала — https://github.com/AIRI-Institute/gigaevo-core
1🔥21🏆8🎉5
10 декабря Сбер проводит «Салют, Гига!» — мероприятие для тех, кто делает AI на практике.

Доклады про последние релизы GigaChat, Kandinsky и GigaData, постерная сессия с командами, воркшопы и карьерная зона.

Если работаете с ML, данными или инфраструктурой — присоединяйтесь!

Участие бесплатное, нужна регистрация.
❤‍🔥10👏51