Complete AI
7.85K subscribers
491 photos
35 videos
10 files
268 links
Меня зовут Андрей Кузнецов

Директор лаборатории FusionBrain в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML

Tg: @kuznetsoff87
Linkedin: https://tinyurl.com/y96nmmdd
Download Telegram
Сегодня вышло моё интервью для подкаста «Путь покорителя» от студии Иннополиса.

Рассказал про свои студенческие годы, первые исследования, кто помог сформировать научное мировоззрение, как научная степень помогает решать реальные бизнес-задачи и куда движется современная наука об искусственном интеллекте.

«Современный ученый в области ИИ имеет уникальную возможность — работать на стыке фундаментальной науки и прикладных задач, создавая технологии, которые меняют жизнь миллионов людей. Именно такой синтез дает самые прорывные результаты».


Отдельно поделился советами, с чего начать путь в AI-research в эпоху генеративного ИИ 👋

Интервью можно посмотреть на каналах:

🔘VK Video
🔘YouTube
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥18127❤‍🔥6👍6😁1🌚1🏆1😎1
⚡️⚡️⚡️3 статьи лаборатории приняты на юбилейную 40-ю конференцию AAAI (Core A*)

1) BREPS: Bounding-Box Robustness Evaluation of Promptable Segmentation — о методе синтеза боксов разметки, использование которых позволяет минимизировать или максимизировать ошибку сегментации в зависимости от критерия. Также провели сравнительный анализ современных моделей на 10 наборах данных, содержащих как повседневные сцены, так и медицинские изображения.
Скоро в open source💪

2) NoReGeo: Non-Reasoning Geometry Benchmark — о новом бенчмарке, который показывает, что даже передовые большие языковые модели не способны к прямому геометрическому пониманию без привлечения алгебраических вычислений, и эту проблему нельзя решить простым дообучением. В бенчмарке 2500 задач из 25 категорий.
Скоро в open source💪

3) T-LoRA: Single Image Diffusion Model Customization Without Overfitting — о легковесном методе, который позволяет дообучать диффузионку по одному изображению без переобучения, что актуально, например, для задач персонализированной генерации картинок
👉GitHub
👉Arxiv
1🔥57🏆971
💪Не прошло и дня, как говорится

+2 принятых статьи на международную конференцию WACV (Core A)🔥

1) Features Inversion as a Lens on Vision Encoders

2) MaxInfo: A Training-Free Key-Frame Selection Method Using Maximum Volume for Enhanced Video Understanding
Статья

Про эти работы отдельно в ближайшие дни расскажу
426🔥18🏆11
Forwarded from Домклик PRO
А следом — еще больше инсайтов! В дискуссии про главные тренды в мире ИИ вместе с теми, кто внедряет умные решения для миллионов пользователей, мы обсудим:

🟢Как технологии создают новую ценность для бизнеса и клиентов?

🟢Какие компетенции станут must-have для работы в эпоху AI?

🟢От экспериментов к реальным кейсам: истории внедрения GenAI и автономных агентов

Среди спикеров:

Андрей Кузнецов, директор лаборатории FusionBrain, AIRI; исполнительный директор по исследованию данных, Sber AI
Алексей Назаренко, лидер дивизиона «Lifestyle сервисы в недвижимости», Домклик
Андрей Рыбинцев, управляющий директор по искусственному интеллекту, Авито
Виктор Тарнавский, директор по искусственному интеллекту, Т-Банк

Модератор — Семён Будённый, управляющий директор, Sber AI; руководитель научной группы, AIRI.

Узнайте, какие умные решения меняют мир и бизнес уже сейчас регистрируйтесь и подключайтесь к трансляции💻

🔗 Москва, Навка Арена + 💻💻💻 эксклюзивно в VK Видео
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19❤‍🔥8🙏41👍1🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
В команде Robotics лаборатории исследователь применил свои навыки для прикладных задач робототехники.

Помните, что курение вредит вашему здоровью, а роботы — нет 😎

@dunnolab video production
😁40🔥107🤔1🆒1
Вчера участвовал в Форуме «Цифровые решения», организованный при поддержке Правительства Российской Федерации. Вместе с коллегами из Яндекса, Авито, Лаборатории Касперского и государственных органов провели дискуссию «Когда ИИ становится взрослым: ответственность, доверие, польза».

Обсудили:
➡️ В  чём сегодня фундаментальная ценность искусственного интеллекта для людей, бизнеса и государства?
➡️ Какая роль государства по отношению к отрасли ИИ?
➡️ Развитие ИИ или его регулирование/безопасность?

А какое у вас мнение?
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥2815👍10🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
Команда Robotics лаборатории FusionBrain вместе с командой Адаптивных агентов при поддержке отдела научно-технической разработки запустили проект VLA Arena — платформу для оценки моделей управления роботами. Платформа открыта в тестовом режиме на три месяца (как раз, чтобы на новогодних выходных было чем заняться😏).

VLA Arena поддерживает роботов в симуляции и реальные компактные устройства LeRobot SO-100 и SO-101 от Hugging Face. Пользователь может сравнивать модели в 3D-движке прямо в браузере и подключать свои устройства.

Для тестов доступны открытые VLA-модели:
⚫️π0.5 от Physical Intelligence
⚫️SmolVLA от Hugging Face
⚫️Flower от Intuitive Robots Lab и Microsoft Research
⚫️«Русифицированная» π0.5, адаптированная в AIRI

А для любителей экспериментов и обучения своих моделей для LeRobot мы выложили чистые датасеты из открытых источников, которые были ответственно размечены и переведены на русский язык.

Модели понимают инструкции на естественном языке и могут решать сложные задачи, требующие адаптации к новым объектам и сценам. В сетапе арены пользователи голосуют за модели, которые по их мнению работают лучше, а голоса определяют положение модели в лидерборде.

Поздравляю всех с успешным релизом🦾

Приглашаю активно заходить на арену, оценивать работу моделей, загружать свои, биться за первые места, а мы пока подумаем, как можно порадовать топ лидерборда к Новому Году🏆

@complete_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥22🔥18🏆84👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🦾Продолжаем делиться нашими успехами в области робототехники

Команда Robotics лаборатории FusionBrain выпустила RoboBenchMart — открытый симуляционный ритейл-бенчмарк для роботов. Он включает генератор планов магазина и раскладок товаров, процедуры автоматизированного сбора траекторий, инструменты оценки и набор базовых моделей для сравнения. Показали, что SOTA VLA-модели пока не справляются с ритейл-задачами.

🏠➡️🛒 Сейчас активно развиваются бенчмарки «домашних» помощников, и мы видим наш бенчмарк как их логичное продолжение — шаг к роботу-помощнику, который сможет помочь с покупками, и к работнику для даркстора. В отличие от домашних условий здесь важно надёжное выполнение операций с огромным разнообразием товаров — разных видов, упаковок, форм и размеров — в стеснённых пространствах магазина и склада. Любая ошибка робота — прямой ущерб магазину и клиенту, поэтому критичны надёжность и переносимость решений.

🤖 RoboBenchMart — первый открытый бенчмарк для роботов в ритейле. Он проверяет надёжность выполнения базовых ритейл-задач мобильной манипуляции: взять товар с полки и положить в корзину, достать из холодильника и закрыть дверь, собрать несколько позиций по списку и др.

🧪 Мы проверили VLA-модели общего назначения и смоделировали их реалистичную адаптацию: дообучили на небольшом наборе траекторий, собранных в нашем симуляторе. В обучающих сценариях модели уверенно решают часть простых задач, но на новых раскладках и с незнакомыми товарами качество заметно падает. Это подчёркивает ограничения текущих моделей общего назначения в реальном применении и необходимость дальнейшей проработки ритейл-сценариев.

🚀 Дальше мы будем активно развивать RoboBenchMart: добавлять больше задач, расширять набор воплощений, сцен и товаров, адаптировать новые модели, усиливать базовые решения. Будем рады репостам, звёздочкам на GitHub, цитированиям и коллаборациям — присоединяйтесь!

В рамках этой работы мы очень рады сотрудничать с Центром Робототехники Сбера, чтобы бенчмарк позволял улучшать возможности роботов!

🔗 Ссылки
📍 Препринт (arXiv): https://arxiv.org/abs/2511.10276
📍 GitHub: https://github.com/emb-ai/RoboBenchMart
📍 Project page: https://emb-ai.github.io/robobenchmart-project

@complete_ai
22🔥97🏆3🎉1
Forwarded from Институт AIRI
Завтра стартует международная конференция по искусственному интеллекту AI Journey 2025 🚀

Событие пройдёт с 19 по 21 ноября и будет включать три тематических блока: общество, бизнес и наука. В этом году Институт AIRI представит 25 докладов, 15 постеров и 6 стендов.

Подробная программа и трансляция на сайте. До встречи в онлайне!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤‍🔥24🏆7🔥53
Forwarded from GigaChat
🔥МЫ ПРЕДСТАВЛЯЕМ КРУПНЕЙШИЙ OPEN-SOURCE AI В ЕВРОПЕ 🔥

Мы стремимся не замыкаться в «закрытой» технологии, а строить открытую платформу для всей страны, поэтому мы публикуем веса наших моделей.

Что появилось в открытом доступе ↓

🔷 GigaChat Ultra Preview
Самая мощная модель Сбера. Лучше DeepSeek V3.1 и GigaChat Max 2 в русскоязычных задачах. Подходит для бизнеса, аналитики, разработки и дообучения на своих данных
GitHub | HuggingFace |GitVerse

GigaAM-v3
5 моделей, которые превращают голос в текст с пунктуацией, понимают акценты, спонтанную речь и даже музыкальные запросы. Подойдут для голосовых ассистентов, контакт-центров, аналитики звонков
GitHub | HuggingFace | GitVerse

🔷 GigaChat Lightning
Лёгкая, компактная и быстрая. Конкурирует с Qwen3-4B, по скорости сравнима с Qwen3-1.7B, но намного умнее и больше по параметрам
GitHub | HuggingFace |GitVerse

🔷 Kandinsky 5.0
Создание фото и видео по тексту. Внутри:
• Image Lite — делает изображения в HD, отлично понимает русский язык и культурный контекст
• Video Pro — создаёт до 10 секунд реалистичного HD-видео. Конкурирует с топовыми мировыми моделями
• Video Lite — облегчённая версия для домашней видеокарты (от 12 ГБ)
➡️ GitHub | GitVerse | Hugging Face | Технический репорт

🔷 K-VAE 1.0
Ускорение генеративного AI. Это технологии, которые «упаковывают» картинки и видео в скрытое пространство, чтобы модели работали быстрее и требовали меньше ресурсов. Лучшие среди открытых аналогов
➡️ GitHub|Hugging Face


Код и веса этих всех моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31👍18❤‍🔥7😁2
Forwarded from Dendi Math&AI (Денис Димитров)
🚀 Мы с командой открываем всю линейку генеративных моделей Kandinsky 5.0!

В сентябре мы выложили в open source Kandinsky 5.0 Video Lite, получили множество положительных отзывов и полезной обратной связи, большое спасибо всем!

Сегодня мы открываем всю линейку: как Video, так и Image модели. Дальше расскажу все подробности, но можно сначала сходить попробовать: модели доступны всем на открытых поверхностях ГигаЧат: Telegram, Max и giga.chat

🎬 Video Pro – мощные Text-to-Video и Image-to-Video – лучшие в мире open source модели, превосходящие по качеству Wan 2.2 A14B и работающие наравне с Veo 3 от Google по визуалу и динамике (в HD)

🖼 Image Lite – универсальные Text-to-Image и Image Editing модели c 6B параметров, которые нативно поддерживают промты на русском языке, знают культурный код и генерируют картинки с кириллическим текстом. Значительно превосходит FLUX.1 [dev] в задаче генерации изображений и работают на одном уровне с FLUX.1 Kontext [dev] в их редактировании

В открытом доступе: четыре версии Image Lite и пять версий Video Pro для разных задач (для генерации 5 сек и 10 сек видео, разрешение — SD и HD). Доступны как SFT-версии с максимальным качеством, так и Pretrain, для исследователей и дообучения

🔧 Как мы достигли этого (подробнее в нашем большом техрепорте):
🔘 Большой Pretrain-датасет 520 млн изображений и 250 млн видео-сцен
🔘 Фокус на SFT: художники и дизайнеры тщательно выбирали материалы с безупречной композицией, стилем и визуальным качеством
🔘 Разработали метод NABLA для стабильной 10-секундной генерации в HD-разрешении
🔘 Использовали архитектуру Kandinsky-DiT с flow matching

🚀 Доступность и информация:
🔘 Лицензия поддерживает коммерческое использование (MIT)
🔘 Все материалы можно найти на GitHub, HuggingFace и GitVerse
🔘 Техрепорт, кстати, уже сейчас #1 в Daily Papers, но ваша поддержка поможет укрепить эту позицию :)

@dendi_math_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥34👍136🆒2👀1
Forwarded from Connect WIT
❗️Ассистент инженера-конструктора в машиностроении
На международной конференции AI Journey («Путешествие в мир искусственного интеллекта») Сбер в партнерстве с Институтом AIRI анонсировали решение для автоматизации конструкторской работы в машиностроении.
Новый ассистент инженера-конструктора на базе модели Cadrille преобразует различные типы данных в готовые цифровые 3D-модели в профессиональной системе автоматизированного проектирования (САПР). Модель конвертирует облака точек, изображения и текстовые описания деталей в сложные инженерные модели. Подробнее на сайте
🔥15❤‍🔥84