Complete AI
7.85K subscribers
491 photos
35 videos
10 files
268 links
Меня зовут Андрей Кузнецов

Директор лаборатории FusionBrain в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML

Tg: @kuznetsoff87
Linkedin: https://tinyurl.com/y96nmmdd
Download Telegram
Forwarded from Лаборатория ИИ (Артур Ишмаев)
#unrealneural #ЛабораторияИИ #AILAB
Посетили нашим отделом Лаборатории ИИ замечательное мероприятие от коллег из Института Аири ⚡️⚡️⚡️и FusionBrain ⚡️⚡️⚡️
Было очень интересно обсудить актуальные векторы развития генеративного подхода к проектированию. Спасибо за приглашение
119🔥105💯1
Приглашаю на Open Source BootCamp 2025 от ИТМО — 4 дня кода, нейросетей и единомышленников!

🔘Когда: 12–15 ноября
🔘Где: Санкт-Петербург (пространство PEREPLЁT, наб. Обводного канала, 118А лит. У)

Что прокачаете:
⚡️Open Source — от лицензий до комьюнити и практические инструменты для применения
⚡️ИИ-агенты — архитектура мульти-агентных систем
⚡️Реальные кейсы интеграции в бизнес
⚡️Командная реализация проектов от идеи до прототипа

Вы познакомитесь с технологиями моих коллег из Сбера, Центра практического ИИ Сбербанка (Sber AI Lab) — генерального спонсора буткемпа, чьи Open Source проекты стали стандартом индустрии. Поделятся своим опытом и решениями также технические партнёры — Cloud.ru и GitVerse.

➡️Важно:
Мероприятие очное. Организаторы не покрывают дорогу и проживание, но помогут с документами для командировки от вуза/работы.

Успейте зарегистрироваться  (можно индивидуально или в составе готовой команды) до 11 ноября!

Для дополнительной информации присоединяйтесь к каналу и чату буткемпа.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥138👍4🏆2😁1
Всем привет!

Мои хорошие друзья сейчас в поиске кандидатов для расширения команды, занимающейся разработкой методов синтеза сценарного видео💪

Мы строим сложную мультимодальную систему, которая превращает текстовые инструкции в готовые ролики. От идеи до финального видео — через генерацию изображений, видео, аудио и оркестрацию всех процессов.


Технологический стек:
📍Бэкенд & Оркестрация: FastAPI, PostgreSQL, Redis
📍Фронтенд: Vue.js
📍ML-сервисы: генерация изображений (text-to-image/image-to-image), видео (text-to-video/image-to-video), TTS, lipsync, LLM
📍Инфраструктура: MinIO, FFmpeg, on-prem GPU-кластеры, мониторинг, CI/CD

Кого ищут (middle/senior):
📍ML-инженер (Video-Gen)
📍ML-инженер (Image-Gen)
📍ML-инженер (LLM / сценарный ассистент)
📍ML-инженер (TTS / V2A / TTA)
📍DevOps / MLOps
📍Data-инженер
📍Фронтенд-разработчик (Vue)
📍Разметчик данных (изображение/видео/аудио/тексты)

Что будете делать (коротко):
📍Генерация видео/изображений со стабильными персонажами и стилем, lipsync и AV-синхронизация
📍Персонализация (LoRA/PEFT), ускоренный инференс и профилирование GPU
📍Сценарный движок на базе LLM: JSON-структуры, валидации, интеграции с ASR/TTS
📍Промышленный контур: упаковка моделей как сервисов, CI/CD, мониторинг

Условия:
📍Оформление по ТК, конкурентная з/п
📍Современная on-prem инфраструктура, собственные дата-корпуса, доступ к вычислительным ресурсам
📍Прямое влияние на архитектуру продукта и модельный стек
📍Возможен удалённый формат работы из регионов РФ

⚠️Если заинтересовало и появились вопросы — пишите в ЛС @jganeeva.

Буду благодарен за репосты🙏
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥1610
Сегодня вышло моё интервью для подкаста «Путь покорителя» от студии Иннополиса.

Рассказал про свои студенческие годы, первые исследования, кто помог сформировать научное мировоззрение, как научная степень помогает решать реальные бизнес-задачи и куда движется современная наука об искусственном интеллекте.

«Современный ученый в области ИИ имеет уникальную возможность — работать на стыке фундаментальной науки и прикладных задач, создавая технологии, которые меняют жизнь миллионов людей. Именно такой синтез дает самые прорывные результаты».


Отдельно поделился советами, с чего начать путь в AI-research в эпоху генеративного ИИ 👋

Интервью можно посмотреть на каналах:

🔘VK Video
🔘YouTube
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥18127❤‍🔥6👍6😁1🌚1🏆1😎1
⚡️⚡️⚡️3 статьи лаборатории приняты на юбилейную 40-ю конференцию AAAI (Core A*)

1) BREPS: Bounding-Box Robustness Evaluation of Promptable Segmentation — о методе синтеза боксов разметки, использование которых позволяет минимизировать или максимизировать ошибку сегментации в зависимости от критерия. Также провели сравнительный анализ современных моделей на 10 наборах данных, содержащих как повседневные сцены, так и медицинские изображения.
Скоро в open source💪

2) NoReGeo: Non-Reasoning Geometry Benchmark — о новом бенчмарке, который показывает, что даже передовые большие языковые модели не способны к прямому геометрическому пониманию без привлечения алгебраических вычислений, и эту проблему нельзя решить простым дообучением. В бенчмарке 2500 задач из 25 категорий.
Скоро в open source💪

3) T-LoRA: Single Image Diffusion Model Customization Without Overfitting — о легковесном методе, который позволяет дообучать диффузионку по одному изображению без переобучения, что актуально, например, для задач персонализированной генерации картинок
👉GitHub
👉Arxiv
1🔥57🏆971
💪Не прошло и дня, как говорится

+2 принятых статьи на международную конференцию WACV (Core A)🔥

1) Features Inversion as a Lens on Vision Encoders

2) MaxInfo: A Training-Free Key-Frame Selection Method Using Maximum Volume for Enhanced Video Understanding
Статья

Про эти работы отдельно в ближайшие дни расскажу
426🔥18🏆11
Forwarded from Домклик PRO
А следом — еще больше инсайтов! В дискуссии про главные тренды в мире ИИ вместе с теми, кто внедряет умные решения для миллионов пользователей, мы обсудим:

🟢Как технологии создают новую ценность для бизнеса и клиентов?

🟢Какие компетенции станут must-have для работы в эпоху AI?

🟢От экспериментов к реальным кейсам: истории внедрения GenAI и автономных агентов

Среди спикеров:

Андрей Кузнецов, директор лаборатории FusionBrain, AIRI; исполнительный директор по исследованию данных, Sber AI
Алексей Назаренко, лидер дивизиона «Lifestyle сервисы в недвижимости», Домклик
Андрей Рыбинцев, управляющий директор по искусственному интеллекту, Авито
Виктор Тарнавский, директор по искусственному интеллекту, Т-Банк

Модератор — Семён Будённый, управляющий директор, Sber AI; руководитель научной группы, AIRI.

Узнайте, какие умные решения меняют мир и бизнес уже сейчас регистрируйтесь и подключайтесь к трансляции💻

🔗 Москва, Навка Арена + 💻💻💻 эксклюзивно в VK Видео
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19❤‍🔥8🙏41👍1🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
В команде Robotics лаборатории исследователь применил свои навыки для прикладных задач робототехники.

Помните, что курение вредит вашему здоровью, а роботы — нет 😎

@dunnolab video production
😁40🔥107🤔1🆒1
Вчера участвовал в Форуме «Цифровые решения», организованный при поддержке Правительства Российской Федерации. Вместе с коллегами из Яндекса, Авито, Лаборатории Касперского и государственных органов провели дискуссию «Когда ИИ становится взрослым: ответственность, доверие, польза».

Обсудили:
➡️ В  чём сегодня фундаментальная ценность искусственного интеллекта для людей, бизнеса и государства?
➡️ Какая роль государства по отношению к отрасли ИИ?
➡️ Развитие ИИ или его регулирование/безопасность?

А какое у вас мнение?
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥2815👍10🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
Команда Robotics лаборатории FusionBrain вместе с командой Адаптивных агентов при поддержке отдела научно-технической разработки запустили проект VLA Arena — платформу для оценки моделей управления роботами. Платформа открыта в тестовом режиме на три месяца (как раз, чтобы на новогодних выходных было чем заняться😏).

VLA Arena поддерживает роботов в симуляции и реальные компактные устройства LeRobot SO-100 и SO-101 от Hugging Face. Пользователь может сравнивать модели в 3D-движке прямо в браузере и подключать свои устройства.

Для тестов доступны открытые VLA-модели:
⚫️π0.5 от Physical Intelligence
⚫️SmolVLA от Hugging Face
⚫️Flower от Intuitive Robots Lab и Microsoft Research
⚫️«Русифицированная» π0.5, адаптированная в AIRI

А для любителей экспериментов и обучения своих моделей для LeRobot мы выложили чистые датасеты из открытых источников, которые были ответственно размечены и переведены на русский язык.

Модели понимают инструкции на естественном языке и могут решать сложные задачи, требующие адаптации к новым объектам и сценам. В сетапе арены пользователи голосуют за модели, которые по их мнению работают лучше, а голоса определяют положение модели в лидерборде.

Поздравляю всех с успешным релизом🦾

Приглашаю активно заходить на арену, оценивать работу моделей, загружать свои, биться за первые места, а мы пока подумаем, как можно порадовать топ лидерборда к Новому Году🏆

@complete_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥22🔥18🏆84👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🦾Продолжаем делиться нашими успехами в области робототехники

Команда Robotics лаборатории FusionBrain выпустила RoboBenchMart — открытый симуляционный ритейл-бенчмарк для роботов. Он включает генератор планов магазина и раскладок товаров, процедуры автоматизированного сбора траекторий, инструменты оценки и набор базовых моделей для сравнения. Показали, что SOTA VLA-модели пока не справляются с ритейл-задачами.

🏠➡️🛒 Сейчас активно развиваются бенчмарки «домашних» помощников, и мы видим наш бенчмарк как их логичное продолжение — шаг к роботу-помощнику, который сможет помочь с покупками, и к работнику для даркстора. В отличие от домашних условий здесь важно надёжное выполнение операций с огромным разнообразием товаров — разных видов, упаковок, форм и размеров — в стеснённых пространствах магазина и склада. Любая ошибка робота — прямой ущерб магазину и клиенту, поэтому критичны надёжность и переносимость решений.

🤖 RoboBenchMart — первый открытый бенчмарк для роботов в ритейле. Он проверяет надёжность выполнения базовых ритейл-задач мобильной манипуляции: взять товар с полки и положить в корзину, достать из холодильника и закрыть дверь, собрать несколько позиций по списку и др.

🧪 Мы проверили VLA-модели общего назначения и смоделировали их реалистичную адаптацию: дообучили на небольшом наборе траекторий, собранных в нашем симуляторе. В обучающих сценариях модели уверенно решают часть простых задач, но на новых раскладках и с незнакомыми товарами качество заметно падает. Это подчёркивает ограничения текущих моделей общего назначения в реальном применении и необходимость дальнейшей проработки ритейл-сценариев.

🚀 Дальше мы будем активно развивать RoboBenchMart: добавлять больше задач, расширять набор воплощений, сцен и товаров, адаптировать новые модели, усиливать базовые решения. Будем рады репостам, звёздочкам на GitHub, цитированиям и коллаборациям — присоединяйтесь!

В рамках этой работы мы очень рады сотрудничать с Центром Робототехники Сбера, чтобы бенчмарк позволял улучшать возможности роботов!

🔗 Ссылки
📍 Препринт (arXiv): https://arxiv.org/abs/2511.10276
📍 GitHub: https://github.com/emb-ai/RoboBenchMart
📍 Project page: https://emb-ai.github.io/robobenchmart-project

@complete_ai
22🔥97🏆3🎉1
Forwarded from Институт AIRI
Завтра стартует международная конференция по искусственному интеллекту AI Journey 2025 🚀

Событие пройдёт с 19 по 21 ноября и будет включать три тематических блока: общество, бизнес и наука. В этом году Институт AIRI представит 25 докладов, 15 постеров и 6 стендов.

Подробная программа и трансляция на сайте. До встречи в онлайне!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤‍🔥24🏆7🔥53