Complete AI

Channel created

20:56

Всем привет!

Мой первый пост в канале начинается в самый разгар конференции AIJ🎉

Сегодня 24.11.2022 года - второй день конференции AI Journey, к которой наши команды готовились весь год. У меня будет доклад в секции «Science&Business» в 16.00 (мск).

Расскажу про «Технологии компьютерного зрения в задачах высококачественного синтеза мультимедийного контента». Будут детали про две наших ключевых модели генерации изображений за 2022 год: Kandinsky и Kandinsky 2.0 (кстати, официальный пресс-релиз состоялся вчера - пресс-релиз, Хабр, GitHub, платформа fusionbrain).

Залетайте на прямую трансляцию на сайте AIJ - будет очень интересно!👨‍💻

Буду рад ответить на вопросы по докладу!🎉

P.S. Кстати, на платформе fusionbrain можно поиграть с новым Кандинским в режимах генерации и inpainting/outpainting.

Please open Telegram to view this post

VIEW IN TELEGRAM

AI Journey

Конференция AI Journey 2025. Ключевые спикеры в сфере технологий искусственного интеллекта

Конференция AI Journey 2025. Ключевые спикеры в сфере технологий искусственного интеллекта.

🔥16⚡3🎉3👍1

4.47K viewsedited 07:14

Complete AI

Проверим, добавились ли комментарии!

👀4❤1🤩1🐳1👨‍💻1

709 viewsAndrey Kuznetsov, 08:01

Complete AI

Forwarded from Градиентное погружение (cene655)

🔥 Первая модель для генерации картинок для 100+ языков

Представляю вам модель Кандинский 2.0, над которой мы в Сбере много работали. Весь код и веса модели в опенсурсе!

Принцип её работы - латентная диффузия. Мы взяли мультиязычный CLIP и mt5-small, сделав из них ансамбль.

Вы можете проверить её прямо в браузере без какой-либо регистрации! На ваш выбор: генерация картинок или inpainting.

@gradientdip

статья на хабр
гитхаб

🔥18🍾2

594 viewsAndrey Kuznetsov, 13:37

Complete AI

Хоть это и не относится к теме канала, но тем не менее хочется всех мам поздравить с Днём Матери!

Мама - вечный символ добра, прощения и защиты от всего плохого, а еще самое понятное слово в мире🙏

С праздником! Всем добра🌹

❤28

634 viewsAndrey Kuznetsov, 08:17

Complete AI

Forwarded from эйай ньюз

Хорошая новость для тех, кто не попал на NeurIPS. Скоро стартует курс по диффузионным моделям от Hugging Face 🔥.

А 30 ноября (завтра) его откроют докладами от крутых чуваков - создателей Stable Diffusion (Stability + Runwayml) и Make-a-Video (Meta AI).

Зарегаться можно тут.

@ai_newz

👍10

539 viewsAndrey Kuznetsov, 09:18

Complete AI

Всем привет!

3 декабря в 18.50 (мск) на YaTalks дискутирую с ребятами из Яндекса (Сергей Овчаренко и Валентин Хрульков) на тему:
«Генерация изображений нейросетями: как работают нейросети и изменят ли они мир создания контента».

Обсудим современные архитектуры для генерации изображений, проблемные области генерации, обязательно поговорим, как страшно жить в последние годы дизайнерам от всех этих AI-штучек, да и в целом прикинем, как жить дальше в этом динамично меняющемся мире искусственного интеллекта.

Приходите послушать, вопросы можно оставлять в комментариях к посту или в ходе конференции на платформе.
До встречи на YaTalks!

Описание дискуссии можно найти по ссылке

@complete_ai

yatalks.yandex.ru

Главная конференция Яндекса для IT-сообщества — YaTalks 2023

5 и 6 декабря более 100 экспертов IT-индустрии и учёных выступят в Москве и Белграде с техническими докладами о разработке и ML и с научно-популярными лекциями.

🔥15👍3❤2👏1

774 viewsAndrey Kuznetsov, edited 19:05

Complete AI

Совсем недавно вышла бета версия библиотеки TorchMultimodal (ссылка), в которой авторы постарались собрать все лучшие техники и фичи обучения SoTA мультизадачных мультимодальных (М2) архитектур:
• слои, обработчики для разных модальностей, лосс функции (Contrastive Loss, Codebook слои, Shifted-window Attention, Components for CLIP, Multimodal GPT, Multi Head Attention)
• SoTA архитектуры (FLAVA, DETR, …)
• скрипты обучения и инференса
• примеры использования

Всё это позволит ставить быстрые и удобные эксперименты для обучения М2 моделей.

В довесок авторы сделали интересный пост о распределённом обучении (ссылка), где на примере модели FLAVA (мультимодальный late fusion трансформер) показали, как можно её масштабировать с 350M параметров до 10B. Рассмотрели два ключевых подхода:
1. Distributed Data Parallel - нарезка датасета по воркерам, градиенты синхронизируются ДО обновления весов, по сути вся модель «реплицируется»
2. Fully Sharded Data Parallel - параметры, градиенты и состояния оптимизатора нарезаются (шардируются) по воркерам (а-ля ZeRO-3), перед forward и backward propagation шарды объединяются.

Сравнение производительности (среднее число сэмплов в секунду за исключением первых 100 на warmup) можно оценить на графике.

github
статья про TorchMultimodal
статья про Scaling Multimodal Foundation Models

@complete_ai

🔥8

9.59K viewsAndrey Kuznetsov, edited 20:44

Complete AI

Не смог пройти мимо залипательной штуки, превращающей тебя в героев анимэ (хотя я и не фанат).
UI весь на китайском, но интуитивно понятно (пробуйте на смартфоне, либо окно браузера вытяните в портретный вид).

Кто ты из «Унесённых призраками» можно сгенерить тут.

Кидайте себя крашей в комментах😀

👍20

720 viewsAndrey Kuznetsov, 18:24

About

Blog

Apps

Platform