Complete AI
7.98K subscribers
490 photos
33 videos
10 files
267 links
Меня зовут Андрей Кузнецов

Директор лаборатории FusionBrain в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML

Tg: @kuznetsoff87
Linkedin: https://tinyurl.com/y96nmmdd
Download Telegram
⚡️⚡️⚡️Kandinsky 2.2 выходит в свет

Вот и наступил долгожданный знаменательный день, когда мы готовы порадовать комьюнити новой версией генеративной модели Kandinsky 2.2.

Не буду долго томить вас лирикой и историями, как мы маленькими шагами двигались к качественному скачку эти 3 месяца с момента релиза 2.1, а просто расскажу о ключевых нововведениях:
📌 разрешение генераций теперь достигло 1024 px
📌 генерировать можно с различным соотношением сторон (ура, конец монополии квадратных генераций!)
📌 изображения стали максимально близки к фотореалистичным
📌 у модели появилась возможность изменения частей изображения за счёт внедрения механики ControlNet (пока только на основе карты глубины)
📌 версии 2.1 и 2.2 встроены в самый большой и известный фреймворк генеративных моделей - Diffusers

⚡️В телеграм боте теперь 6 режимов:
1) генерация картинки по тексту
2) смешивание двух изображений
3) смешивание изображения и текста
4) создание вариаций входной картинки
5) локальные изменения с помощью ControlNet механики 💥
6) создание стикеров и стикерпаков по текстовым запросам 💥

Воспользоваться моделью можно тут:
Telegram bot
fusionbrain.ai
HF - Kandinsky community
rudalle.ru
Салют

🧑‍💻Веса prior
🧑‍💻Веса decoder
🧑‍💻GitHub

📕Почитать подробнее про Kandinsky 2.2 можно в новой статье на Хабре.

По вопросам сотрудничества и развития модели пишите в ЛС - с радостью обсудим все идеи😉

P.S. По неожиданной случайности сегодня еще День Фотографа, с чем всех причастных торжественно поздравляю📸 Такой вот подарок для сообщества от нашей команды🎉

⚡️UPD: добавил ссылки на код и веса

@complete_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥95👍16🎉9🏆4❤‍🔥2👎2
⚡️Kandinsky 2.2 очень подходит для мемов😉

«Серьезно? Да, серьезно!» by Kandinsky

Артефакты есть, но outpainting с такой маленькой области - это крайне потешно😂

@complete_ai
🔥44🏆11👍9👎1
Оставлю это тут - вдруг понадобится кому-то. Генератор извинений на все случаи жизни😊

Вводишь в верхнем поле - кому, в нижнем - в чём накосячил, получаешь насыщенное извинение/оправдание. Переводишь любимым сервисом на русский и копируешь в чатик, где самое время для извинения⚡️

https://excuses.ai/
🔥265👍4👏1
🔥Новые возможности Kandinsky 2.2 – ControlNet

Выбираем режим "Перенос стиля", подаём на вход изображение, выбираем "Перенос из текста", пишем промт - получаем результат.
Выглядит потрясающе!
За генерации спасибо @kutsgelya

@complete_ai
👍44🏆5👎2🔥1
На днях NVidia выпустили статью о новом фреймворке DreamTeacher с одноименной статьёй

DreamTeacher: Pretraining Image Backbones with Deep Generative Models

Идея в том, чтобы используя генеративные модели через дистилляцию улучшить признаки карточных backbone моделей в классических задачах компьютерного зрения: сегментация, классификация и тд. (MSE лосс)
Ту же дистилляцию можно применить на конечных задачах с разметкой на генеративных и backbone логитах (кросс энтропия и Dice лосс)

Итог: получился механизм претрейна backbone архитектур на базе генеративных фичей, обладающих семантическим обоснованием.

Статья
Проект

@complete_ai
🔥11💯2
Forwarded from Градиент обреченный (Sergei Averkiev)
🔺 ruGPT-3.5. Открытая русскоязычная LLM от Сбера

Друзья, мы выложили в open source нашу языковую модель (pretrain), на основе которой обучали GigaChat!

🔸 Претрейн довольно большой — 13B (13 миллиардов параметров). Модель видела много разнообразного текста (книги, статьи, чаты и т.д.), в основном на русском языке, а также на английском (около10%). Дополнительно дообучали на коде.

🔸 ruGPT-3.5 13B можно дообучать на инструктивных датасетах и получать свои версии ChatGPT, которые бы хорошо понимали русский язык.

🔸 Решили выложить с открытой лицензией (MIT), так что каких-либо ограничений в этом плане в отличии от LLaMA нет.

Написали небольшой пост про это, прошу поддержать, кому интересно.

👉 Хабр | Hugging Face
🔥47👍9❤‍🔥4👎2