GigaGAN: Scaling up GANs for Text-to-Image Synthesis
GAN'ы возвращаются.
GigaGAN генерирует картинку 512 x 512 за 0.13 секунды, превосходит Stable Diffusion v1.5, DALL·E 2, и Parti-750M по FID (сам не знаю что это). Под капотом миллиард параметров, и работает все это на порядки быстрее авторегрессионных и диффузионных моделей. Ну и конечно, бонусом все прелести непрерывного латентного пространства - красивая анимация без этих всех кипящих фликеров.
А еще волшебный апскейлер!
Смешивание текстовых промптов
Замена грубого стиля на детальный
Кода нет 😢
#gan #text2image #image2image #upscale
GAN'ы возвращаются.
GigaGAN генерирует картинку 512 x 512 за 0.13 секунды, превосходит Stable Diffusion v1.5, DALL·E 2, и Parti-750M по FID (сам не знаю что это). Под капотом миллиард параметров, и работает все это на порядки быстрее авторегрессионных и диффузионных моделей. Ну и конечно, бонусом все прелести непрерывного латентного пространства - красивая анимация без этих всех кипящих фликеров.
А еще волшебный апскейлер!
Смешивание текстовых промптов
Замена грубого стиля на детальный
Кода нет 😢
#gan #text2image #image2image #upscale
Авторы StyleGAN-T поделились кодом. А весами не хотят делиться. Так что если хотите, придется тренить самостоятельно.
Один из авторов собрался присоединиться к StabilityAI и там работать над опенсорсными GAN'ами
Код
#text2image #text2video #text2animation #gan
Один из авторов собрался присоединиться к StabilityAI и там работать над опенсорсными GAN'ами
Код
#text2image #text2video #text2animation #gan
StyleAvatar3D
А вот генератор аватаров по текстовому запросу. Скорость, морфинг через латентное пространство и прочие плюшки технологии #GAN
Код обещают выложить
#3DAvatar #talkinghead
А вот генератор аватаров по текстовому запросу. Скорость, морфинг через латентное пространство и прочие плюшки технологии #GAN
Код обещают выложить
#3DAvatar #talkinghead
This media is not supported in your browser
VIEW IN TELEGRAM
Control4D: Dynamic Portrait Editing by Learning 4D GAN from 2D Diffusion-based Editor
И снова редактор/стилизатор видеоперсонажей по текстовому запросу. На сей раз на основе #GAN. Но это не просто GAN, а GAN, в который завернута и временная составляющая, то есть все видео представлено одним вектором. Благодаря этому разработчики избавились от присущих видеостилизациям артефактов
Ссылка на код пока ведет только на сайт проекта
#video2video #videoavatar #face2face #talkinghead
И снова редактор/стилизатор видеоперсонажей по текстовому запросу. На сей раз на основе #GAN. Но это не просто GAN, а GAN, в который завернута и временная составляющая, то есть все видео представлено одним вектором. Благодаря этому разработчики избавились от присущих видеостилизациям артефактов
Ссылка на код пока ведет только на сайт проекта
#video2video #videoavatar #face2face #talkinghead
This media is not supported in your browser
VIEW IN TELEGRAM
PanoHead: Geometry-Aware 3D Full-Head Synthesis in 360°
Ах, какое полезное изобретение! Генератор полной 3D модели головы по одному фото. В основе модели - 3D GAN. На видео примеры результатов одного реддитора
Код
Колаб
#GAN #3DGAN #imageto3D #image2head
Ах, какое полезное изобретение! Генератор полной 3D модели головы по одному фото. В основе модели - 3D GAN. На видео примеры результатов одного реддитора
Код
Колаб
#GAN #3DGAN #imageto3D #image2head
Нейронавт | Нейросети в творчестве
PanoHead: Geometry-Aware 3D Full-Head Synthesis in 360° Ах, какое полезное изобретение! Генератор полной 3D модели головы по одному фото. В основе модели - 3D GAN. На видео примеры результатов одного реддитора Код Колаб #GAN #3DGAN #imageto3D #image2head
Google
Google Colab Notebook
Run, share, and edit Python notebooks
Нейронавт | Нейросети в творчестве
PanoHead: Geometry-Aware 3D Full-Head Synthesis in 360° Ах, какое полезное изобретение! Генератор полной 3D модели головы по одному фото. В основе модели - 3D GAN. На видео примеры результатов одного реддитора Код Колаб #GAN #3DGAN #imageto3D #image2head
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь в PanoHead можно скормить свои картинки. PNG не принимает, только JPG
Колаб
#GAN #3DGAN #imageto3D #image2head
Колаб
#GAN #3DGAN #imageto3D #image2head
Опубликован evaluation-код GigaGAN
Кто из нас может объяснить что такое evaluation code?
Код
#gan #text2image #image2image #upscale
Кто из нас может объяснить что такое evaluation code?
Код
#gan #text2image #image2image #upscale
Telegram
Нейронавт | Нейросети в творчестве
GigaGAN: Scaling up GANs for Text-to-Image Synthesis
GAN'ы возвращаются.
GigaGAN генерирует картинку 512 x 512 за 0.13 секунды, превосходит Stable Diffusion v1.5, DALL·E 2, и Parti-750M по FID (сам не знаю что это). Под капотом миллиард параметров, и работает…
GAN'ы возвращаются.
GigaGAN генерирует картинку 512 x 512 за 0.13 секунды, превосходит Stable Diffusion v1.5, DALL·E 2, и Parti-750M по FID (сам не знаю что это). Под капотом миллиард параметров, и работает…
This media is not supported in your browser
VIEW IN TELEGRAM
AuraSR
Новый апскейлер на базе архитектуры GigaGAN
Код
Веса
AuraSR-ComfyUI
Демо
#gan #text2image #image2image #upscale
Новый апскейлер на базе архитектуры GigaGAN
Код
Веса
AuraSR-ComfyUI
Демо
#gan #text2image #image2image #upscale