тоже моушн
8.89K subscribers
222 photos
247 videos
3 files
408 links
нейромагия + моушн дизайн
тренды, новости, эксперименты

связь с автором @vsewall
Download Telegram
🎲 OpenAI создали и выложили конкурента DALL-E | GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models

Ни для кого не секрет, что диффузионные модели генерируют высококачественные синтетические изображения, особенно в сочетании с CLIP.

Ресерчеры начали прикручивать CLIP к Diffusion уже давно, но тут за дело взялись ребята из OpenAI!

Результат — просто топ! И для синтеза, и для изменения изображений!

Кроме топовой 3.5B модели, OpanAI выложили модель поменьше в открытый доступ!

Paper Code

🔮Colab GLIDE OpenAI от Мишин Лернинг
Media is too big
VIEW IN TELEGRAM
принял участие в интересном проекте - создание инсталляции для международной биеннале - искусство будущего. в компании приятных ребят генерировали контент с помощью StyleGAN и VQGAN+CLIP. а техническим сетапом и программированием инсталляции занимались ребята из Inty. увидеть объект в живую можно в мультимедиа арт музее на остоженке
Forwarded from Denis Sexy IT 🤖
А тем временем модельку которой я генерировал Ивана Айвазовского и других активно допиливуют в сообществе — посмотрите какая красота поулчается, с телефона некоторые картинки не отличить от фотографий уже (Модель теперь может выдавать 1024x768 на A100) | Автор

Я нашел на Reddit Сolab где это генерится, но это такой монстр что пока в нем тяжело разобраться – желающим, успехов.
Media is too big
VIEW IN TELEGRAM
в честь нового года немного обучил stylegan2 на эстетически прекрасных снежинках Кеннета Либбрехта. результат не такой идеальный как хотелось бы но все равно красиво. кстати недавно вышло видео про процесс выращивания этих снежинок, обязательно к просмотру!

модель снежинок доступна для музыкальных экспериментов в этом колабе
1🔥1
Media is too big
VIEW IN TELEGRAM
завершить этот год хочу таким нейро-ностальгическим постом

спасибо что были рядом)
и всех с наступающим новым годом!
👍7👎2
Forwarded from ExMuffin
This media is not supported in your browser
VIEW IN TELEGRAM
✍️ Text2Voxel v.1.0 👽

Наступил 2022 год и мне хотелось бы пожелать всем вам счастья, любви и благополучия. Я благодарен каждому кто проявляет интерес к моему труду. В новом году будем знакомиться с еще большим количеством интересных нейронок и собирать на них Колабы.

Сегодня мне хотелось бы поделиться Колабом, который по текстовому описанию генерирует воксельный объект. Двухмерные генерации стали трендом предыдущего года. Кто знает, может 3D будет трендом текущего. Внутри основного блока есть куча всяких переменных. Не хотелось усложнять интерфейс, но кому нужна тонкая настройка, тот может открыть код и подправить.

P.S. На видео процесс генерации новогодней елки.

https://colab.research.google.com/github/tg-bomze/collection-of-notebooks/blob/master/Text2Voxel.ipynb
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
попробовал новый отличный колаб Disco Diffusion v4 для анимации по текстовому запросу. интересно было проверить технику работы с ключами - изменениями параметров во времени, получилось вот такое музыкальное видео. на мой взгляд это готовый для продакшна инструмент. он странный, но для каких то задач точно подойдет, он не очень быстрый, зато очень красивый, в нем нельзя дважды получить один результат, но все же это инструмент. очень жду когда же этот метод генерации картинки прикрутят к pytti, это будет вообще бомба!

поймал себя на том что не могу перестать смотреть как генерируется изображение, это похоже на магию, слишком уж художественный результат. каждая картинка прекрасна. но это же и является проблемой - заметны различия между кадрами, это немного похоже на пластилиновую анимацию. уверен в скором времени придумают какой то замедлятор или оптимизируют нынешний способ чтобы картинка менялась более плавно но сохранила такую же степень художественной детализации.
Media is too big
VIEW IN TELEGRAM
референсом к видео из прошлого поста для меня стало вот это видео. здесь картинку создавали VQGAN+CLIP. но самое крутое тут - работа с анимацией параметров поворота и зума. есть привязка к звуку, да не простая а нейросетевая - через Musicnn который "слушает" музыку и GPT-Neo который придумывает текстовый образ. в итоге получается такая "живая" анимация. на минуте очень нравится эффект

оригинальный колаб VQGAN+CLIP с анимацией ключей
видео на ютуб
твиттер

и горячие пирожки!! два новых интересных колаба:
тут есть интерфейс для создания и настраивания ключей
а этот обещает под музыку анимировать, потому что music driven
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn)
This media is not supported in your browser
VIEW IN TELEGRAM
Нвидия Канвас (в девичестве Гоген) обновился до версии 1.1.
И там уже появились первые признаки (очень первичные) pipeline ready инструмента.
В 4 раза большее разрешение, новая ИИ модель с улучшенным качеством и минимизацией артефактов.
И там появился экспорт в Фотошоп!
Где все ваши безумные мазки раскиданы по слоям.
В общем ИИ настойчиво рекомендует "spend more time visualizing ideas" или "ИИ все дорисует за вас".
Пробуем тут: https://www.nvidia.com/en-us/studio/canvas/
This media is not supported in your browser
VIEW IN TELEGRAM
отличная новость: появились два инструмента для автоматизации создания ключей, которые можно использовать в колабах Zooming VQGAN+CLIP и Disco Diffusion. первый позволяет рисовать и редактировать кривую в удобном интерфейсе, а второй генерирует ключи из музыкального файла, плюс в нем можно писать стандартные выражения типа синусов косинусов. в прошлый раз все ключи я прописывал вручную, теперь возможностей гораздо больше)

на видео - абстракция в стиле Кандинского под музыку

keyframe string generator
audio keyframe generator
твиттер Chigozie Nri
👍8🔥5
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
18 месяцев назад: "Обучение NeRF занимает 5 часов..."
2 месяца назад: «Обучение NeRF занимает 5 минут!»
Вчера: «Обучение NeRF занимает 5 секунд!!??»


Умелые инженеры из NVIDIA поженили мульти-скейл хеш таблицу, реализованную на CUDA, с методом NeRF.
Результат: трейн занимает несколько секунд, рендеринг новой сцены делают за десятки миллисекунд в разрешении 1920x1080 🤯.

Конечно, не все так просто. Препроцессинг требует получить позиции камер, используя SfM алгоритмы, например COLMAP, ну а это требует побольше чем пару секунд времени.

Сцена на видео выше тоже довольно громоздкая и тренировка метода заняла несколько минут.

Статья "Instant Neural Graphics Primitives with a Multiresolution Hash Encoding"
>> Pdf >> Project page >> Code
🔥3
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Появился новый демократичный софт для вытягивания рига из видео.
Работает чуть ли не из браузера с вебкой, конечно, стоит готовиться к огромной куче стороннего шума в движениях.

С другой стороны, для панковских проектов будет очень даже кстати, типа nft'шку запилить или что-то подобное, учитывая, что софт фришный.

https://plask.ai/
👍13🔥5😱3
для всех счастливых пользователей pytti прекрасная новость - теперь генераторы ключей от Chigozie Nri подходят и для pytti. формат данных очень странный, но работает. а значит теперь можно делать audio driven ролики прямо в pytti
👍4
Forwarded from Derp Learning
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла новая версия Disco Diffusion - 4.1
Всем шампанского, господа!

Из нового:
- возможность продолжить предыдущую генерацию (привет бесплатные колабы!)
- отключение анимации
- поддержка видео в качестве источника опорных кадров
- улучшение результата (для фото режима)

Колаб
🔥8👍51