Self-Forcing: Making AI Video Generation Endless
Эксперимент по достижению бесконечной видеогенерации без деградации.
Для эксперимента автор выбрал архитектуру Self-Forcing
Контекст Self-Forcing ограничен 81 кадром, что жестко прописано в кодовой базе, что автор и пытался преодолеть.
В процессе ему удалось реализовать интересную идею: редактирование видео в реальном времени, вернее на лету, в процессе генерации
И выложил все в опенсорс
Требования: 24Gb VRAM, 64Gb RAM, Linux
Гитхаб
Реддит
#optimization #video2video #videoediting #realtime #text2video
Эксперимент по достижению бесконечной видеогенерации без деградации.
Для эксперимента автор выбрал архитектуру Self-Forcing
Контекст Self-Forcing ограничен 81 кадром, что жестко прописано в кодовой базе, что автор и пытался преодолеть.
В процессе ему удалось реализовать интересную идею: редактирование видео в реальном времени, вернее на лету, в процессе генерации
И выложил все в опенсорс
Требования: 24Gb VRAM, 64Gb RAM, Linux
Гитхаб
Реддит
#optimization #video2video #videoediting #realtime #text2video
🔥7👍4
Hunyuan World Model 1.0-Lite
Облегченная версия генератора 3D миров HunyuanWorld-1.0
Требования к VRAM снизили с 26 до 17 ГБ благодаря FP8-квантованию. Ну могли бы и до 16 уж дотянуть🤩
SageAttention уже прикручен.
Гитхаб
Hugging Face
Демо
#text2world #image2world #text2panorama #image2panorama #360 #text2scene #image2scene #world
Облегченная версия генератора 3D миров HunyuanWorld-1.0
Требования к VRAM снизили с 26 до 17 ГБ благодаря FP8-квантованию. Ну могли бы и до 16 уж дотянуть
SageAttention уже прикручен.
Гитхаб
Hugging Face
Демо
#text2world #image2world #text2panorama #image2panorama #360 #text2scene #image2scene #world
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤1😁1
Qwen-Image-Edit: Image Editing with Higher Quality and Efficiency
Редактирующая модель #qwenimage опубликована
Семантическое и визуальное редактирование: модель поддерживает как низкоуровневое редактирование внешнего вида (добавление, удаление или изменение элементов с сохранением остальных частей изображения), так и высокоуровневое семантическое редактирование (создание интеллектуальной собственности, поворот объектов, перенос стиля).
Точное редактирование текста: возможность добавлять, удалять и изменять текст на изображениях на китайском и английском языках с сохранением шрифта, размера и стиля.
Гитхаб
HF ~57 Gb, смотрите не надорвитесь
Попробовать в чате
#imageediting
Редактирующая модель #qwenimage опубликована
Семантическое и визуальное редактирование: модель поддерживает как низкоуровневое редактирование внешнего вида (добавление, удаление или изменение элементов с сохранением остальных частей изображения), так и высокоуровневое семантическое редактирование (создание интеллектуальной собственности, поворот объектов, перенос стиля).
Точное редактирование текста: возможность добавлять, удалять и изменять текст на изображениях на китайском и английском языках с сохранением шрифта, размера и стиля.
Гитхаб
HF ~57 Gb, смотрите не надорвитесь
Попробовать в чате
#imageediting
👍11🔥6😁2❤1🤯1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Qwen Edit супротив Nano banana супротив Flux Kontext Pro & Flux Kontext dev.
Prompt: Make the motorcycle pink and place it against a backdrop of a big city at night, brightly lit by large neon signs.
Banano - хорош!
@cgevent
Prompt: Make the motorcycle pink and place it against a backdrop of a big city at night, brightly lit by large neon signs.
Banano - хорош!
@cgevent
❤3👍3👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Заработал демоспейс аниматора ToonComposer
Демо
#sketch2animation #animation #frameinterpolation #anime
Демо
#sketch2animation #animation #frameinterpolation #anime
👍1