LTXV
Новый видеогенератор.
Опенсорс.
2B параметров
Рилтайм 24 FPS 768x512
Основной чекпойнт 10Гб
по тексту / по картинке / по видео
Гитхаб
Демо (fal.ai)
ComfyUI
Веса
#text2video #video2video #image2video
Новый видеогенератор.
Опенсорс.
2B параметров
Рилтайм 24 FPS 768x512
Основной чекпойнт 10Гб
по тексту / по картинке / по видео
Гитхаб
Демо (fal.ai)
ComfyUI
Веса
#text2video #video2video #image2video
Я тут сделал мемную картинку, но хочу чтобы она осталась инкогнито, поэтому навалю чужих мемных картинок. В комментариях еще
#humor
#humor
Генератор 3D Edify 3D от Nvidia/shutterstock уже можно попробовать в демо (50 попыток) и кажется, юзать по API
Попробовать
#textto3d #imageto3d
Попробовать
#textto3d #imageto3d
Telegram
Нейронавт | Нейросети в творчестве
Edify 3D: Scalable High-Quality 3D Asset Generation
Генератор 3D объектов с PBR материалами от NVIDIA. Красиво, но этих рыбов только показывают
Кода нет
#textto3d
Генератор 3D объектов с PBR материалами от NVIDIA. Красиво, но этих рыбов только показывают
Кода нет
#textto3d
SAMURAI: Adapting Segment Anything Model for Zero-Shot Visual Tracking with Motion-Aware Memory
Прокачанный сегментатор на основе SAM2 для визуального отслеживания объектов
Код
#segmentation #video2mask
Прокачанный сегментатор на основе SAM2 для визуального отслеживания объектов
Код
#segmentation #video2mask
This media is not supported in your browser
VIEW IN TELEGRAM
EchoMimicV2: Towards Striking, Simplified, and Semi-Body Human Animation
Вторая версия оживлятора работает с поясными портретами
Код
ComfyUI
#image2video #humananimation #speech2video #pose2video #talkinghead
Вторая версия оживлятора работает с поясными портретами
Код
ComfyUI
#image2video #humananimation #speech2video #pose2video #talkinghead
InstantX Flux.1 Dev IP Adapter
Кажется я о нем не писал
Похоже, есть на tost.ai
Демо
ComfyUI-IPAdapter-Flux
#personalization
Кажется я о нем не писал
Похоже, есть на tost.ai
Демо
ComfyUI-IPAdapter-Flux
#personalization
Появился демоспейс видеогенератора LTXV на HF.
И еще его зачем-то завезли в Anychat
Демо
#text2video #video2video #image2video #neuronaut_art
И еще его зачем-то завезли в Anychat
Демо
#text2video #video2video #image2video #neuronaut_art
DINO-X: A Unified Vision Model for Open-World Object Detection and Understanding
Единая модель визуального обнаружения и понимания. Есть API. На гитхабе полугодовой давности версия 1.6. Ну правильно, а как продавать API
Playground (попробовать)
Гитхаб (там старая версия)
#segmentation #detection #image2pose
Единая модель визуального обнаружения и понимания. Есть API. На гитхабе полугодовой давности версия 1.6. Ну правильно, а как продавать API
Playground (попробовать)
Гитхаб (там старая версия)
#segmentation #detection #image2pose
LLaVA-CoT: Let Vision Language Models Reason Step-by-Step
Рассуждающая визуально-языковая модель (VLM)
Гитхаб
Демо
#VLM #assistant
Рассуждающая визуально-языковая модель (VLM)
Гитхаб
Демо
#VLM #assistant
freesana.ai
Бесплатный веб интерфейс нвидиевской Sana_1600M_1024px
Удалось зайти черезVP[цензура]
#text2image #online
Бесплатный веб интерфейс нвидиевской Sana_1600M_1024px
Удалось зайти через
#text2image #online