CustomVideoX: 3D Reference Attention Driven Dynamic Adaptation for Zero-Shot Customized Video Diffusion Transformers
Видеогенератор с персонализацией, создает видео с объектом, заданным картинкой
За основу берут CogVideoX-5B и прикручивают лору
Код ждем
#personalization #text2video
Видеогенератор с персонализацией, создает видео с объектом, заданным картинкой
За основу берут CogVideoX-5B и прикручивают лору
Код ждем
#personalization #text2video
This media is not supported in your browser
VIEW IN TELEGRAM
Phantom: Subject-Consistent Video Generation via Cross-Modal Alignment
Генерация консистентного видео с заданным объектом по одному референсному изображению от ByteDance сотоварищи
Код ждем вероятность 50/50
#image2video #text2video #personalization
Генерация консистентного видео с заданным объектом по одному референсному изображению от ByteDance сотоварищи
Код ждем вероятность 50/50
#image2video #text2video #personalization
SynCD: Generating Multi-Image Synthetic Data for Text-to-Image Customization
Вообще это инструмент для кастомизации генераторов картинок. А по сути персонализатор. Даем ему три референса нашего объекта и получаем этот объект в разных новых местах - как материал для обучающего датасета
У меня нубский вопрос. Если мы и так уже можем создавать новые изображения нашего объекта, зачем нам еще чего-то там обучать на него?
Код
Демо
#personalization #text2image
Вообще это инструмент для кастомизации генераторов картинок. А по сути персонализатор. Даем ему три референса нашего объекта и получаем этот объект в разных новых местах - как материал для обучающего датасета
У меня нубский вопрос. Если мы и так уже можем создавать новые изображения нашего объекта, зачем нам еще чего-то там обучать на него?
Код
Демо
#personalization #text2image
DreamEngine
Какая-то хитрая интеграция визуально-языковых моделей с диффузными генераторами для генерации крутых картинок со сложными концепциями
Сайта нет
Код ждем
#text2image #vlm #personalization
Какая-то хитрая интеграция визуально-языковых моделей с диффузными генераторами для генерации крутых картинок со сложными концепциями
Сайта нет
Код ждем
#text2image #vlm #personalization
Diffusion Self-Distillation for Zero-Shot Customized Image Generation
Персонализация для генераторов картинок.
Применяют самодистилляцию - дообучение модели на ею же сгенерированном наборе пар картинок.
Считают что превзошли все методы персонализации без дообучения.
Метод применим для релайтинга
#тестбендера в комментах
Код
Демо
#text2image #personalization #relighting
Персонализация для генераторов картинок.
Применяют самодистилляцию - дообучение модели на ею же сгенерированном наборе пар картинок.
Считают что превзошли все методы персонализации без дообучения.
Метод применим для релайтинга
#тестбендера в комментах
Код
Демо
#text2image #personalization #relighting
Обновки ACE++
Кто не видел, в репозитории редактора изображений от Alibaba ACE++ добавлены воркфлоу #ComfyUI, конфига файнтюна и унифицированная fft модель (что это? сам не знаю, говорят что поддерживает больше задач #image2image)
#personalization #imageediting #inpainting
Кто не видел, в репозитории редактора изображений от Alibaba ACE++ добавлены воркфлоу #ComfyUI, конфига файнтюна и унифицированная fft модель (что это? сам не знаю, говорят что поддерживает больше задач #image2image)
#personalization #imageediting #inpainting
This media is not supported in your browser
VIEW IN TELEGRAM
Lipdub Translation Editor
Сервис дубляжа/липсинка Lipdub AI представил функцию корректирования перевода.
Вам дают скорректировать текст который будет звучать в финальном дублированном видео на целевом языке.
Дают попробовать даже на бесплатном тарифе
#lipsync #dubbing #personalization #speechediting #speech2speech
Сервис дубляжа/липсинка Lipdub AI представил функцию корректирования перевода.
Вам дают скорректировать текст который будет звучать в финальном дублированном видео на целевом языке.
Дают попробовать даже на бесплатном тарифе
#lipsync #dubbing #personalization #speechediting #speech2speech
This media is not supported in your browser
VIEW IN TELEGRAM
VACE: All-in-One Video Creation and Editing
Видеогенератор от Alibaba / Tongyi Lab
Они прикрутили туда максимум ништяков: Move-Anything, Swap-Anything, Reference-Anything, Expand-Anything, Animate-Anything
VACE может пересоздать видео с сохранением содержимого, структуры, объекта съемки, позы и движения и т.д.
Код и модель ждем
#text2video #video2video #personalization #videoediting
Видеогенератор от Alibaba / Tongyi Lab
Они прикрутили туда максимум ништяков: Move-Anything, Swap-Anything, Reference-Anything, Expand-Anything, Animate-Anything
VACE может пересоздать видео с сохранением содержимого, структуры, объекта съемки, позы и движения и т.д.
Код и модель ждем
#text2video #video2video #personalization #videoediting
Personalize Anything (for Free with Diffusion Transformer)
Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux
Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды
#personalization #inpainting #outpainting #image2image
Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux
Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды
#personalization #inpainting #outpainting #image2image
From Parts to Whole: A Unified Reference Framework for Controllable Human Image Generation
Еще одна работа тех же авторов, уже несвежая.
Создает изображения людей в различных позах по любому количеству референсов частей человека
Код
#referencing #image2image #personalization
Еще одна работа тех же авторов, уже несвежая.
Создает изображения людей в различных позах по любому количеству референсов частей человека
Код
#referencing #image2image #personalization
Krea Video Styles
Безобразие. Теперь можно обучать свои лоры Wan на Krea AI. Движение там, объекты, стили
За ваши деньги, конечно
#personalization #training #lora #text2video #image2video
Безобразие. Теперь можно обучать свои лоры Wan на Krea AI. Движение там, объекты, стили
За ваши деньги, конечно
#personalization #training #lora #text2video #image2video
InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity (InfU)
Держите еще один персонализатор от ByteDance
Совместим с Flux и другими DIT.
Обещают высокую идентичность при сохранении возможностей генерации
Выложены модели для Flux. Одна больше для идентичности, другая больше для следования промпту и эстетики
Совместим с Controlnet, Lora и другими плагинами
Код
Демо - ждем, 404
Веса
#personalization #referencing #text2image
Держите еще один персонализатор от ByteDance
Совместим с Flux и другими DIT.
Обещают высокую идентичность при сохранении возможностей генерации
Выложены модели для Flux. Одна больше для идентичности, другая больше для следования промпту и эстетики
Совместим с Controlnet, Lora и другими плагинами
Код
Демо - ждем, 404
Веса
#personalization #referencing #text2image
Reve Image 1.0
Новый генератор картинок по тексту, по референсу, опередивший на арене (там он под псевдонимом Halfmoon) Flux, Recraft, Image 3
Говорят что без цензуры
Говорят, что пробовать здесь. Но у меня не получилось зайти
#text2image #referencing #personalization
Новый генератор картинок по тексту, по референсу, опередивший на арене (там он под псевдонимом Halfmoon) Flux, Recraft, Image 3
Говорят что без цензуры
Говорят, что пробовать здесь. Но у меня не получилось зайти
#text2image #referencing #personalization