Нейронавт | Нейросети в творчестве
8.27K subscribers
3.04K photos
2.49K videos
35 files
3.39K links
Канал про нейросети в компьютерной графике, в кино и вообще

для связи @Neuronauticus
Download Telegram
ComfyUI_PuLID_Flux_ll

Обновка ноды персонализатора для #Flux в #ComfyUI

#personalization
CustomVideoX: 3D Reference Attention Driven Dynamic Adaptation for Zero-Shot Customized Video Diffusion Transformers

Видеогенератор с персонализацией, создает видео с объектом, заданным картинкой

За основу берут CogVideoX-5B и прикручивают лору

Код ждем

#personalization #text2video
This media is not supported in your browser
VIEW IN TELEGRAM
Phantom: Subject-Consistent Video Generation via Cross-Modal Alignment

Генерация консистентного видео с заданным объектом по одному референсному изображению от ByteDance сотоварищи

Код ждем вероятность 50/50

#image2video #text2video #personalization
SynCD: Generating Multi-Image Synthetic Data for Text-to-Image Customization

Вообще это инструмент для кастомизации генераторов картинок. А по сути персонализатор. Даем ему три референса нашего объекта и получаем этот объект в разных новых местах - как материал для обучающего датасета

У меня нубский вопрос. Если мы и так уже можем создавать новые изображения нашего объекта, зачем нам еще чего-то там обучать на него?

Код
Демо

#personalization #text2image
DreamEngine

Какая-то хитрая интеграция визуально-языковых моделей с диффузными генераторами для генерации крутых картинок со сложными концепциями

Сайта нет
Код ждем

#text2image #vlm #personalization
Diffusion Self-Distillation for Zero-Shot Customized Image Generation

Персонализация для генераторов картинок.
Применяют самодистилляцию - дообучение модели на ею же сгенерированном наборе пар картинок.

Считают что превзошли все методы персонализации без дообучения.

Метод применим для релайтинга

#тестбендера в комментах

Код
Демо

#text2image #personalization #relighting
Обновки ACE++

Кто не видел, в репозитории редактора изображений от Alibaba ACE++ добавлены воркфлоу #ComfyUI, конфига файнтюна и унифицированная fft модель (что это? сам не знаю, говорят что поддерживает больше задач #image2image)

#personalization #imageediting #inpainting
This media is not supported in your browser
VIEW IN TELEGRAM
Lipdub Translation Editor

Сервис дубляжа/липсинка Lipdub AI представил функцию корректирования перевода.

Вам дают скорректировать текст который будет звучать в финальном дублированном видео на целевом языке.

Дают попробовать даже на бесплатном тарифе

#lipsync #dubbing #personalization #speechediting #speech2speech
This media is not supported in your browser
VIEW IN TELEGRAM
VACE: All-in-One Video Creation and Editing

Видеогенератор от Alibaba / Tongyi Lab
Они прикрутили туда максимум ништяков: Move-Anything, Swap-Anything, Reference-Anything, Expand-Anything, Animate-Anything

VACE может пересоздать видео с сохранением содержимого, структуры, объекта съемки, позы и движения и т.д.

Код и модель ждем

#text2video #video2video #personalization #videoediting
Personalize Anything (for Free with Diffusion Transformer)

Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux

Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды

#personalization #inpainting #outpainting #image2image
From Parts to Whole: A Unified Reference Framework for Controllable Human Image Generation

Еще одна работа тех же авторов, уже несвежая.
Создает изображения людей в различных позах по любому количеству референсов частей человека

Код

#referencing #image2image #personalization
Krea Video Styles

Безобразие. Теперь можно обучать свои лоры Wan на Krea AI. Движение там, объекты, стили

За ваши деньги, конечно

#personalization #training #lora #text2video #image2video
InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity (InfU)

Держите еще один персонализатор от ByteDance

Совместим с Flux и другими DIT.

Обещают высокую идентичность при сохранении возможностей генерации

Выложены модели для Flux. Одна больше для идентичности, другая больше для следования промпту и эстетики

Совместим с Controlnet, Lora и другими плагинами

Код
Демо - ждем, 404
Веса

#personalization #referencing #text2image
Reve Image 1.0

Новый генератор картинок по тексту, по референсу, опередивший на арене (там он под псевдонимом Halfmoon) Flux, Recraft, Image 3

Говорят что без цензуры

Говорят, что пробовать здесь. Но у меня не получилось зайти

#text2image #referencing #personalization