Нейронавт | Нейросети в творчестве
ControlNet ProMax
Обновка ControlNet++ для SDXL.
Обновление ProMaх включает в себя весь существующий набор ControlNet Union, в который добавлены возможности комбинации нескольких типов ControlNet к одному исходному изображению и новые функции Tile Deblur, Tile Superresolution, Tile Variation, Inpaint и Outpaint
Гитхаб
Веса на HF
#controlnet #conditioning #text2image #image2image
ControlNet ProMax
Обновка ControlNet++ для SDXL.
Обновление ProMaх включает в себя весь существующий набор ControlNet Union, в который добавлены возможности комбинации нескольких типов ControlNet к одному исходному изображению и новые функции Tile Deblur, Tile Superresolution, Tile Variation, Inpaint и Outpaint
Гитхаб
Веса на HF
#controlnet #conditioning #text2image #image2image
Нейронавт | Нейросети в творчестве
IP Adapter Instruct: Resolving Ambiguity in Image-based Conditioning using Instruct Prompts
В IP-Adapter-Plus добавили дополнительное обусловливание текстовым промптом.
Код
Демо
#conditioning #personalization #adapter
IP Adapter Instruct: Resolving Ambiguity in Image-based Conditioning using Instruct Prompts
В IP-Adapter-Plus добавили дополнительное обусловливание текстовым промптом.
Код
Демо
#conditioning #personalization #adapter
Нейронавт | Нейросети в творчестве
InstantX FLUX.1-dev-Controlnet-Canny-alpha
Еще один Canny от других людей (файл 7Гб)
#controlnet #flux #conditioning
InstantX FLUX.1-dev-Controlnet-Canny-alpha
Еще один Canny от других людей (файл 7Гб)
#controlnet #flux #conditioning
Нейронавт | Нейросети в творчестве
ControlNeXt: Powerful and Efficient Control for Image and Video Generation
Контроль генерации для различных базовых моделей (SD1.5, SDXL, SD3, SVD) и задач (генерация изображений / видео в различных условиях). Насколько я понял, отличается от #Controlnet компактностью и быстрой сходимостью на обучении (уже на нескольких сотнях шагов)
Код
#conditioning
ControlNeXt: Powerful and Efficient Control for Image and Video Generation
Контроль генерации для различных базовых моделей (SD1.5, SDXL, SD3, SVD) и задач (генерация изображений / видео в различных условиях). Насколько я понял, отличается от #Controlnet компактностью и быстрой сходимостью на обучении (уже на нескольких сотнях шагов)
Код
#conditioning
Нейронавт | Нейросети в творчестве
Опубликован код адаптера стиля RB-Modulation
Код
Демо
#conditioning #text2image #image2image #styletransfer #adapter
Опубликован код адаптера стиля RB-Modulation
Код
Демо
#conditioning #text2image #image2image #styletransfer #adapter
Нейронавт | Нейросети в творчестве
CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation
Какой-то гибрид лоры и контролнет. Они обучили базовый контролнет на базовые знания всех видов управляющих изображений. И чтобы дообучить на что-то конкретное надо всего 1000 пар картинок. И объем дообученного CtrLoRA в 10 раз меньше чем контролнет
На данный момент сделано под SD 1.5. Требует от 9Гб VRAM для 512*512
Код
#finetuning #conditioning #lora #controlnet
CtrLoRA: An Extensible and Efficient Framework for Controllable Image Generation
Какой-то гибрид лоры и контролнет. Они обучили базовый контролнет на базовые знания всех видов управляющих изображений. И чтобы дообучить на что-то конкретное надо всего 1000 пар картинок. И объем дообученного CtrLoRA в 10 раз меньше чем контролнет
На данный момент сделано под SD 1.5. Требует от 9Гб VRAM для 512*512
Код
#finetuning #conditioning #lora #controlnet
Нейронавт | Нейросети в творчестве
Edify Image: High-Quality Image Generation with Pixel Space Laplacian Diffusion Models
Генерация фотореалистичных изображений с пиксельной точностью от Nvidia. Отсутствует CLIP, пиксельное пространство вместо латентного.
Фичи:
- картинки по тексту
- ControlNet-апсемплинг до 4K (генератор выдает 1K)
- поддерживает Controlnet, сети управления
- HDR панорамы 360°
- дообучение, в том числе на несколько объектов
Впечатляет, но
Кода нет
#text2image #panorama #HDR #conditioning #upscale
Edify Image: High-Quality Image Generation with Pixel Space Laplacian Diffusion Models
Генерация фотореалистичных изображений с пиксельной точностью от Nvidia. Отсутствует CLIP, пиксельное пространство вместо латентного.
Фичи:
- картинки по тексту
- ControlNet-апсемплинг до 4K (генератор выдает 1K)
- поддерживает Controlnet, сети управления
- HDR панорамы 360°
- дообучение, в том числе на несколько объектов
Впечатляет, но
Кода нет
#text2image #panorama #HDR #conditioning #upscale
Нейронавт | Нейросети в творчестве
In-Context LoRA (IC-LoRA)
Lora - дообучение генераторов картинок для создания наборов изображений в общем контексте. Иначе говоря, консистентность объектов и их взаимоотношений.
Примеров применения море
Уже на tost.ai
Дружит с ComfyUI
Воркфлоу для раскадровок
Код
Flux Simple Try On на Civitai
#personalization #conditioning #text2image
In-Context LoRA (IC-LoRA)
Lora - дообучение генераторов картинок для создания наборов изображений в общем контексте. Иначе говоря, консистентность объектов и их взаимоотношений.
Примеров применения море
Уже на tost.ai
Дружит с ComfyUI
Воркфлоу для раскадровок
Код
Flux Simple Try On на Civitai
#personalization #conditioning #text2image
Нейронавт | Нейросети в творчестве
OminiControl
Что-то вроде универсального контролнета-айпиадаптера, как я понял. Легковесная система управления для диффузионных трансформеров типа FLUX.
Поддерживает предметно-ориентированное управление и пространственное управление (например Canny, inpainting).
Пусть эта 50-мегабайтная штука заменит 100Гб флюкс тулзов, ну пожалуйста
Код
Демо
#text2image #conditioning
OminiControl
Что-то вроде универсального контролнета-айпиадаптера, как я понял. Легковесная система управления для диффузионных трансформеров типа FLUX.
Поддерживает предметно-ориентированное управление и пространственное управление (например Canny, inpainting).
Пусть эта 50-мегабайтная штука заменит 100Гб флюкс тулзов, ну пожалуйста
Код
Демо
#text2image #conditioning
Нейронавт | Нейросети в творчестве
ControlNets for Stable Diffusion 3.5 Large
Какое совпадение - 2
Вслед за Blackforest Labs, Stability AI выпускают пачку контролнетов к SD 3.5 Large
Blur - апскейлер до 8К и 16К
Canny
Depth
Веса на HF
Гитхаб
Уже в ComfyUI
#conditioning #controlnet #sd35 #text2image #upscale #depth2image
ControlNets for Stable Diffusion 3.5 Large
Какое совпадение - 2
Вслед за Blackforest Labs, Stability AI выпускают пачку контролнетов к SD 3.5 Large
Blur - апскейлер до 8К и 16К
Canny
Depth
Веса на HF
Гитхаб
Уже в ComfyUI
#conditioning #controlnet #sd35 #text2image #upscale #depth2image
Нейронавт | Нейросети в творчестве
OneDiffusion
Единая модель для разных задач, связанных с генерацией и пониманием изображений
- генерация по тексту
- персонализация
- многоракурсная генерация - сразу несколько ракурсов объекта, заданного текстом или референсным изображением
- генерация по техническим картам (по принципу контролнет) и наоборот - генерация карт по картинке
Обучена на 512px и 1024px
Код ждем через 1-2 недели
#text2image #image2image #conditioning #personalization #multiview
OneDiffusion
Единая модель для разных задач, связанных с генерацией и пониманием изображений
- генерация по тексту
- персонализация
- многоракурсная генерация - сразу несколько ракурсов объекта, заданного текстом или референсным изображением
- генерация по техническим картам (по принципу контролнет) и наоборот - генерация карт по картинке
Обучена на 512px и 1024px
Код ждем через 1-2 недели
#text2image #image2image #conditioning #personalization #multiview
Нейронавт | Нейросети в творчестве
В Anychat продолжают прикручивать всякие ништяки. Из интересного помимо языковых моделей:
- генератор картинок Luma Photon
- генератор видео hunyuan video (вкладка Replicate)
- Flux tools (вкладка Replicate)
- генератор видео ltx video (вкладка fal)
- генератор речи Play.ai
Пользуемся: Anychat
#text2video #video2video #image2video #text2speech #controlnet #conditioning #image2image #text2image #flux
В Anychat продолжают прикручивать всякие ништяки. Из интересного помимо языковых моделей:
- генератор картинок Luma Photon
- генератор видео hunyuan video (вкладка Replicate)
- Flux tools (вкладка Replicate)
- генератор видео ltx video (вкладка fal)
- генератор речи Play.ai
Пользуемся: Anychat
#text2video #video2video #image2video #text2speech #controlnet #conditioning #image2image #text2image #flux
Нейронавт | Нейросети в творчестве
Есть код и демо OneDiffusion - генератора/пониматора картинок
Код
Демо сейчас 404 - ждем
Веса на HF
#text2image #image2image #conditioning #personalization #multiview
Есть код и демо OneDiffusion - генератора/пониматора картинок
Код
Демо сейчас 404 - ждем
Веса на HF
#text2image #image2image #conditioning #personalization #multiview
Нейронавт | Нейросети в творчестве
OminiControl Training
Опубликован код обучения универсального управляемого генератора изображений OminiControl
Можете обучить свой собственный OminiControl на базе #flux с любым управлением - примерка, 3D, поза или что-либо еще что придумаете.
Только запаситесь двумя NVIDIA H100, 80GB VRAM. Непонятно почему двумя, ведь столько памяти у одной H100, но по ссылке написано именно так
#finetuning #training #conditioning #text2image
OminiControl Training
Опубликован код обучения универсального управляемого генератора изображений OminiControl
Можете обучить свой собственный OminiControl на базе #flux с любым управлением - примерка, 3D, поза или что-либо еще что придумаете.
Только запаситесь двумя NVIDIA H100, 80GB VRAM. Непонятно почему двумя, ведь столько памяти у одной H100, но по ссылке написано именно так
#finetuning #training #conditioning #text2image
This media is not supported in your browser
VIEW IN TELEGRAM
Нейронавт | Нейросети в творчестве
EditAR: Unified Conditional Generation with Autoregressive Models
Авторегрессионная модель для различных задач управляемой генерации картинок от NVIDIA
- редактирование изображений
- генерация картинки по карте глубины
- генерация по карте краев (canny/edges)
- генерация по сегментной маске
Код ждем
#imageediting #conditioning #controlnet
EditAR: Unified Conditional Generation with Autoregressive Models
Авторегрессионная модель для различных задач управляемой генерации картинок от NVIDIA
- редактирование изображений
- генерация картинки по карте глубины
- генерация по карте краев (canny/edges)
- генерация по сегментной маске
Код ждем
#imageediting #conditioning #controlnet
This media is not supported in your browser
VIEW IN TELEGRAM
Нейронавт | Нейросети в творчестве
JASCO: Joint Audio And Symbolic Conditioning for Temporally Controlled Text-To-Music Generation
Генератор музыки от запрещенной Meta AI на базе audiocraft - опубликован код и веса
На вход принимает текст / аккорды / мелодию / ноты / отдельные партии, например ударные
Есть API, генерирует 10-секундные куски
Обучен на 16000 часов лицензионной музыки
Код
Модель
Jupiter notebook
#music #text2music #conditioning #music2music
JASCO: Joint Audio And Symbolic Conditioning for Temporally Controlled Text-To-Music Generation
Генератор музыки от запрещенной Meta AI на базе audiocraft - опубликован код и веса
На вход принимает текст / аккорды / мелодию / ноты / отдельные партии, например ударные
Есть API, генерирует 10-секундные куски
Обучен на 16000 часов лицензионной музыки
Код
Модель
Jupiter notebook
#music #text2music #conditioning #music2music
This media is not supported in your browser
VIEW IN TELEGRAM
Нейронавт | Нейросети в творчестве
DiffSplat: Repurposing Image Diffusion Models for Scalable 3D Gaussian Splat Generation
Генератор 3D объектов на гауссианах по картинке, по тексту. Поддерживает контроль генерации контролнетом - в примерах есть canny, depth, normals
Модель представляет собой файнтюн PixArt-Sigma-XL-2-512-MS
Код
Веса
Демо ждем
#textto3d #imageto3d #gaussian #conditioning #text2gaussian #image2gaussian
DiffSplat: Repurposing Image Diffusion Models for Scalable 3D Gaussian Splat Generation
Генератор 3D объектов на гауссианах по картинке, по тексту. Поддерживает контроль генерации контролнетом - в примерах есть canny, depth, normals
Модель представляет собой файнтюн PixArt-Sigma-XL-2-512-MS
Код
Веса
Демо ждем
#textto3d #imageto3d #gaussian #conditioning #text2gaussian #image2gaussian