TIPSv2
Гугл выпустил модель предсказания плотности а потом "впустил обратно" - страница модели выдает 404
Но поисковые ИИшки помнят как ее устанавливать. Наверняка ничего не получится без доступа к модели
TIPSv2 предсказывает визуальные признаки, согласованные с текстовыми эмбеддингами, дальше с ними могут работать визуальные пониматоры
[UPDATE] Найдено на ModelScope, как я и надеялся, спасибо @p0lygon
#image2depth #image2normals
Гугл выпустил модель предсказания плотности а потом "впустил обратно" - страница модели выдает 404
Но поисковые ИИшки помнят как ее устанавливать. Наверняка ничего не получится без доступа к модели
TIPSv2 предсказывает визуальные признаки, согласованные с текстовыми эмбеддингами, дальше с ними могут работать визуальные пониматоры
[UPDATE] Найдено на ModelScope, как я и надеялся, спасибо @p0lygon
#image2depth #image2normals
🤔3👍2
Media is too big
VIEW IN TELEGRAM
LPM 1.0
Видеогенератор диалоговых видео с персонажами в реальном времени
— генерирует видео с полнодуплексной беседой
— сохраняет идентичность персонажа при бесконечной генерации
— создаёт эмоциональные и вокальные выступления с точной синхронизацией губ и ритма тела
— совместима с аудио-в-аудио моделями вроде ChatGPT
— управляется мультимодально — через текст, аудио и изображения
— передаёт микровыражения и нюансы человеческого общения
Проект исследовательский, ни опенсорс, ни коммерческий релиз не запланированы
#research #dialog #realtime #characteranimation #av #lipsync
Видеогенератор диалоговых видео с персонажами в реальном времени
— генерирует видео с полнодуплексной беседой
— сохраняет идентичность персонажа при бесконечной генерации
— создаёт эмоциональные и вокальные выступления с точной синхронизацией губ и ритма тела
— совместима с аудио-в-аудио моделями вроде ChatGPT
— управляется мультимодально — через текст, аудио и изображения
— передаёт микровыражения и нюансы человеческого общения
Проект исследовательский, ни опенсорс, ни коммерческий релиз не запланированы
#research #dialog #realtime #characteranimation #av #lipsync
🤷♂6👍4❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Lava Genie
Какой ужас. Я понял что почувствовали художники когда пришли ИИ-художники
Там можно настраивать на грифе аккорды, на деке контроль страма, какие-то пресеты и даже вы не поверите - режим творчества.
Первое впечатление - тупо самоиграйка в форме гитары которая умеет выдавать несколько вариантов арпеджио. Но нет, не тупо, там есть иишка для сочинения музыки. Но выглядит как выкидыш диджея
Полный видеоролик сюда не влез, ищите на сайте
А вообще у них есть и настоящая умная гитара со струнами
#music #guitar
Какой ужас. Я понял что почувствовали художники когда пришли ИИ-художники
Там можно настраивать на грифе аккорды, на деке контроль страма, какие-то пресеты и даже вы не поверите - режим творчества.
Первое впечатление - тупо самоиграйка в форме гитары которая умеет выдавать несколько вариантов арпеджио. Но нет, не тупо, там есть иишка для сочинения музыки. Но выглядит как выкидыш диджея
Полный видеоролик сюда не влез, ищите на сайте
А вообще у них есть и настоящая умная гитара со струнами
#music #guitar
😁7👎3❤1👍1🍌1
This media is not supported in your browser
VIEW IN TELEGRAM
Waypoint-1.5
Обновка генератора интерактивных игровых миров в реальном времени от Overworld
Фишка этих ребят в том что ориентируются на домашнее железо и локальный запуск
Две модели: 720p для мощных систем и 360p для более широкого спектра ПК, в будущем — поддержка Apple Silicon
Похоже, даже не для самых богатых конфигураций 60азы при 720p должно быть реально
Установка
Демо
HF демо
Спасибо @EvgenyiPerm
#world #interactive #text2world
Обновка генератора интерактивных игровых миров в реальном времени от Overworld
Фишка этих ребят в том что ориентируются на домашнее железо и локальный запуск
Две модели: 720p для мощных систем и 360p для более широкого спектра ПК, в будущем — поддержка Apple Silicon
Похоже, даже не для самых богатых конфигураций 60азы при 720p должно быть реально
Установка
Демо
HF демо
Спасибо @EvgenyiPerm
#world #interactive #text2world
🔥7👍4
This media is not supported in your browser
VIEW IN TELEGRAM
camera-comfyUI
Кастом пак для свободного движения камеры и создания 6dof (6 степеней свободы) сцен из фото
Работает с проекциями камеры, преобразует глубину в облака точек, анимирует траектории камеры, делает аутпейнтинг, поддерживает различные типы проекций (pinhole, fisheye, equirectangular)
Хабр
#comfyui #cameracontrol
Кастом пак для свободного движения камеры и создания 6dof (6 степеней свободы) сцен из фото
Работает с проекциями камеры, преобразует глубину в облака точек, анимирует траектории камеры, делает аутпейнтинг, поддерживает различные типы проекций (pinhole, fisheye, equirectangular)
Хабр
#comfyui #cameracontrol
🍌4🔥2🤔2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Обновки по кееру CorridorKey
OFX плагин для DaVinci Resolve https://github.com/alexandremendoncaalvaro/CorridorKey-Runtime
Облачный CorridorKey на мощностях добровольцев, посмотрим сколько проживет https://corridorkey.cloud/
На той же платформе - многопользовательсткая студия-ферма для профессиональных пайплайнов https://github.com/JamesNyeVRGuy/CorridorKey-Cloud
Форк с мультиGPU и оптимизациями до ~2-3 GB VRAM https://github.com/99oblivius/CorridorKey-Engine
#davinci #plugin #keying #exr #compositing
OFX плагин для DaVinci Resolve https://github.com/alexandremendoncaalvaro/CorridorKey-Runtime
Облачный CorridorKey на мощностях добровольцев, посмотрим сколько проживет https://corridorkey.cloud/
На той же платформе - многопользовательсткая студия-ферма для профессиональных пайплайнов https://github.com/JamesNyeVRGuy/CorridorKey-Cloud
Форк с мультиGPU и оптимизациями до ~2-3 GB VRAM https://github.com/99oblivius/CorridorKey-Engine
#davinci #plugin #keying #exr #compositing
👍9😁1
Media is too big
VIEW IN TELEGRAM
KupkaProd Cinema Pipeline
Самоироничная ИИ-студия для создания мультишот видео по промпту.
ComfyUI / Ollama
Gemma 4 E4B / LTX-2.3
— разбивает сценарий на сцены
— пишет описания персонажей
— планирует ракурсы и освещение
— создаёт раскадровку
— генерирует несколько вариантов каждой сцены
— собирает финальный ролик из лучших дублей
Самоироничная потому что Kupka в переводе с польского - кучка (сами знаете чего). Говнопродакшен, короче
#tools #multishot #desktop #studio #ltx23
Самоироничная ИИ-студия для создания мультишот видео по промпту.
ComfyUI / Ollama
Gemma 4 E4B / LTX-2.3
— разбивает сценарий на сцены
— пишет описания персонажей
— планирует ракурсы и освещение
— создаёт раскадровку
— генерирует несколько вариантов каждой сцены
— собирает финальный ролик из лучших дублей
Самоироничная потому что Kupka в переводе с польского - кучка (сами знаете чего). Говнопродакшен, короче
#tools #multishot #desktop #studio #ltx23
👍6😁1
This media is not supported in your browser
VIEW IN TELEGRAM
LTX-2.3 22B IC-LoRA Outpaint
Оутпейнт лора для #LTX23
Расширяет границы кадра
Спасибо @m_franz
#lora #outpainting
Оутпейнт лора для #LTX23
Расширяет границы кадра
Спасибо @m_franz
#lora #outpainting
👍6🔥2😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Pika предложила пользователям монетизировать цифровых двойников AI Selfes
https://www.pika.me/onboarding
#humanavatar #digitaltwin #agent
https://www.pika.me/onboarding
#humanavatar #digitaltwin #agent
👀4🌚1 1
SpatialEdit-16B
Модель для продвинутого редактирования изображений с учётом пространственных инструкций на базе Qwen3-VL-8B-Instruct +видеогенератор
Картинкогенератор получает исходный кадр, создает конечный. По ним видеогенератор создает видео
- перемещает и вращает объекты
- меняет траекторию камеры
- сохраняет реалистичность сцены и идентичность объектов
Гитхаб
HF
Спасибо @m_franz
#imageediting #fflf #image2video
Модель для продвинутого редактирования изображений с учётом пространственных инструкций на базе Qwen3-VL-8B-Instruct +видеогенератор
Картинкогенератор получает исходный кадр, создает конечный. По ним видеогенератор создает видео
- перемещает и вращает объекты
- меняет траекторию камеры
- сохраняет реалистичность сцены и идентичность объектов
Гитхаб
HF
Спасибо @m_franz
#imageediting #fflf #image2video
❤4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Vanast
Видеопримерочная с анимацией изображения человека по контролю позы.
Может переносить несколько предметов одежды одновременно
Гитхаб ждем
#tryon #image2video #referencing #humananimation
Видеопримерочная с анимацией изображения человека по контролю позы.
Может переносить несколько предметов одежды одновременно
Гитхаб ждем
#tryon #image2video #referencing #humananimation
❤6
В Qwen Code появились новые возможности
— можно управлять кодом удалённо через Telegram, DingTalk и WeChat: отправляешь сообщение боту — он выполняет команду и присылает результат
— можно настраивать повторяющиеся задачи с помощью cron-заданий: например, проверять прохождение тестов каждые 30 минут или регулярно собирать проект
— для подзадач теперь можно назначать разные модели: основная задача может работать на Qwen3.6-Plus, а подзадачи — на более простых моделях, например, openai:qwen3.5-plus
#coding
— можно управлять кодом удалённо через Telegram, DingTalk и WeChat: отправляешь сообщение боту — он выполняет команду и присылает результат
— можно настраивать повторяющиеся задачи с помощью cron-заданий: например, проверять прохождение тестов каждые 30 минут или регулярно собирать проект
— для подзадач теперь можно назначать разные модели: основная задача может работать на Qwen3.6-Plus, а подзадачи — на более простых моделях, например, openai:qwen3.5-plus
#coding
👍9❤1
Ltx2.3-VBVR-lora-I2V
Лора-улучшайзер #LTX23 обученная на VBVR - датасете понимания и рассуждения по видео.
— понимает сложные запросы с описанием нескольких объектов и условий
— создаёт плавное и реалистичное движение объектов
— сохраняет внешний вид объектов, освещение и общую согласованность сцены в видео
— точно контролирует длительность действий и синхронизирует движения разных элементов
— работает со сложными сценами, где несколько объектов взаимодействуют друг с другом (сталкиваются, следуют друг за другом, избегают столкновений)
— держит камеру в стабильном положении, не даёт ей «трястись» или неожиданно менять ракурс
Спасибо @m_franz
#lora #optimization
Лора-улучшайзер #LTX23 обученная на VBVR - датасете понимания и рассуждения по видео.
— понимает сложные запросы с описанием нескольких объектов и условий
— создаёт плавное и реалистичное движение объектов
— сохраняет внешний вид объектов, освещение и общую согласованность сцены в видео
— точно контролирует длительность действий и синхронизирует движения разных элементов
— работает со сложными сценами, где несколько объектов взаимодействуют друг с другом (сталкиваются, следуют друг за другом, избегают столкновений)
— держит камеру в стабильном положении, не даёт ей «трястись» или неожиданно менять ракурс
Спасибо @m_franz
#lora #optimization
huggingface.co
LiconStudio/Ltx2.3-VBVR-lora-I2V · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍14
Gemopus-4-26B-A4B-it
Gemma 4 дообученная на стиле рассуждений Claude Opus
— избавлена от «машинного» тона и избыточных формулировок, разговоры с моделью стали более естественными
— лучше организует длинные ответы, использует Markdown для структурирования — списки, выделение жирным, чтобы ключевые моменты были хорошо видны
— объясняет сложные вещи проще, не превращая ответы в энциклопедические статьи
#assistant #reasoning #gguf
Сила Claude Opus, но маленькая и локальная
Gemma 4 дообученная на стиле рассуждений Claude Opus
— избавлена от «машинного» тона и избыточных формулировок, разговоры с моделью стали более естественными
— лучше организует длинные ответы, использует Markdown для структурирования — списки, выделение жирным, чтобы ключевые моменты были хорошо видны
— объясняет сложные вещи проще, не превращая ответы в энциклопедические статьи
#assistant #reasoning #gguf
huggingface.co
Jackrong/Gemopus-4-26B-A4B-it-GGUF · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍15
ComfyStudio
ИИ-студия на ComfyUI
Монтаж на таймлинии, генерация изображений и видео, постобработка
Гитхаб
Спасибо @muxastarikov
#studio #desktop #comfyui
ИИ-студия на ComfyUI
Монтаж на таймлинии, генерация изображений и видео, постобработка
Гитхаб
Спасибо @muxastarikov
#studio #desktop #comfyui
❤7
acestep.cpp
Портативная реализация генератора музыки ACE-Step 1.5 на C++17 с GGML
CPU, CUDA, ROCm, Metal, Vulkan
Поддержка лор, квантованных моделей. XL тоже должен работать
#musicediting #text2music
Портативная реализация генератора музыки ACE-Step 1.5 на C++17 с GGML
CPU, CUDA, ROCm, Metal, Vulkan
Поддержка лор, квантованных моделей. XL тоже должен работать
#musicediting #text2music
👍7🔥3😱1