acestep.cpp
Портативная реализация генератора музыки ACE-Step 1.5 на C++17 с GGML
CPU, CUDA, ROCm, Metal, Vulkan
Поддержка лор, квантованных моделей. XL тоже должен работать
#musicediting #text2music
Портативная реализация генератора музыки ACE-Step 1.5 на C++17 с GGML
CPU, CUDA, ROCm, Metal, Vulkan
Поддержка лор, квантованных моделей. XL тоже должен работать
#musicediting #text2music
👍7🔥3😱1
Тренируется на кошках кабанчиках.
А потом когда все начнется - как сбросит утяжелитель да как побежит
И отсылка к Клубу Завтрак как символу свободы
#robot
А потом когда все начнется - как сбросит утяжелитель да как побежит
И отсылка к Клубу Завтрак как символу свободы
#robot
😁5
ComfyUI-zveroboy-photo
пак нод от подписчика @slavamalikov для работы с RAW изображениями
#raw #comfyui
пак нод от подписчика @slavamalikov для работы с RAW изображениями
умеет как загружать RAW-файлы разных форматов, так и сохранять изображения в DNG (цифровые негативы), с учётом псевдорасширения ДД изображения. таким образом можно в ComfyUI сгенерировать цифровые негативы и потом привычно обработать их в любом фоторедакторе
конечно же, есть отдельная нода для добавления метаданных - можно добавить их в JPG или DNG файл. работа с метаданными сформирована через пресеты - можно добавить свой в отдельный файл (см. инструкцию)
так же есть две ноды для добавления эстетического (пленочное зерно) и технического (шум сенсора) зерна - добавляет как натуральности, так и уменьшает пластиковость изображений. а так же "помогает" ряду онлайн ИИ-детекторов считать ваши генерации настоящими несгенерированными изображениями
#raw #comfyui
🔥8👍1
Nvidia продолжает развивать генератор анимации Kimodo
выложили еще две модели
Kimodo-SOMA-RP-v1.1 - обучена на датасете 30-суставных скелетов с корректным ригом
TMR-SOMA-RP-v1- связывает текст и человеческие движения в общем латентном пространстве для оценки сгенерированных движений
#humananimation #text2animation #3d #text2motion
выложили еще две модели
Kimodo-SOMA-RP-v1.1 - обучена на датасете 30-суставных скелетов с корректным ригом
TMR-SOMA-RP-v1- связывает текст и человеческие движения в общем латентном пространстве для оценки сгенерированных движений
#humananimation #text2animation #3d #text2motion
Telegram
Нейронавт | Нейросети в творчестве
Kimodo
Диффузная модель для генерации качественных 3D-движений людей и роботов по тексту от NVIDIA
Помимо текста управляется с помощью разных констрейнов: ключевых кадров, позиций и вращений концевых эффекторов (например, рук и ног), 2D-путей и точек
Для…
Диффузная модель для генерации качественных 3D-движений людей и роботов по тексту от NVIDIA
Помимо текста управляется с помощью разных констрейнов: ключевых кадров, позиций и вращений концевых эффекторов (например, рук и ног), 2D-путей и точек
Для…
🔥5❤2👍2
DiffHDR
Еще один проект, исчезнувший из свободного доступа, а жаль. Оставлю тут на случай если вдруг автор решит его вернуть
Модель преобразования видео из низкого динамического диапазона (LDR) в высокий (HDR). Использует диффузионные технологии, работает с уже существующими видео, восстанавливая потерянные детали в слишком светлых или тёмных участках
Гитхаб - был да сплыл, недоступен
Препринт
#LDR2HDR #hdr #video2video
Еще один проект, исчезнувший из свободного доступа, а жаль. Оставлю тут на случай если вдруг автор решит его вернуть
Модель преобразования видео из низкого динамического диапазона (LDR) в высокий (HDR). Использует диффузионные технологии, работает с уже существующими видео, восстанавливая потерянные детали в слишком светлых или тёмных участках
Гитхаб - был да сплыл, недоступен
Препринт
#LDR2HDR #hdr #video2video
🔥6👍1
На этой неделе произойдёт разделение платформ Civitai
Civitai.com станет SFW-платформой (как сейчас Civitai.green). Там будут доступны:
оплата кредитными картами
членства
программа для создателей
контент, ориентированный на широкую аудиторию.
Civitai.red станет платформой с упором на свободу контента (как сейчас Civitai.com). Там будет:
весь NSFW-контент
криптоплатежи
полный каталог, генератор и сообщество
Civitai.green будет перенаправлять на civitai.com, поэтому все закладки и ссылки сохранят работоспособность
При этом:
аккаунты, контент и настройки останутся без изменений
не потребуется создавать новые аккаунты или заново подписываться на пользователей
Membership-привилегии будут работать на обеих платформах.
Спасибо @m_franz
#news #uncensored
Civitai.com станет SFW-платформой (как сейчас Civitai.green). Там будут доступны:
оплата кредитными картами
членства
программа для создателей
контент, ориентированный на широкую аудиторию.
Civitai.red станет платформой с упором на свободу контента (как сейчас Civitai.com). Там будет:
весь NSFW-контент
криптоплатежи
полный каталог, генератор и сообщество
Civitai.green будет перенаправлять на civitai.com, поэтому все закладки и ссылки сохранят работоспособность
При этом:
аккаунты, контент и настройки останутся без изменений
не потребуется создавать новые аккаунты или заново подписываться на пользователей
Membership-привилегии будут работать на обеих платформах.
Спасибо @m_franz
#news #uncensored
😁10👍7👎2🔥2
WildDet3D: Scaling Promptable 3D Detection in the Wild
#SOTA детектор объектов от Allen AI для изображений и видео в реальном времени.
— Распознаёт 3D-объекты по текстовым подсказкам
— Преобразует 2D-рамки в 3D
— Находит похожие объекты по примеру
— Работает с точками на изображении
— Использует монокулярные изображения
— Применяет данные о глубине для точного позиционирования
Гитхаб
HF
Демо
iOS
#detection #3d #segmentation #mobile #ios #realtime
#SOTA детектор объектов от Allen AI для изображений и видео в реальном времени.
— Распознаёт 3D-объекты по текстовым подсказкам
— Преобразует 2D-рамки в 3D
— Находит похожие объекты по примеру
— Работает с точками на изображении
— Использует монокулярные изображения
— Применяет данные о глубине для точного позиционирования
Гитхаб
HF
Демо
iOS
#detection #3d #segmentation #mobile #ios #realtime
❤5🔥1
Мифичеcкая мощь Mythos
Компания AISLE провела тесты и выяснила, что небольшие и недорогие модели ИИ могут обнаруживать те же уязвимости, которые находит Mythos. Например, восемь из восьми протестированных моделей обнаружили уязвимость в FreeBSD, при этом одна из них имела всего 3,6 миллиарда активных параметров и стоила $0,11 за миллион токенов
Маленькие модели могут быть эффективны для обнаружения уязвимостей
#news #security
Компания AISLE провела тесты и выяснила, что небольшие и недорогие модели ИИ могут обнаруживать те же уязвимости, которые находит Mythos. Например, восемь из восьми протестированных моделей обнаружили уязвимость в FreeBSD, при этом одна из них имела всего 3,6 миллиарда активных параметров и стоила $0,11 за миллион токенов
Маленькие модели могут быть эффективны для обнаружения уязвимостей
#news #security
AISLE
AI Cybersecurity After Mythos: The Jagged Frontier
Why the moat is the system, not the model
👍6😁3
This media is not supported in your browser
VIEW IN TELEGRAM
MOSS-TTS-Nano
Версия говорилки на всего 100M параметров
— работает на процессоре без видеокарты
— 20 языков, включая русский
— может обрабатывать длинные тексты, автоматически разбивая их на части для клонирования голоса
— звук в формате 48 кГц, 2 канала
Гитхаб
HF
Демо
Студия - вход по китайскому номеру, как зарегаться - непонятно
#TTS #voicecloning #voicedesign #russian #text2sfx #foley #sfx #realtime #longspeech
Версия говорилки на всего 100M параметров
— работает на процессоре без видеокарты
— 20 языков, включая русский
— может обрабатывать длинные тексты, автоматически разбивая их на части для клонирования голоса
— звук в формате 48 кГц, 2 канала
Гитхаб
HF
Демо
Студия - вход по китайскому номеру, как зарегаться - непонятно
#TTS #voicecloning #voicedesign #russian #text2sfx #foley #sfx #realtime #longspeech
👍9😱1
UniCom
Мультимодальная модель для работы с сжатыми визуальными эмбеддингами от Tencent
Предсказывает сжатые визуальные эмбеддинги, при этом сжатие визуальных признаков по канальному измерению помогает сохранить и семантику, и мелкие детали
Умеет:
— генерировать изображения по текстовому описанию
— редактировать одиночные изображения
— редактировать несколько изображений одновременно
— восстанавливать изображения
Гитхаб
HF
#multimodal #imageediting
Мультимодальная модель для работы с сжатыми визуальными эмбеддингами от Tencent
Предсказывает сжатые визуальные эмбеддинги, при этом сжатие визуальных признаков по канальному измерению помогает сохранить и семантику, и мелкие детали
Умеет:
— генерировать изображения по текстовому описанию
— редактировать одиночные изображения
— редактировать несколько изображений одновременно
— восстанавливать изображения
Гитхаб
HF
#multimodal #imageediting
👍3
RefineAnything
Мультимодальная диффузионная модель на базе Qwen-Image, похоже что лора
Исправляет искаженный текст, логотипы и тонкие структуры внутри любой указанной вами области, оставляя фон нетронутым. Поддерживает редактирование с референсом и без него
Гитхаб
HF
Демо
#imageediting #QIE2511 #imageenhance
Мультимодальная диффузионная модель на базе Qwen-Image, похоже что лора
Исправляет искаженный текст, логотипы и тонкие структуры внутри любой указанной вами области, оставляя фон нетронутым. Поддерживает редактирование с референсом и без него
Гитхаб
HF
Демо
#imageediting #QIE2511 #imageenhance
👍13