Нейронавт | Нейросети в творчестве
11.6K subscribers
5.44K photos
4.56K videos
49 files
5.73K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

РКН: https://hf.ru/link8e56d
Download Telegram
acestep.cpp

Портативная реализация генератора музыки ACE-Step 1.5 на C++17 с GGML

CPU, CUDA, ROCm, Metal, Vulkan

Поддержка лор, квантованных моделей. XL тоже должен работать

#musicediting #text2music
👍7🔥3😱1
Тренируется на кошках кабанчиках.
А потом когда все начнется - как сбросит утяжелитель да как побежит

И отсылка к Клубу Завтрак как символу свободы

#robot
😁5
ComfyUI-zveroboy-photo

пак нод от подписчика @slavamalikov для работы с RAW изображениями

умеет как загружать RAW-файлы разных форматов, так и сохранять изображения в DNG (цифровые негативы), с учётом псевдорасширения ДД изображения. таким образом можно в ComfyUI сгенерировать цифровые негативы и потом привычно обработать их в любом фоторедакторе

конечно же, есть отдельная нода для добавления метаданных - можно добавить их в JPG или DNG файл. работа с метаданными сформирована через пресеты - можно добавить свой в отдельный файл (см. инструкцию)

так же есть две ноды для добавления эстетического (пленочное зерно) и технического (шум сенсора) зерна - добавляет как натуральности, так и уменьшает пластиковость изображений. а так же "помогает" ряду онлайн ИИ-детекторов считать ваши генерации настоящими несгенерированными изображениями


#raw #comfyui
🔥8👍1
Nvidia продолжает развивать генератор анимации Kimodo

выложили еще две модели

Kimodo-SOMA-RP-v1.1 - обучена на датасете 30-суставных скелетов с корректным ригом

TMR-SOMA-RP-v1- связывает текст и человеческие движения в общем латентном пространстве для оценки сгенерированных движений

#humananimation #text2animation #3d #text2motion
🔥52👍2
DiffHDR

Еще один проект, исчезнувший из свободного доступа, а жаль. Оставлю тут на случай если вдруг автор решит его вернуть

Модель преобразования видео из низкого динамического диапазона (LDR) в высокий (HDR). Использует диффузионные технологии, работает с уже существующими видео, восстанавливая потерянные детали в слишком светлых или тёмных участках

Гитхаб - был да сплыл, недоступен
Препринт

#LDR2HDR #hdr #video2video
🔥6👍1
На этой неделе произойдёт разделение платформ Civitai

Civitai.com станет SFW-платформой (как сейчас Civitai.green). Там будут доступны:

оплата кредитными картами

членства

программа для создателей

контент, ориентированный на широкую аудиторию.

Civitai.red станет платформой с упором на свободу контента (как сейчас Civitai.com). Там будет:

весь NSFW-контент

криптоплатежи

полный каталог, генератор и сообщество

Civitai.green будет перенаправлять на civitai.com, поэтому все закладки и ссылки сохранят работоспособность

При этом:

аккаунты, контент и настройки останутся без изменений

не потребуется создавать новые аккаунты или заново подписываться на пользователей

Membership-привилегии будут работать на обеих платформах.

Спасибо @m_franz

#news #uncensored
😁10👍7👎2🔥2
WildDet3D: Scaling Promptable 3D Detection in the Wild

#SOTA детектор объектов от Allen AI для изображений и видео в реальном времени.

— Распознаёт 3D-объекты по текстовым подсказкам
— Преобразует 2D-рамки в 3D
— Находит похожие объекты по примеру
— Работает с точками на изображении
— Использует монокулярные изображения
— Применяет данные о глубине для точного позиционирования

Гитхаб
HF
Демо
iOS

#detection #3d #segmentation #mobile #ios #realtime
5🔥1
Мифичеcкая мощь Mythos
Компания AISLE провела тесты и выяснила, что небольшие и недорогие модели ИИ могут обнаруживать те же уязвимости, которые находит Mythos. Например, восемь из восьми протестированных моделей обнаружили уязвимость в FreeBSD, при этом одна из них имела всего 3,6 миллиарда активных параметров и стоила $0,11 за миллион токенов

Маленькие модели могут быть эффективны для обнаружения уязвимостей

#news #security
👍6😁3
This media is not supported in your browser
VIEW IN TELEGRAM
MOSS-TTS-Nano

Версия говорилки на всего 100M параметров

— работает на процессоре без видеокарты

— 20 языков, включая русский

— может обрабатывать длинные тексты, автоматически разбивая их на части для клонирования голоса

— звук в формате 48 кГц, 2 канала

Гитхаб
HF
Демо
Студия - вход по китайскому номеру, как зарегаться - непонятно

#TTS #voicecloning #voicedesign #russian #text2sfx #foley #sfx #realtime #longspeech
👍9😱1
UniCom

Мультимодальная модель для работы с сжатыми визуальными эмбеддингами от Tencent

Предсказывает сжатые визуальные эмбеддинги, при этом сжатие визуальных признаков по канальному измерению помогает сохранить и семантику, и мелкие детали

Умеет:

— генерировать изображения по текстовому описанию

— редактировать одиночные изображения

— редактировать несколько изображений одновременно

— восстанавливать изображения

Гитхаб
HF

#multimodal #imageediting
👍3
RefineAnything

Мультимодальная диффузионная модель на базе Qwen-Image, похоже что лора

Исправляет искаженный текст, логотипы и тонкие структуры внутри любой указанной вами области, оставляя фон нетронутым. Поддерживает редактирование с референсом и без него

Гитхаб
HF
Демо

#imageediting #QIE2511 #imageenhance
👍13