Нейронавт | Нейросети в творчестве
11.7K subscribers
5.46K photos
4.6K videos
49 files
5.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

РКН: https://hf.ru/link8e56d
Download Telegram
Новые модели Qwen подключены в kilocode

#coding
👍103
This media is not supported in your browser
VIEW IN TELEGRAM
Цифровые двойники Pika AI Selves обзавелись телефонными номерами

Что позволяет

- как бы быть на связи, когда вас нет рядом

- улаживать споры в групповых чатах

дальше сами нафантазируйте

Кроме того, открывают доступ к AI Selves большему числу людей - можно получить код раннего доступа за ретвит

#humanavatar #digitaltwin #agent
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Max-Claw

У каждого нынче свой Clawbot с блекджеком и чем-нибудь.

Minimax загримировал своего агента и получился Max-Claw

Без деплоя и API-расходов, работает в Telegram, WhatsApp, Slack и Discord

Но только для платных юзеров

#agent #assistant
2👍61
hf-mem

Утилита командной строки для подсчёта памяти (видеопамяти/оперативки), необходимой для запуска моделей с Hugging Face — без скачивания модели, только по описанию файлов.

- Пишешь название модели (`uvx hf-mem mistralai/Mistral-7B-Instruct-v0.3`), и она считает объём под видеокарту — размер модели, типы данных.

- Режим --experimental оценивает дополнительную память для длинных текстов и пакетов (автоматически или вручную через параметры).

- Лёгкая, работает в терминале, без лишних зависимостей.

#tools
👍16😁1
DeepSeek V4 на следующей неделе.
Мультимодпльность, генерация изображений и видео

Источник за пейволлом https://www.ft.com/content/e3366881-0622-40a7-9c34-a0d82e3d573e

Реддит

#news
🔥16👍61
This media is not supported in your browser
VIEW IN TELEGRAM
Clawatar

Аватар в Google Meet / Zoom / Teams для OpenClaw, бетатест

Кастомизируется по просьбе

Автор кстати, тут, в телегаме

#avatar #agent
👍5
OnlyHuman

Список фильтров для uBlock Origin, который блокирует низкоэффективные фермы по производству ИИ-контента и SEO-спам-сайты, чтобы они не появлялись в результатах поиска и новостных лентах.

Не блокирует нормальные ИИ- инструменты и сервисы, сайты, использующие ИИ как часть более широкого предложения. Реальный контент, даже если он несовершенен.

#tools
👍19👎1
This media is not supported in your browser
VIEW IN TELEGRAM
CorridorKey

Нико из Corridor Digital опубликовал модель для извлечения альфы и цвета переднего плана с хромакея на базе VideoMaMA

По зелёному экрану восстанавливает сразу и маску прозрачности, и «чистый» цвет объекта, без зелёного спила.

Как он работает по шагам:

Сначала модель делает concept key: для каждого пикселя решает, относится он к переднему плану или к фону, и строит аккуратную альфу без дыр

Параллельно вторая модель оценивает цвет переднего плана: пытается восстановить «истинный» цвет объекта, вычитая вклад зелёного/синего экрана

Эти два результата комбинируются: берётся альфа с concept key и цвет из второй сети, в итоге получается матт с чистым цветом объекта и ровной прозрачностью по краю, без выеденных областей и зелёной каймы.

До 2048×2048, нужно 22.7 ГБ VRAM

#keying #compositing
🔥16🤯3👍2👎1
Grok научился продлять видео

на 6 или 12 секунд за один раз. Музыка/звукоряд соответственно тоже продляется

Вот бы еще можно было продлять стороннее видео а не только грокорожденное

Оба видео продлены гроком

Пробуем

#videoextension #videoediting
👍74
Solaris: Building a Multiplayer Video World Model in Minecraft

мультиплеерная видеомодель мира на базе MatrixGame 2.0 и Wan 2.1, генерирует согласованные наблюдения от первого лица для двух игроков одновременно

Гитхаб
HF

#world #wan
🔥81👍1
VideoMaMa - ComfyUI Custom Nodes

А вот кстати кастом ноды VideoMaMa, можно потыкать в комфи
Модель весит 6 ГБ, может заведется если у вас нет 22.7 Гб на CorridorKey

воркфлоу

#segmentation #mask2matte #video2matte #workflow #comfyui
11👍2🤔1🤯1
JavisDiT++

Модель синхронной генерации видео и звука из текста

Это Wan2.1 1.3B, расширенный до 2.1B без увеличения стоимости инференса.

Главная фишка - синхронизация аудио и видео на уровне токенов, плюс обучение на человеческих предпочтениях. В теории звук и картинка не просто генерируются вместе, но ещё и соответствуют друг другу. На практике 2B маловато для этого

Против VEO3 (самое последнее видео) не тянет, но эй, это модель на 2B параметров всего!

Гитхаб
HF

#wan #text2av #av
🔥9👍2