Нейронавт | Нейросети в творчестве
11.6K subscribers
5.45K photos
4.58K videos
49 files
5.74K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

РКН: https://hf.ru/link8e56d
Download Telegram
hf-mount

Официальный инструмент от HuggingFace монтирует репозитории и бакеты HF как локальные файловые системы. То есть можно работать с моделями и датасетами, не скачивая их полностью

#tools
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
OccAny

Реконструкция городского ландшафта

Обрабатывает разные типы входных данных? помимо RGB ему можно скормить все что принимают Must3R, SAM2, Depth Anything 3 и SAM3

Гитхаб
HF

#anyto3d #scenereconstruction #3d
👍5
Qwen3.5-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-GGUF

Еще один Qwen3.5 обученный на данных Claude 4.6 Opus с цензурой снятой по методу Heretic

#gguf #assistant
👍162😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Lyria 3 Pro

Гугл разрешил генерить музыку в Lyria 3 полноценными треками а не огрызками по 30 сек

Доступно по подписке в Gemini, Google AI Studio и по API - $0.08 за трек

#music #text2music
5👎1
PEARL

Модель для понимания персонализированных видеопотоков.

Распознает определённые понятия в видео, отмечает, когда они появляются, отвечает на вопросы о видео в режиме реального времени

Прикручено к Qwen3-VL-8B-Instruct / Qwen3-VL-Embedding-2B / llava-onevision-qwen2-7b-ov-hf

Гитхаб

#VLM #realtime #video2text
👍6
ИИ который мы заслужили

#humor
😁26👍5
TurboQuant

Кстати Google придумал новый метод квантования моделей

Не просто округлить числа погрубее, а сделать это так, чтобы модель почти не замечала потери точности. В результате

Длинный контекст становится дешевле
Инференс на том же железе ускоряется
Векторный поиск по огромным базам становится быстрее

#news #research
🔥25👍5
Dynamic VRAM in ComfyUI

В #ComfyUI завезли новую систему оптимизации памяти, которая позволяет эффективно запускать крупные модели на устройствах с небольшим объёмом оперативной памяти #lowvram

Оптимизация памяти работает автоматически
🔥15👍71🤔1
DA-Flow

Модель для оценки оптического потока на базе DiT4SR, хорошо работает с сильно испорченными видео. Учитывает искажения, хорошо справляется с шумом, размытием и артефактами сжатия

Оптический поток используют для интерполяции кадров если что - добавления новых кадров между существующими

Гитхаб ждем

#opticalflow #frameinterpolation
👍41
This media is not supported in your browser
VIEW IN TELEGRAM
PAM (Pose–Appearance–Motion Engine)

Реконструкция и генерация видео с взаимодействием рук и объектов (HOI). Объединяет в себе генерацию поз, внешнего вида и движения в одном фреймворке

Разрешение 480×720

Гитхаб
HF

#hands #HOI
👍5
Media is too big
VIEW IN TELEGRAM
Рок-группа интроверта

Я не знаю кто автор

#robot
10🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Kimodo

Диффузная модель для генерации качественных 3D-движений людей и роботов по тексту от NVIDIA

Помимо текста управляется с помощью разных констрейнов: ключевых кадров, позиций и вращений концевых эффекторов (например, рук и ног), 2D-путей и точек

Для локального запуска нужно около 17ГБ VRAM

Гитхаб
HF
Демо

#humananimation #text2animation #3d
👍7🔥3
z-image-turbo-sda

Лора повышения вариативности 8-шаговой Z-image-turbo

спасибо @m_franz

#lora #zimage
🔥11👍3
- Мы изобрели робота который отвечает на вопросы. Но для этого он съедает 10 маленьких жирафят в день
- Но он хотя бы дает правильны ответы?
- Божечки, конечно же нет, нет, нет

#humor
😁11
EVA: Efficient Reinforcement Learning for End-to-End Video Agent

Пониматор видео, который умеет «думать» перед тем, как «смотреть». В отличие от других систем, которые просто распознают контент, EVA сама решает, что и когда смотреть, как это делать

Гитхаб
HF

#VLA #reasoning
👍31👎1