Нейронавт | Нейросети в творчестве

MolmoWeb

Ai2 (команда Molmo) выпустил open-source браузерного агента.

Работает на Molmo 2 (4B/8B). Смотрит на страницу через скриншот и сам решает куда кликнуть, что написать, где проскроллить

Ради безопасности не имеет доступа к паролям и деньгам

#SOTA среди открытых решений в 4 бенчмарках. Обходит агентов на GPT-4o и побеждает OpenAI CUA в 3 из 4 тестов

Гитхаб
HF
Демо
Плейграунд Molmo 2

#computeruse #agent

👍8❤1

2.06K views12:15

Нейронавт | Нейросети в творчестве

hf-mount

Официальный инструмент от HuggingFace монтирует репозитории и бакеты HF как локальные файловые системы. То есть можно работать с моделями и датасетами, не скачивая их полностью

#tools

GitHub

GitHub - huggingface/hf-mount: Mount Hugging Face Buckets and repos as local filesystems. No download, no copy, no waiting.

Mount Hugging Face Buckets and repos as local filesystems. No download, no copy, no waiting. - huggingface/hf-mount

👍7

2.1K views14:17

Нейронавт | Нейросети в творчестве

0:18

This media is not supported in your browser

VIEW IN TELEGRAM

OccAny

Реконструкция городского ландшафта

Обрабатывает разные типы входных данных? помимо RGB ему можно скормить все что принимают Must3R, SAM2, Depth Anything 3 и SAM3

Гитхаб
HF

#anyto3d #scenereconstruction #3d

👍5

2.04K views15:18

Нейронавт | Нейросети в творчестве

Qwen3.5-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-GGUF

Еще один Qwen3.5 обученный на данных Claude 4.6 Opus с цензурой снятой по методу Heretic

#gguf #assistant

👍16❤2😱1

2.2K views16:19

Нейронавт | Нейросети в творчестве

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

Lyria 3 Pro

Гугл разрешил генерить музыку в Lyria 3 полноценными треками а не огрызками по 30 сек

Доступно по подписке в Gemini, Google AI Studio и по API - $0.08 за трек

#music #text2music

❤5👎1

1.72K views17:17

Нейронавт | Нейросети в творчестве

PEARL

Модель для понимания персонализированных видеопотоков.

Распознает определённые понятия в видео, отмечает, когда они появляются, отвечает на вопросы о видео в режиме реального времени

Прикручено к Qwen3-VL-8B-Instruct / Qwen3-VL-Embedding-2B / llava-onevision-qwen2-7b-ov-hf

Гитхаб

#VLM #realtime #video2text

👍6

1.98K views18:21

Нейронавт | Нейросети в творчестве

ИИ который мы заслужили

#humor

😁26👍5

1.77K views19:22

Нейронавт | Нейросети в творчестве

TurboQuant

Кстати Google придумал новый метод квантования моделей

Не просто округлить числа погрубее, а сделать это так, чтобы модель почти не замечала потери точности. В результате

Длинный контекст становится дешевле
Инференс на том же железе ускоряется
Векторный поиск по огромным базам становится быстрее

#news #research

🔥25👍5

1.71K views05:08

Нейронавт | Нейросети в творчестве

Dynamic VRAM in ComfyUI

В #ComfyUI завезли новую систему оптимизации памяти, которая позволяет эффективно запускать крупные модели на устройствах с небольшим объёмом оперативной памяти #lowvram

Оптимизация памяти работает автоматически

🔥15👍7❤1🤔1

1.92K views07:25

Нейронавт | Нейросети в творчестве

DA-Flow

Модель для оценки оптического потока на базе DiT4SR, хорошо работает с сильно испорченными видео. Учитывает искажения, хорошо справляется с шумом, размытием и артефактами сжатия

Оптический поток используют для интерполяции кадров если что - добавления новых кадров между существующими

Гитхаб ждем

#opticalflow #frameinterpolation

👍4❤1

1.59K views08:10

Нейронавт | Нейросети в творчестве

0:52

This media is not supported in your browser

VIEW IN TELEGRAM

PAM (Pose–Appearance–Motion Engine)

Реконструкция и генерация видео с взаимодействием рук и объектов (HOI). Объединяет в себе генерацию поз, внешнего вида и движения в одном фреймворке

Разрешение 480×720

Гитхаб
HF

#hands #HOI

👍5

1.76K views09:17

Нейронавт | Нейросети в творчестве

1:57

Media is too big

VIEW IN TELEGRAM

Рок-группа интроверта

Я не знаю кто автор

#robot

❤10🔥4

2.06K views10:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Kimodo

Диффузная модель для генерации качественных 3D-движений людей и роботов по тексту от NVIDIA

Помимо текста управляется с помощью разных констрейнов: ключевых кадров, позиций и вращений концевых эффекторов (например, рук и ног), 2D-путей и точек

Для локального запуска нужно около 17ГБ VRAM

Гитхаб
HF
Демо

#humananimation #text2animation #3d

👍7🔥3

2.05K viewsedited 11:14

Нейронавт | Нейросети в творчестве

z-image-turbo-sda

Лора повышения вариативности 8-шаговой Z-image-turbo

спасибо @m_franz

#lora #zimage

🔥11👍3

1.96K views13:16

About

Blog

Apps

Platform