Нейронавт | Нейросети в творчестве
11.7K subscribers
5.46K photos
4.6K videos
49 files
5.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

РКН: https://hf.ru/link8e56d
Download Telegram
Hyperagents

Проект Meta (запрещено в РФ)

Самосовершенствующаяся агентная система, которая не просто ищет лучшие решения, а постоянно улучшает сам процесс поиска улучшений

#agent
👍5
AwaRes — Look Where It Matters

Решает проблему выбора между качеством и скоростью для VLM при обработке визуальной информации: обычно высокое разрешение даёт детали, но тормозит обработку, а низкое — ускоряет, но может упустить важные детали

AwaRes по умолчанию работает с изображениями низкого разрешения, но если нужно больше деталей — запрашивает только нужные кусочки в высоком разрешении. Так модель получает нужные данные и не тратит ресурсы впустую

Гитхаб ждем

#vlm #optimization
👍3
OpenResearcher

Опенсорс агент с 30B параметров для глубоких исследований, превосходящий GPT-4.1 и Claude-Opus-4

Нвидиевский Nemotron использует именно этого агента

Гитхаб
HF
Демо

#deepresearch #agent
👍9🤯1
в aitoolkit добавили тренировку лор под ltx2.3

Спасибо @m_franz

#ltx23 #lora #finetuning
🔥8👍3
MolmoWeb

Ai2 (команда Molmo) выпустил open-source браузерного агента.

Работает на Molmo 2 (4B/8B). Смотрит на страницу через скриншот и сам решает куда кликнуть, что написать, где проскроллить

Ради безопасности не имеет доступа к паролям и деньгам

#SOTA среди открытых решений в 4 бенчмарках. Обходит агентов на GPT-4o и побеждает OpenAI CUA в 3 из 4 тестов

Гитхаб
HF
Демо
Плейграунд Molmo 2

#computeruse #agent
👍81
hf-mount

Официальный инструмент от HuggingFace монтирует репозитории и бакеты HF как локальные файловые системы. То есть можно работать с моделями и датасетами, не скачивая их полностью

#tools
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
OccAny

Реконструкция городского ландшафта

Обрабатывает разные типы входных данных? помимо RGB ему можно скормить все что принимают Must3R, SAM2, Depth Anything 3 и SAM3

Гитхаб
HF

#anyto3d #scenereconstruction #3d
👍5
Qwen3.5-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-GGUF

Еще один Qwen3.5 обученный на данных Claude 4.6 Opus с цензурой снятой по методу Heretic

#gguf #assistant
👍162😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Lyria 3 Pro

Гугл разрешил генерить музыку в Lyria 3 полноценными треками а не огрызками по 30 сек

Доступно по подписке в Gemini, Google AI Studio и по API - $0.08 за трек

#music #text2music
5👎1
PEARL

Модель для понимания персонализированных видеопотоков.

Распознает определённые понятия в видео, отмечает, когда они появляются, отвечает на вопросы о видео в режиме реального времени

Прикручено к Qwen3-VL-8B-Instruct / Qwen3-VL-Embedding-2B / llava-onevision-qwen2-7b-ov-hf

Гитхаб

#VLM #realtime #video2text
👍6
ИИ который мы заслужили

#humor
😁26👍5
TurboQuant

Кстати Google придумал новый метод квантования моделей

Не просто округлить числа погрубее, а сделать это так, чтобы модель почти не замечала потери точности. В результате

Длинный контекст становится дешевле
Инференс на том же железе ускоряется
Векторный поиск по огромным базам становится быстрее

#news #research
🔥25👍5
Dynamic VRAM in ComfyUI

В #ComfyUI завезли новую систему оптимизации памяти, которая позволяет эффективно запускать крупные модели на устройствах с небольшим объёмом оперативной памяти #lowvram

Оптимизация памяти работает автоматически
🔥15👍71🤔1
DA-Flow

Модель для оценки оптического потока на базе DiT4SR, хорошо работает с сильно испорченными видео. Учитывает искажения, хорошо справляется с шумом, размытием и артефактами сжатия

Оптический поток используют для интерполяции кадров если что - добавления новых кадров между существующими

Гитхаб ждем

#opticalflow #frameinterpolation
👍41
This media is not supported in your browser
VIEW IN TELEGRAM
PAM (Pose–Appearance–Motion Engine)

Реконструкция и генерация видео с взаимодействием рук и объектов (HOI). Объединяет в себе генерацию поз, внешнего вида и движения в одном фреймворке

Разрешение 480×720

Гитхаб
HF

#hands #HOI
👍5