MolmoWeb
Ai2 (команда Molmo) выпустил open-source браузерного агента.
Работает на Molmo 2 (4B/8B). Смотрит на страницу через скриншот и сам решает куда кликнуть, что написать, где проскроллить
Ради безопасности не имеет доступа к паролям и деньгам
#SOTA среди открытых решений в 4 бенчмарках. Обходит агентов на GPT-4o и побеждает OpenAI CUA в 3 из 4 тестов
Гитхаб
HF
Демо
Плейграунд Molmo 2
#computeruse #agent
Ai2 (команда Molmo) выпустил open-source браузерного агента.
Работает на Molmo 2 (4B/8B). Смотрит на страницу через скриншот и сам решает куда кликнуть, что написать, где проскроллить
Ради безопасности не имеет доступа к паролям и деньгам
#SOTA среди открытых решений в 4 бенчмарках. Обходит агентов на GPT-4o и побеждает OpenAI CUA в 3 из 4 тестов
Гитхаб
HF
Демо
Плейграунд Molmo 2
#computeruse #agent
👍8❤1
hf-mount
Официальный инструмент от HuggingFace монтирует репозитории и бакеты HF как локальные файловые системы. То есть можно работать с моделями и датасетами, не скачивая их полностью
#tools
Официальный инструмент от HuggingFace монтирует репозитории и бакеты HF как локальные файловые системы. То есть можно работать с моделями и датасетами, не скачивая их полностью
#tools
GitHub
GitHub - huggingface/hf-mount: Mount Hugging Face Buckets and repos as local filesystems. No download, no copy, no waiting.
Mount Hugging Face Buckets and repos as local filesystems. No download, no copy, no waiting. - huggingface/hf-mount
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
OccAny
Реконструкция городского ландшафта
Обрабатывает разные типы входных данных? помимо RGB ему можно скормить все что принимают Must3R, SAM2, Depth Anything 3 и SAM3
Гитхаб
HF
#anyto3d #scenereconstruction #3d
Реконструкция городского ландшафта
Обрабатывает разные типы входных данных? помимо RGB ему можно скормить все что принимают Must3R, SAM2, Depth Anything 3 и SAM3
Гитхаб
HF
#anyto3d #scenereconstruction #3d
👍5
Qwen3.5-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-GGUF
Еще один Qwen3.5 обученный на данных Claude 4.6 Opus с цензурой снятой по методу Heretic
#gguf #assistant
Еще один Qwen3.5 обученный на данных Claude 4.6 Opus с цензурой снятой по методу Heretic
#gguf #assistant
👍16❤2😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Lyria 3 Pro
Гугл разрешил генерить музыку в Lyria 3 полноценными треками а не огрызками по 30 сек
Доступно по подписке в Gemini, Google AI Studio и по API - $0.08 за трек
#music #text2music
Гугл разрешил генерить музыку в Lyria 3 полноценными треками а не огрызками по 30 сек
Доступно по подписке в Gemini, Google AI Studio и по API - $0.08 за трек
#music #text2music
❤5👎1
PEARL
Модель для понимания персонализированных видеопотоков.
Распознает определённые понятия в видео, отмечает, когда они появляются, отвечает на вопросы о видео в режиме реального времени
Прикручено к Qwen3-VL-8B-Instruct / Qwen3-VL-Embedding-2B / llava-onevision-qwen2-7b-ov-hf
Гитхаб
#VLM #realtime #video2text
Модель для понимания персонализированных видеопотоков.
Распознает определённые понятия в видео, отмечает, когда они появляются, отвечает на вопросы о видео в режиме реального времени
Прикручено к Qwen3-VL-8B-Instruct / Qwen3-VL-Embedding-2B / llava-onevision-qwen2-7b-ov-hf
Гитхаб
#VLM #realtime #video2text
👍6
TurboQuant
Кстати Google придумал новый метод квантования моделей
Не просто округлить числа погрубее, а сделать это так, чтобы модель почти не замечала потери точности. В результате
Длинный контекст становится дешевле
Инференс на том же железе ускоряется
Векторный поиск по огромным базам становится быстрее
#news #research
Кстати Google придумал новый метод квантования моделей
Не просто округлить числа погрубее, а сделать это так, чтобы модель почти не замечала потери точности. В результате
Длинный контекст становится дешевле
Инференс на том же железе ускоряется
Векторный поиск по огромным базам становится быстрее
#news #research
🔥25👍5
Dynamic VRAM in ComfyUI
В #ComfyUI завезли новую систему оптимизации памяти, которая позволяет эффективно запускать крупные модели на устройствах с небольшим объёмом оперативной памяти #lowvram
Оптимизация памяти работает автоматически
В #ComfyUI завезли новую систему оптимизации памяти, которая позволяет эффективно запускать крупные модели на устройствах с небольшим объёмом оперативной памяти #lowvram
Оптимизация памяти работает автоматически
🔥15👍7❤1🤔1
DA-Flow
Модель для оценки оптического потока на базе DiT4SR, хорошо работает с сильно испорченными видео. Учитывает искажения, хорошо справляется с шумом, размытием и артефактами сжатия
Оптический поток используют для интерполяции кадров если что - добавления новых кадров между существующими
Гитхаб ждем
#opticalflow #frameinterpolation
Модель для оценки оптического потока на базе DiT4SR, хорошо работает с сильно испорченными видео. Учитывает искажения, хорошо справляется с шумом, размытием и артефактами сжатия
Оптический поток используют для интерполяции кадров если что - добавления новых кадров между существующими
Гитхаб ждем
#opticalflow #frameinterpolation
👍4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
PAM (Pose–Appearance–Motion Engine)
Реконструкция и генерация видео с взаимодействием рук и объектов (HOI). Объединяет в себе генерацию поз, внешнего вида и движения в одном фреймворке
Разрешение 480×720
Гитхаб
HF
#hands #HOI
Реконструкция и генерация видео с взаимодействием рук и объектов (HOI). Объединяет в себе генерацию поз, внешнего вида и движения в одном фреймворке
Разрешение 480×720
Гитхаб
HF
#hands #HOI
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Kimodo
Диффузная модель для генерации качественных 3D-движений людей и роботов по тексту от NVIDIA
Помимо текста управляется с помощью разных констрейнов: ключевых кадров, позиций и вращений концевых эффекторов (например, рук и ног), 2D-путей и точек
Для локального запуска нужно около 17ГБ VRAM
Гитхаб
HF
Демо
#humananimation #text2animation #3d
Диффузная модель для генерации качественных 3D-движений людей и роботов по тексту от NVIDIA
Помимо текста управляется с помощью разных констрейнов: ключевых кадров, позиций и вращений концевых эффекторов (например, рук и ног), 2D-путей и точек
Для локального запуска нужно около 17ГБ VRAM
Гитхаб
HF
Демо
#humananimation #text2animation #3d
👍7🔥3
🔥11👍3