Машинное обучение RU

🧠 ThinkMesh: Параллельное мышление для LLM

ThinkMesh — это библиотека на Python, позволяющая запускать различные пути рассуждений параллельно, используя внутренние сигналы уверенности для перераспределения вычислительных ресурсов. Она поддерживает оффлайн-работу с Hugging Face Transformers и API.

🚀 Основные моменты:
- Параллельное рассуждение с динамическим перераспределением бюджета
- Оффлайн-работа с Transformers и интеграция с OpenAI
- Асинхронное выполнение с динамическими микро-пакетами
- Поддержка пользовательских верификаторов и редукций
- Кэширование и метрики для отслеживания производительности

📌 GitHub: https://github.com/martianlantern/ThinkMesh

#python

GitHub

GitHub - martianlantern/ThinkMesh: Parallel thinking for LLMs. Confidence‑gated, strategy‑driven, offline‑friendly

Parallel thinking for LLMs. Confidence‑gated, strategy‑driven, offline‑friendly - martianlantern/ThinkMesh

🔥8❤3👍2

1.84K views09:04

Машинное обучение RU

🚀 Обучение LLM-агентов для многоповоротного принятия решений

AgentGym-RL — это фреймворк для тренировки LLM-агентов, способных принимать решения в сложных многоповоротных сценариях с использованием методов усиленного обучения. Он предлагает разнообразные реальные сценарии и поддерживает популярные алгоритмы RL, улучшая производительность моделей до уровня коммерческих решений.

🚀 Основные моменты:
- Модульная система для гибкости и расширяемости.
- Поддержка различных реальных сред, включая веб-навигацию и глубокий поиск.
- Метод ScalingInter-RL для стабильного обучения агентов.
- Интерактивный интерфейс для визуализации взаимодействий.

📌 GitHub: https://github.com/WooooDyy/AgentGym-RL

#python

❤5👍2🔥1

1.98K views22:08

Машинное обучение RU

🎙️ VibeVoice: Инновационная модель TTS для длинных разговоров

VibeVoice — это передовая система синтеза речи, способная генерировать выразительное аудио для длительных разговоров, включая подкасты. Она решает проблемы традиционных TTS-систем, обеспечивая высокую согласованность голосов и естественное взаимодействие между несколькими спикерами.

🚀 Основные моменты:
- Синтезирует речь до 90 минут с 4 различными спикерами.
- Использует токенизаторы непрерывной речи для повышения эффективности.
- Поддерживает высокое качество звука при низкой частоте кадров.
- Применяет диффузионные модели для понимания контекста и потока диалога.

📌 GitHub: https://github.com/microsoft/VibeVoice

#python

❤5👍1🔥1

2.12K views13:02

Машинное обучение RU

⚡ FlashVSR: Реальное время для видео-суперразрешения

FlashVSR — это инновационная система, использующая диффузионные модели для достижения суперразрешения видео в реальном времени. Она обеспечивает высокую эффективность и масштабируемость, работая на скорости около 17 FPS для видео 768 × 1408 на одном GPU A100. Проект включает новый набор данных VSR-120K для обучения и демонстрирует выдающиеся результаты, значительно опережая предыдущие модели.

🚀Основные моменты:
- Первая диффузионная модель для потокового видео-суперразрешения.
- Эффективная трехступенчатая дистилляция для быстрого обучения.
- Локально-ограниченное разреженное внимание для снижения вычислительных затрат.
- Поддержка ультра-высоких разрешений с до 12-кратным ускорением.

📌 GitHub: https://github.com/OpenImagingLab/FlashVSR

#python

GitHub

GitHub - OpenImagingLab/FlashVSR: Towards Real-Time Diffusion-Based Streaming Video Super-Resolution — An efficient one-step diffusion…

Towards Real-Time Diffusion-Based Streaming Video Super-Resolution — An efficient one-step diffusion framework for streaming VSR with locality-constrained sparse attention and a tiny conditional de...

2.23K views08:20

Машинное обучение RU

🔬 Генерация белков с BoltzGen

BoltzGen — это инструмент для генерации и оптимизации дизайна белков, использующий передовые методы машинного обучения. Он позволяет создавать наборы ранжированных дизайнов на основе спецификаций в формате YAML, обеспечивая гибкость и высокую производительность.

🚀 Основные моменты:
- Генерация белков с использованием спецификаций YAML.
- Поддержка GPU для ускорения вычислений.
- Выходные данные включают промежуточные и финальные дизайны.
- Возможность анализа и фильтрации результатов.

📌 GitHub: https://github.com/HannesStark/boltzgen

#python

❤2👍1

2.18K views12:03

Машинное обучение RU

📚 Читаем EPUB с LLM 🚀
Легкий самодостаточный EPUB-ридер, позволяющий читать книги по главам и легко копировать текст для работы с LLM. Проект создан для вдохновения и не требует поддержки. Просто загружайте EPUB и читайте вместе с ИИ.

🚀 Основные моменты:
- Чтение EPUB-файлов по главам
- Удобный интерфейс для работы с LLM
- Легкая настройка и использование
- Проект для вдохновения, без поддержки

📌 GitHub: https://github.com/karpathy/reader3

#python

❤3👍2🤔2

1.83K views05:47

Машинное обучение RU

🎤 Быстрый текст-в-речь с Supertonic

Supertonic — это высокопроизводительная система текст-в-речь, работающая на вашем устройстве. Она обеспечивает молниеносное создание речи с минимальными затратами ресурсов и полным соблюдением конфиденциальности. Никаких облачных решений — всё происходит локально.

🚀Основные моменты:
- ⚡ Генерация речи до 167× быстрее реального времени
- 🪶 Легковесная архитектура с 66M параметрами
- 📱 Полная обработка на устройстве без задержек
- 🎨 Обработка сложных текстов без предварительной подготовки
- ⚙️ Гибкая настройка параметров и развертывания

📌 GitHub: https://github.com/supertone-inc/supertonic

#python

GitHub

GitHub - supertone-inc/supertonic: Lightning-Fast, On-Device TTS — running natively via ONNX.

Lightning-Fast, On-Device TTS — running natively via ONNX. - supertone-inc/supertonic

❤4🤔1

1.82K views18:03

Машинное обучение RU

🖼️ Удаление водяных знаков с Sora2

Этот проект предлагает эффективный инструмент для удаления водяных знаков из изображений, используя алгоритмы глубокого обучения. Он предназначен для улучшения качества изображений, сохраняя при этом их оригинальные детали.

🚀Основные моменты:
- Использует современные методы машинного обучения.
- Поддерживает различные форматы изображений.
- Легко интегрируется в существующие рабочие процессы.
- Открытый исходный код для гибкости и модификации.

📌 GitHub: https://github.com/dachensky/sora2-watermark-remover

#python

GitHub

dachensky/sora2-watermark-remover

Sora 2 AI generated videos gentle watermark remover - dachensky/sora2-watermark-remover

😢1

2.08K views10:33

Машинное обучение RU

🧠 AgentEvolver: Эффективная система саморазвивающихся агентов

AgentEvolver — это комплексная платформа для самообучения агентов, объединяющая механизмы самовопроса, самонавигации и самоатрибуции. Она позволяет агентам автономно улучшать свои способности, обеспечивая эффективное и непрерывное развитие.

🚀Основные моменты:
- Автоматическая генерация задач для уменьшения затрат на создание данных.
- Оптимизация исследований через опыт, полученный от предыдущих задач.
- Тонкая настройка политики на основе атрибуции промежуточных шагов.
- Модульная архитектура для легкой настройки и расширения.
- Высокая производительность с меньшим количеством параметров по сравнению с аналогами.

📌 GitHub: https://github.com/modelscope/AgentEvolver

#python

❤1👍1

1.87K views10:04

Машинное обучение RU

🎬 HunyuanVideo-1.5: Легкая модель генерации видео

HunyuanVideo-1.5 — это мощная модель для создания видео с высоким качеством и всего 8.3 миллиарда параметров. Она оптимизирована для работы на потребительских GPU, что делает её доступной для разработчиков и креаторов. Репозиторий включает инструменты для генерации креативных видео.

🚀Основные моменты:
- Высокое качество видео с минимальными ресурсами
- Поддержка текстового и изображенческого ввода
- Оптимизирована для быстрого вывода на обычных GPU
- Открытый исходный код и доступные веса модели

📌 GitHub: https://github.com/Tencent-Hunyuan/HunyuanVideo-1.5

#python

GitHub

GitHub - Tencent-Hunyuan/HunyuanVideo-1.5: HunyuanVideo-1.5: A leading lightweight video generation model

HunyuanVideo-1.5: A leading lightweight video generation model - Tencent-Hunyuan/HunyuanVideo-1.5

2.22K views09:35

Машинное обучение RU

🧠 MiroThinker: Инновационный исследовательский агент

MiroThinker — это открытый исследовательский агент, который улучшает возможности рассуждений и поиска информации. Он поддерживает инструментальную помощь и демонстрирует выдающиеся результаты на различных бенчмарках, включая HLE и BrowserComp.

🚀 Основные моменты:
- 💡 Поддержка интерактивного масштабирования для глубоких взаимодействий.
- 📚 Доступ к уникальному набору данных MiroVerse с 147k образцами.
- 🔧 Инфраструктура для стабильного обучения моделей.
- 🤖 Совместимость с множеством бенчмарков и инструментов.

📌 GitHub: https://github.com/MiroMindAI/MiroThinker

#python

🤔2

1.13K views13:49

About

Blog

Apps

Platform