🎤 Инновационная система распознавания речи Fun-ASR
Fun-ASR — мощная модель распознавания речи, обученная на миллионах часов аудиоданных. Она поддерживает 31 язык и обеспечивает высокую точность в сложных условиях, таких как шумные помещения. Модель адаптирована для профессиональных терминов в таких областях, как образование и финансы.
🚀 Основные моменты:
- Высокая точность распознавания до 93% в шумных условиях.
- Поддержка 31 языка с акцентом на восточноазиатские языки.
- Оптимизация для распознавания диалектов и региональных акцентов.
- Способность распознавать текст песен на фоне музыки.
📌 GitHub: https://github.com/FunAudioLLM/Fun-ASR
@pythonl
#python
Fun-ASR — мощная модель распознавания речи, обученная на миллионах часов аудиоданных. Она поддерживает 31 язык и обеспечивает высокую точность в сложных условиях, таких как шумные помещения. Модель адаптирована для профессиональных терминов в таких областях, как образование и финансы.
🚀 Основные моменты:
- Высокая точность распознавания до 93% в шумных условиях.
- Поддержка 31 языка с акцентом на восточноазиатские языки.
- Оптимизация для распознавания диалектов и региональных акцентов.
- Способность распознавать текст песен на фоне музыки.
📌 GitHub: https://github.com/FunAudioLLM/Fun-ASR
@pythonl
#python
🔥8❤7👍1
📄🚀 Qwen-Doc: Открытые проекты по пониманию документов
Qwen-Doc — это репозиторий, посвященный ИИ для работы с документами, разработанный командой Tongyi-Zhiwen. Здесь собраны исследования и практики, направленные на улучшение обработки сложных документов с помощью современных технологий, включая обучение с подкреплением и долгосрочное понимание контекста.
🚀Основные моменты:
- Модели для долгосрочного понимания документов.
- Использование обучения с подкреплением для улучшения ИИ.
- Открытые данные и методологии для сообщества.
- Проекты QwenLong-L1 и QwenLong-L1.5 с передовыми алгоритмами.
- FRAMEWORK SPELL для автономного генерации обучающих данных.
📌 GitHub: https://github.com/Tongyi-Zhiwen/Qwen-Doc
#python
Qwen-Doc — это репозиторий, посвященный ИИ для работы с документами, разработанный командой Tongyi-Zhiwen. Здесь собраны исследования и практики, направленные на улучшение обработки сложных документов с помощью современных технологий, включая обучение с подкреплением и долгосрочное понимание контекста.
🚀Основные моменты:
- Модели для долгосрочного понимания документов.
- Использование обучения с подкреплением для улучшения ИИ.
- Открытые данные и методологии для сообщества.
- Проекты QwenLong-L1 и QwenLong-L1.5 с передовыми алгоритмами.
- FRAMEWORK SPELL для автономного генерации обучающих данных.
📌 GitHub: https://github.com/Tongyi-Zhiwen/Qwen-Doc
#python
❤9👍5🔥4🤩1
🚀 Модели IQuest-Coder-V1 для автономного программирования
IQuest-Coder-V1 — это семейство больших языковых моделей, предназначенных для улучшения автономного программирования и интеллектуального анализа кода. Модели используют инновационную многослойную парадигму обучения, обеспечивая выдающиеся результаты на ключевых бенчмарках.
🚀 Основные моменты:
- Достигает лучших результатов на SWE-Bench и других бенчмарках.
- Обучение на основе динамики изменений в репозиториях.
- Два специализированных направления: Thinking и Instruct модели.
- Поддержка контекста до 128K токенов.
- Эффективная архитектура с рекуррентным механизмом.
📌 GitHub: https://github.com/IQuestLab/IQuest-Coder-V1
#python
IQuest-Coder-V1 — это семейство больших языковых моделей, предназначенных для улучшения автономного программирования и интеллектуального анализа кода. Модели используют инновационную многослойную парадигму обучения, обеспечивая выдающиеся результаты на ключевых бенчмарках.
🚀 Основные моменты:
- Достигает лучших результатов на SWE-Bench и других бенчмарках.
- Обучение на основе динамики изменений в репозиториях.
- Два специализированных направления: Thinking и Instruct модели.
- Поддержка контекста до 128K токенов.
- Эффективная архитектура с рекуррентным механизмом.
📌 GitHub: https://github.com/IQuestLab/IQuest-Coder-V1
#python
❤6👍6🔥2
📹 Загрузчик видео с YouTube и других платформ
tuitube — это текстовый интерфейс для загрузки видео с YouTube, 𝕏, Twitch, Instagram и Bilibili с использованием yt-dlp. Удобный инструмент для тех, кто предпочитает командную строку.
🚀 Основные моменты:
- Поддержка множества видео платформ
- Использует yt-dlp для загрузки
- Простой текстовый интерфейс
- Легко настраивается и использует командную строку
📌 GitHub: https://github.com/remorses/tuitube
#python
tuitube — это текстовый интерфейс для загрузки видео с YouTube, 𝕏, Twitch, Instagram и Bilibili с использованием yt-dlp. Удобный инструмент для тех, кто предпочитает командную строку.
🚀 Основные моменты:
- Поддержка множества видео платформ
- Использует yt-dlp для загрузки
- Простой текстовый интерфейс
- Легко настраивается и использует командную строку
📌 GitHub: https://github.com/remorses/tuitube
#python
👍24❤6🔥4
🛠️ Трекер токенов для LLM CLI инструментов
Sherlock предоставляет живую панель мониторинга для отслеживания использования токенов в LLM CLI инструментах. Вы можете в реальном времени видеть, сколько токенов вы используете, а также сохранять все запросы для последующего анализа.
🚀 Основные моменты:
- Отслеживание использования токенов в реальном времени
- Визуализация контекстных окон с индикатором
- Автоматическое сохранение запросов в формате Markdown и JSON
- Никакой конфигурации — просто установите и используйте
📌 GitHub: https://github.com/jmuncor/sherlock
#python
📲 Max
Sherlock предоставляет живую панель мониторинга для отслеживания использования токенов в LLM CLI инструментах. Вы можете в реальном времени видеть, сколько токенов вы используете, а также сохранять все запросы для последующего анализа.
🚀 Основные моменты:
- Отслеживание использования токенов в реальном времени
- Визуализация контекстных окон с индикатором
- Автоматическое сохранение запросов в формате Markdown и JSON
- Никакой конфигурации — просто установите и используйте
📌 GitHub: https://github.com/jmuncor/sherlock
#python
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥3👍2
🔍 Исследуй связи с Эпштейном
EpsteIn позволяет искать упоминания ваших контактов из LinkedIn в открытых судебных документах Эпштейна. Просто загрузите файл с вашими связями и получите отчет в формате HTML о найденных совпадениях.
🚀 Основные моменты:
- Поиск по судебным документам Эпштейна
- Генерация отчетов в HTML
- Упоминания сортируются по количеству
- Поддержка точного совпадения имен
📌 GitHub: https://github.com/cfinke/EpsteIn
#python
📲 Max
EpsteIn позволяет искать упоминания ваших контактов из LinkedIn в открытых судебных документах Эпштейна. Просто загрузите файл с вашими связями и получите отчет в формате HTML о найденных совпадениях.
🚀 Основные моменты:
- Поиск по судебным документам Эпштейна
- Генерация отчетов в HTML
- Упоминания сортируются по количеству
- Поддержка точного совпадения имен
📌 GitHub: https://github.com/cfinke/EpsteIn
#python
Please open Telegram to view this post
VIEW IN TELEGRAM
😁67👍6❤4🔥3
🤖 LingBot-VLA - это прогрессивная модель, объединяющая визуальные, языковые и действия для роботов.
Она обучена на 20,000 часов реальных данных и демонстрирует высокую эффективность и производительность в симуляциях и реальных задачах.
🚀 Основные моменты:
- Обширные данные для предобучения
- Превосходные результаты по сравнению с конкурентами
- Увеличенная скорость обучения на 1.5-2.8x
📌 GitHub: https://github.com/Robbyant/lingbot-vla
#python
Она обучена на 20,000 часов реальных данных и демонстрирует высокую эффективность и производительность в симуляциях и реальных задачах.
🚀 Основные моменты:
- Обширные данные для предобучения
- Превосходные результаты по сравнению с конкурентами
- Увеличенная скорость обучения на 1.5-2.8x
📌 GitHub: https://github.com/Robbyant/lingbot-vla
#python
❤5👍4🔥3
Python-баг, который выглядит безобидно… но ломает логику 👇
Ожидание: оба orange удалятся.
Реальность: один orange остаётся.
Почему так происходит?
Ты изменяешь список во время итерации.
После удаления элементы сдвигаются, и цикл пропускает следующий элемент.
Это классический сценарий продакшн-багов:
• код выглядит правильно
• тесты могут пройти
• но данные обрабатываются неправильно
Правильный вариант:
Мораль:
Изменяешь коллекцию во время обхода -Deploy first. Pray later.
#junior #python
@pythonl
fruits = ["apple", "lime", "orange",
"pineapple", "orange"]
for f in fruits:
if f == "orange":
fruits.remove(f)
print(fruits)
Ожидание: оба orange удалятся.
Реальность: один orange остаётся.
Почему так происходит?
Ты изменяешь список во время итерации.
После удаления элементы сдвигаются, и цикл пропускает следующий элемент.
Это классический сценарий продакшн-багов:
• код выглядит правильно
• тесты могут пройти
• но данные обрабатываются неправильно
Правильный вариант:
fruits = [f for f in fruits if f != "orange"]
Мораль:
Изменяешь коллекцию во время обхода -Deploy first. Pray later.
#junior #python
@pythonl
1❤20👍9😁4🔥2
🚀 Погружение в алгоритмы AI без магии
🚀 Основные моменты:
- Один файл — один алгоритм, без внешних зависимостей.
- Полное обучение и предсказание в каждом скрипте.
- Читаемый код с обязательными комментариями для понимания.
- Работает на обычном CPU за разумное время.
📌 GitHub: https://github.com/Mathews-Tom/no-magic
#python
no-magic — это коллекция однофайловых, независимых реализаций алгоритмов, которые лежат в основе современных ИИ. Каждый скрипт является самодостаточной программой, обучающей модель с нуля и выполняющей предсказания, без использования сложных библиотек.🚀 Основные моменты:
- Один файл — один алгоритм, без внешних зависимостей.
- Полное обучение и предсказание в каждом скрипте.
- Читаемый код с обязательными комментариями для понимания.
- Работает на обычном CPU за разумное время.
📌 GitHub: https://github.com/Mathews-Tom/no-magic
#python
❤13👍6🔥3
MOVA — это открытая модель, которая синхронно генерирует видео и аудио, устраняя проблемы каскадных пайплайнов. Она обеспечивает высокое качество и точную синхронизацию губ и звуковых эффектов, предлагая пользователям мощный инструмент для создания контента.
🚀Основные моменты:
- Бимодальная генерация: видео и аудио создаются одновременно.
- Высокая точность синхронизации губ и звуковых эффектов.
- Полностью открытый исходный код и доступные веса модели.
- Архитектура с асимметричными двойными башнями для лучшего взаимодействия модальностей.
📌 GitHub: https://github.com/OpenMOSS/MOVA
#python
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍4🔥4
🌟 Создайте свой пиксельный офис с Star Office UI
Star Office UI — это интерактивная панель для многопользовательского сотрудничества, визуализирующая статус ваших AI помощников в реальном времени. Вы можете видеть, кто чем занят, что было сделано вчера и кто сейчас онлайн.
🚀 Основные моменты:
- Визуализация статусов AI: idle, writing, syncing и др.
- "Вчерашние заметки" для краткого обзора выполненной работы.
- Поддержка приглашения других участников в офис.
- Адаптивный интерфейс для мобильных устройств.
- Гибкие варианты публичного доступа.
📌 GitHub: https://github.com/ringhyacinth/Star-Office-UI
#python
@pythonl
Star Office UI — это интерактивная панель для многопользовательского сотрудничества, визуализирующая статус ваших AI помощников в реальном времени. Вы можете видеть, кто чем занят, что было сделано вчера и кто сейчас онлайн.
🚀 Основные моменты:
- Визуализация статусов AI: idle, writing, syncing и др.
- "Вчерашние заметки" для краткого обзора выполненной работы.
- Поддержка приглашения других участников в офис.
- Адаптивный интерфейс для мобильных устройств.
- Гибкие варианты публичного доступа.
📌 GitHub: https://github.com/ringhyacinth/Star-Office-UI
#python
@pythonl
🔥11❤6👍4😁3