Useful Tools | Linux | GitOps | DevOps
5.79K subscribers
152 photos
1 video
7 files
678 links
Полезные бесплатные opensource инструменты на все случаи жизни, а иногда и советы.

Понравился проект из поста - поддержи автора звездой!

Автор: @dmitry_malinin
Web: https://gitgate.d3.ru

Сотрудничество: @maxgrue
Обсуждение: @gittalk
Download Telegram
GigaAM (Giga Acoustic Model) - семейство акустических моделей для обработки звучащей речи на русском языке.

Среди решаемых задач - задачи распознавания речи, распознавания эмоций и извлечения эмбеддингов из аудио. Модели построены на основе архитектуры Conformer с использованием методов self-supervised learning (wav2vec2-подход для GigaAM-v1 и HuBERT-подход для GigaAM-v2).

Модели GigaAM с отрывом являются лучшими по качеству моделями в открытом доступе для соответствующих задач.

Репозиторий включает:

- GigaAM: фундаментальная акустическая модель, обученная на большом объеме неразмеченных русскоязычных аудиозаписей.
- GigaAM-CTC и GigaAM-RNNT: модели, дообученные на задачу автоматического распознавания речи.
- GigaAM-Emo: модель, дообученная на задачу распознавания эмоций.

https://gitverse.ru/GigaTeam/GigaAM

опубликовано в @gitgate

#russian #speech2text #stt
👍12🔥6