Silero News
1.33K subscribers
58 photos
13 videos
50 files
171 links
Direct inquiries: hello@silero.ai or @snakers41
Chat: @silero_speech

Links:

silero.ai
api.silero.ai/docs
audio-v-text.silero.ai
Download Telegram
We Have Published a Model For Text Repunctuation and Recapitalization

The model works with SINGLE sentences (albeit long ones) and:

- Inserts capital letters and basic punctuation marks (dot, comma, hyphen, question mark, exclamation mark, dash for Russian);
- Works for 4 languages (Russian, English, German, Spanish) and can be extended;
- By design is domain agnostic and is not based on any hard-coded rules;
- Has non-trivial metrics and succeeds in the task of improving text readability;

Links:

- Model repo - https://github.com/snakers4/silero-models#text-enhancement
- Colab notebook - https://colab.research.google.com/github/snakers4/silero-models/blob/master/examples_te.ipynb
- Russian article - https://habr.com/ru/post/581946/
- English article - https://habr.com/ru/post/581960/
Portfolio Update and VAD News

In case you have not been following this channel, added some write-up about our helper products (VAD, text enhancement, language classifier, number detector) to our Russian website:

https://www.silero.ai/tag/auxiliary-products/

Also ... a massive VAD update coming soon.
Синтезируем голос бабушки, дедушки и Ленина + новости нашего публичного синтеза

В
этой статье мы постараемся:

- На реальных примерах показать возможности генерации голоса на малом числе данных или на данных с неидеальным качеством;
- Немного порассуждать на тему цифровых памятников (это чем-то похоже на интерактивные или трехмерные фотографии), сделанных из голоса человека;
- Также немного порассуждать на тему того, какую объективную опасность это представляет для общества;

И также мы конечно поделимся новостями нашего синтеза речи.

https://habr.com/ru/post/584750/
Our private UA TTS featured on Ukrainian Radio - http://ukr.radio/schedule/play-archive.html?periodItemID=2973701

Lol, no one invited us to radio in Russia

What gives
Forwarded from Spark in me (Alexander)
Telegram-бот Silero бесплатно переводит речь в текст

Мы сделали бесплатного телеграм-бота, который переводит аудио в текст. В отличие от нашего бесплатного публичного решения для транскрибации длинных аудио, этот бот скорее настроен для удобства работы с короткими голосовыми сообщениями, заметками и аудио средней длины (несколько минут).

Боту можно послать аудио как напрямую, так и добавить в группу. В группе бот будет реагировать на все аудиофайлы (но сообщения об ошибках выводиться не будут). Более подробно об ограничениях и особенностях работы можно узнать в методах /help и /faq.

Основная UX фишка работы бота — проработанный и удобный формат чтения и навигации по распознанным сообщениям и заметкам (а не стена текста).


Статья - https://habr.com/ru/post/591563/
Сам бот - @silero_audio_bot
клим саныч = cream sandwich
Forwarded from Spark in me (Alexander)
После долгой и упорной отладки микроскопических бесячих краевых кейсов в боте и случившегося Хабра-эффекта, решили попробовать на пикабу - https://pikabu.ru/story/telegrambot_avtomaticheski_perevodit_rech_v_tekst_8647046
Are ONNX Models Necessary for the VAD?

In a few days we will be radically changing the models:

- Probably dropping ONNX VAD models (we have not decided yet);
- Reducing chunk size to 30ms (chunk will be flexible, but larger than 30ms);
- Removing separate 8 / 16 kHz models, now all models would work with 8 and 16 kHz;
- Most likely deprecating micro, mini and ordinary models in favor of just a mini-sized models (still running last experiments);
- New models will be compatible with mobile builds of PyTorch;
- Dropping the batched buffering approach we used because of large chunks;

https://github.com/snakers4/silero-vad/issues/125