Один клик, и телеграм-каналы превращаются в…
В подкасты! Рассказываем, как с помощью ИИ мы создали аудио-стриминг телеграм-каналов.
Сейчас в Телеграм много очень интересного контента. Но часто не хватает времени, чтобы все это читать. Вот тут-то и приходит на помощь Radiogram. Мы сделали так, что ваши любимые телеграм-каналы можно просто слушать – как подкасты.
Читать далее
#телеграм #telegram #стриминг #телеграм_каналы #аудио #ии #tts #плеер #radiogram #радиограм | @habr_ai
В подкасты! Рассказываем, как с помощью ИИ мы создали аудио-стриминг телеграм-каналов.
Сейчас в Телеграм много очень интересного контента. Но часто не хватает времени, чтобы все это читать. Вот тут-то и приходит на помощь Radiogram. Мы сделали так, что ваши любимые телеграм-каналы можно просто слушать – как подкасты.
Читать далее
#телеграм #telegram #стриминг #телеграм_каналы #аудио #ии #tts #плеер #radiogram #радиограм | @habr_ai
Что такое технология TTS, как устроена и каких сферах используется синтез речи
Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере.
Читать далее
#синтез_речи #синтез_звука #синтезаторы #tts #text_to_speech #text2speech #text_to_speech #энкодер #вокодер | @habr_ai
Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере.
Читать далее
#синтез_речи #синтез_звука #синтезаторы #tts #text_to_speech #text2speech #text_to_speech #энкодер #вокодер | @habr_ai
Хабр
Что такое технология TTS, как устроена и каких сферах используется синтез речи
Синтез речи — технология, которая преобразует написанный текст в аудиосигнал. Программа анализирует слова и создает звуки, которые имитируют человеческий голос. Метод называют по-разному: генерация...
Text-to-speech. Анализ открытых решений синтеза речи
Всем привет! В этой статье будут рассмотрены открытые проекты по синтезу речи с поддержкой русского языка. Под словом «открытые» будем иметь в виду, что разработчики безвозмездно предоставляют в пользование результаты своих трудов (спасибо им за это большое). Также в обзоре вы найдете краткое описание решений с примерами генерации аудио по тексту и полезными ссылками для начального погружения в задачу text-to-speech. Приятного прочтения.
Читать далее
#tts #text_to_speech #audio #voice_conversion #generate_speech | @habr_ai
Всем привет! В этой статье будут рассмотрены открытые проекты по синтезу речи с поддержкой русского языка. Под словом «открытые» будем иметь в виду, что разработчики безвозмездно предоставляют в пользование результаты своих трудов (спасибо им за это большое). Также в обзоре вы найдете краткое описание решений с примерами генерации аудио по тексту и полезными ссылками для начального погружения в задачу text-to-speech. Приятного прочтения.
Читать далее
#tts #text_to_speech #audio #voice_conversion #generate_speech | @habr_ai
Хабр
Text-to-speech. Анализ открытых решений синтеза речи
Всем привет! В этой статье будут рассмотрены открытые проекты по синтезу речи с поддержкой русского языка. Под словом «открытые» будем иметь в виду, что разработчики безвозмездно предоставляют в...
[Перевод] VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot
VALL-E 2, последнее достижение в области нейронных кодировочных языковых моделей, которое стало вехой в синтезе речи в zero-shot, достигнув человеческого уровня впервые. Zero-shot - способность модели генерировать речь для голоса, который она не слышала во время обучения. Другими словами, модель может синтезировать речь для нового диктора, основываясь лишь на коротком аудио образце его голоса (prompt).
Основанная на своем предшественнике VALL-E, новая итерация вводит два значительных улучшения: Repetition Aware Sampling и Grouped Code Modeling.
Repetition Aware Sampling (Выборка с учетом повторений) решает проблему зацикливания, с которой сталкивался предыдущий VALL-E. Если модель начинает повторять одни и те же звуки, она автоматически переключается на более точный метод выбора, чтобы избежать "застревания". Grouped Code Modeling (Моделирование групп кодов) - звуковые коды группируются и обрабатываются вместе, как слоги в словах. Это ускоряет синтез речи и позволяет модели лучше учитывать контекст, делая речь более естественной и связной.
Синтез речи из текста (TTS) направлен на генерацию высококачественной речи из текстового ввода с высокой степенью ясности и разборчивости. Читать далее
#обработка_естественного_языка #синтез_речи #nlp #tts | @habr_ai
VALL-E 2, последнее достижение в области нейронных кодировочных языковых моделей, которое стало вехой в синтезе речи в zero-shot, достигнув человеческого уровня впервые. Zero-shot - способность модели генерировать речь для голоса, который она не слышала во время обучения. Другими словами, модель может синтезировать речь для нового диктора, основываясь лишь на коротком аудио образце его голоса (prompt).
Основанная на своем предшественнике VALL-E, новая итерация вводит два значительных улучшения: Repetition Aware Sampling и Grouped Code Modeling.
Repetition Aware Sampling (Выборка с учетом повторений) решает проблему зацикливания, с которой сталкивался предыдущий VALL-E. Если модель начинает повторять одни и те же звуки, она автоматически переключается на более точный метод выбора, чтобы избежать "застревания". Grouped Code Modeling (Моделирование групп кодов) - звуковые коды группируются и обрабатываются вместе, как слоги в словах. Это ускоряет синтез речи и позволяет модели лучше учитывать контекст, делая речь более естественной и связной.
Синтез речи из текста (TTS) направлен на генерацию высококачественной речи из текстового ввода с высокой степенью ясности и разборчивости. Читать далее
#обработка_естественного_языка #синтез_речи #nlp #tts | @habr_ai
Хабр
VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot
Введение VALL-E 2, последнее достижение в области нейронных кодировочных языковых моделей, которое стало вехой в синтезе речи в zero-shot, достигнув человеческого уровня впервые. Zero-shot -...
Делаем быстрый, качественный и доступный синтез на языках России — нужно ваше участие
Привет, Хабр!
В этом году мы делаем проект Фонда Бортника по разработке модели синтеза речи языков России и СНГ. Возможно, нас на Хабре вы знаете по статьям про синтез речи, детектор голоса или через одного популярного бота для озвучки в Телеграме (на всякий не буду ссылку прикладывать).
Наша основная задача - сделать удобный, быстрый, устойчивый, качественный и нетребовательный к вычислительным ресурсам синтез на самых популярных у нас в стране и в ближайшем зарубежье языках.
По итогу проекта планируется публикация общедоступных моделей синтеза языка под свободной лицензией (MIT). Мы бы хотели покрыть как минимум 10 популярных языков. Всего популярных языков (более 100 тысяч носителей) 30+, так что, в принципе, тут есть, где разгуляться.
Поэтому ищем людей, у которых два родных языка (русский и второй родной), которые бы помогли нам с рядом вещей:
С чем?
#синтез_речи #русский_язык #украинский_язык #узбекский_язык #казахский_язык #азербайджанский_язык #таджикский_язык #tts #белорусский_язык #татарский_язык | @habr_ai
Привет, Хабр!
В этом году мы делаем проект Фонда Бортника по разработке модели синтеза речи языков России и СНГ. Возможно, нас на Хабре вы знаете по статьям про синтез речи, детектор голоса или через одного популярного бота для озвучки в Телеграме (на всякий не буду ссылку прикладывать).
Наша основная задача - сделать удобный, быстрый, устойчивый, качественный и нетребовательный к вычислительным ресурсам синтез на самых популярных у нас в стране и в ближайшем зарубежье языках.
По итогу проекта планируется публикация общедоступных моделей синтеза языка под свободной лицензией (MIT). Мы бы хотели покрыть как минимум 10 популярных языков. Всего популярных языков (более 100 тысяч носителей) 30+, так что, в принципе, тут есть, где разгуляться.
Поэтому ищем людей, у которых два родных языка (русский и второй родной), которые бы помогли нам с рядом вещей:
С чем?
#синтез_речи #русский_язык #украинский_язык #узбекский_язык #казахский_язык #азербайджанский_язык #таджикский_язык #tts #белорусский_язык #татарский_язык | @habr_ai
Хабр
Делаем быстрый, качественный и доступный синтез на языках России — нужно ваше участие
Привет, Хабр! В этом году мы делаем проект Фонда Бортника по разработке модели синтеза речи языков России и СНГ. Возможно, нас на Хабре вы знаете по статьям про синтез речи, детектор голоса или через...
Дорогая ИИ-редакция! Как мы построили голосовое медиа без сотрудников
Рассказываем, как мы заменили редакцию алгоритмами, телеграм-каналы превратили в радио, и пора ли традиционным медиа опасаться ИИ (пора). Читать далее
#телеграм #телеграм_бот #медиа #искусственный_интеллект #chatgpt #telegram #подкасты #контент #tts | @habr_ai
Рассказываем, как мы заменили редакцию алгоритмами, телеграм-каналы превратили в радио, и пора ли традиционным медиа опасаться ИИ (пора). Читать далее
#телеграм #телеграм_бот #медиа #искусственный_интеллект #chatgpt #telegram #подкасты #контент #tts | @habr_ai
Хабр
Как ИИ превращает телеграм-каналы в радио
Да, теперь телеграм-каналы можно слушать. Рассказываем, как это работает, и пора ли традиционным медиа напрягаться из-за ИИ (пора). Зачем мы это сделали Информационные радиостанции до сих пор живы по...
Теперь телеграм-каналы можно слушать
Рассказываем, как с помощью ИИ мы создали стриминговую платформу для телеграм-каналов. И почему это нужно всем, у кого нет времени читать. Читать далее
#телеграм #телеграм_бот #мини_приложение #telegram #подкасты #медиа #ии #искусственный_интеллект #tts #chatgpt | @habr_ai
Рассказываем, как с помощью ИИ мы создали стриминговую платформу для телеграм-каналов. И почему это нужно всем, у кого нет времени читать. Читать далее
#телеграм #телеграм_бот #мини_приложение #telegram #подкасты #медиа #ии #искусственный_интеллект #tts #chatgpt | @habr_ai
Хабр
Телеграм-каналы теперь можно слушать
Рассказываем, как с помощью ИИ мы создали аудио-платформу для телеграм-каналов. И почему это нужно всем, у кого нет времени читать. Каналов много, а времени мало Телеграм-каналы давно стали...
KoboldCpp — нейросеть для развлечений и работы у нас дома
Представьте, что вы развернули у себя дома полноценную языковую модель — не платного чат-бота из облака с его фильтрами, задержками и цензурой, а вполне безлимитную LLM, которая может быть и надёжным помощником по работе, и вашей вайфу… на абсолютно любую тему. И в 2025 году это уже работает неожиданно хорошо.
Ещё год назад за достойное ролевое общение приходилось платить подиской Character.AI или бороться с ограничениями, но теперь — всё иначе. Домашний чатбот не только не уступает по качеству, но и во многом выигрывает: всего за 5 минут можно добавить генерацию изображений, озвучку (TTS), понимание речи (STT) и полную автономность — без облаков, логов и подписок. Читать далее
#ai #ml #chat #chatbot #чат #чатботы #llm #искусственный_интеллект #генерация_изображений #tts | @habr_ai
Представьте, что вы развернули у себя дома полноценную языковую модель — не платного чат-бота из облака с его фильтрами, задержками и цензурой, а вполне безлимитную LLM, которая может быть и надёжным помощником по работе, и вашей вайфу… на абсолютно любую тему. И в 2025 году это уже работает неожиданно хорошо.
Ещё год назад за достойное ролевое общение приходилось платить подиской Character.AI или бороться с ограничениями, но теперь — всё иначе. Домашний чатбот не только не уступает по качеству, но и во многом выигрывает: всего за 5 минут можно добавить генерацию изображений, озвучку (TTS), понимание речи (STT) и полную автономность — без облаков, логов и подписок. Читать далее
#ai #ml #chat #chatbot #чат #чатботы #llm #искусственный_интеллект #генерация_изображений #tts | @habr_ai
Хабр
KoboldCpp — нейросеть для развлечений и работы у нас дома
Представьте, что вы развернули у себя дома полноценную языковую модель — не платного чат‑бота из облака с его фильтрами, задержками и цензурой, а вполне безлимитную...
KoboldCpp — нейросеть для развлечений и работы у нас дома
Представьте, что вы развернули у себя дома полноценную языковую модель — не платного чат-бота из облака с его фильтрами, задержками и цензурой, а вполне безлимитную LLM, которая может быть и надёжным помощником по работе, и вашей вайфу… на абсолютно любую тему. И в 2025 году это уже работает неожиданно хорошо.
Ещё год назад за достойное ролевое общение приходилось платить подиской Character.AI или бороться с ограничениями, но теперь — всё иначе. Домашний чатбот не только не уступает по качеству, но и во многом выигрывает: всего за 5 минут можно добавить генерацию изображений, озвучку (TTS), понимание речи (STT) и полную автономность — без облаков, логов и подписок. Читать далее
#ai #ml #chat #chatbot #чат #чатботы #llm #искусственный_интеллект #генерация_изображений #tts | @habr_ai
Представьте, что вы развернули у себя дома полноценную языковую модель — не платного чат-бота из облака с его фильтрами, задержками и цензурой, а вполне безлимитную LLM, которая может быть и надёжным помощником по работе, и вашей вайфу… на абсолютно любую тему. И в 2025 году это уже работает неожиданно хорошо.
Ещё год назад за достойное ролевое общение приходилось платить подиской Character.AI или бороться с ограничениями, но теперь — всё иначе. Домашний чатбот не только не уступает по качеству, но и во многом выигрывает: всего за 5 минут можно добавить генерацию изображений, озвучку (TTS), понимание речи (STT) и полную автономность — без облаков, логов и подписок. Читать далее
#ai #ml #chat #chatbot #чат #чатботы #llm #искусственный_интеллект #генерация_изображений #tts | @habr_ai
Хабр
KoboldCpp — нейросеть для развлечений и работы у нас дома
Представьте, что вы развернули у себя дома полноценную языковую модель — не платного чат‑бота из облака с его фильтрами, задержками и цензурой, а вполне безлимитную...
Language Dove: разбираем китайскую и не только грамоту
Я довольно давно живу в Армении и изучаю армянский язык для получения гражданства (“вы должны уметь читать любой документ” - сказали мне в миграционном центре).
Армянский язык очень сложен, и у меня возникла идея написать приложение для иммерсивного (dove - нырнул, погрузился) чтения на иностранном языке с пословным контекстуальным переводом, которое способно работать с любыми языками, даже с самыми редкими и сложными. Читать далее
#лингвистика #перевод #ии #llm #web_speach_api #tts #английский #армянский #сербский #немецкий | @habr_ai
Я довольно давно живу в Армении и изучаю армянский язык для получения гражданства (“вы должны уметь читать любой документ” - сказали мне в миграционном центре).
Армянский язык очень сложен, и у меня возникла идея написать приложение для иммерсивного (dove - нырнул, погрузился) чтения на иностранном языке с пословным контекстуальным переводом, которое способно работать с любыми языками, даже с самыми редкими и сложными. Читать далее
#лингвистика #перевод #ии #llm #web_speach_api #tts #английский #армянский #сербский #немецкий | @habr_ai
Хабр
Language Dove: разбираем китайскую и не только грамоту
Я довольно давно живу в Армении и изучаю армянский язык для получения гражданства (“вы должны уметь читать любой документ” - сказали мне в миграционном центре). Армянский язык очень сложен, и...