Хабр / ML & AI
482 subscribers
5.47K links
Telegram-канал, где вы можете найти публикации из RSS-фидов тематических хабов "Машинное обучение" и "Искусственный интеллект" портала Хабр.

Данный канал не является официальным представительством платформы Хабр.

Администратор - @evilfreelancer
Download Telegram
Один клик, и телеграм-каналы превращаются в…

В подкасты! Рассказываем, как с помощью ИИ мы создали аудио-стриминг телеграм-каналов.

Сейчас в Телеграм много очень интересного контента. Но часто не хватает времени, чтобы все это читать. Вот тут-то и приходит на помощь Radiogram. Мы сделали так, что ваши любимые телеграм-каналы можно просто слушать – как подкасты.

Читать далее

#телеграм #telegram #стриминг #телеграм_каналы #аудио #ии #tts #плеер #radiogram #радиограм | @habr_ai
Text-to-speech. Анализ открытых решений синтеза речи

Всем привет! В этой статье будут рассмотрены открытые проекты по синтезу речи с поддержкой русского языка. Под словом «открытые» будем иметь в виду, что разработчики безвозмездно предоставляют в пользование результаты своих трудов (спасибо им за это большое). Также в обзоре вы найдете краткое описание решений с примерами генерации аудио по тексту и полезными ссылками для начального погружения в задачу text-to-speech. Приятного прочтения.

Читать далее

#tts #text_to_speech #audio #voice_conversion #generate_speech | @habr_ai
[Перевод] VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot

VALL-E 2, последнее достижение в области нейронных кодировочных языковых моделей, которое стало вехой в синтезе речи в zero-shot, достигнув человеческого уровня впервые. Zero-shot - способность модели генерировать речь для голоса, который она не слышала во время обучения. Другими словами, модель может синтезировать речь для нового диктора, основываясь лишь на коротком аудио образце его голоса (prompt).

Основанная на своем предшественнике VALL-E, новая итерация вводит два значительных улучшения: Repetition Aware Sampling и Grouped Code Modeling.

Repetition Aware Sampling (Выборка с учетом повторений) решает проблему зацикливания, с которой сталкивался предыдущий VALL-E. Если модель начинает повторять одни и те же звуки, она автоматически переключается на более точный метод выбора, чтобы избежать "застревания". Grouped Code Modeling (Моделирование групп кодов) - звуковые коды группируются и обрабатываются вместе, как слоги в словах. Это ускоряет синтез речи и позволяет модели лучше учитывать контекст, делая речь более естественной и связной.

Синтез речи из текста (TTS) направлен на генерацию высококачественной речи из текстового ввода с высокой степенью ясности и разборчивости. Читать далее

#обработка_естественного_языка #синтез_речи #nlp #tts | @habr_ai
Делаем быстрый, качественный и доступный синтез на языках России — нужно ваше участие

Привет, Хабр!

В этом году мы делаем проект Фонда Бортника по разработке модели синтеза речи языков России и СНГ. Возможно, нас на Хабре вы знаете по статьям про синтез речи, детектор голоса или через одного популярного бота для озвучки в Телеграме (на всякий не буду ссылку прикладывать).

Наша основная задача - сделать удобный, быстрый, устойчивый, качественный и нетребовательный к вычислительным ресурсам синтез на самых популярных у нас в стране и в ближайшем зарубежье языках.

По итогу проекта планируется публикация общедоступных моделей синтеза языка под свободной лицензией (MIT). Мы бы хотели покрыть как минимум 10 популярных языков. Всего популярных языков (более 100 тысяч носителей) 30+, так что, в принципе, тут есть, где разгуляться.

Поэтому ищем людей, у которых два родных языка (русский и второй родной), которые бы помогли нам с рядом вещей:

С чем?

#синтез_речи #русский_язык #украинский_язык #узбекский_язык #казахский_язык #азербайджанский_язык #таджикский_язык #tts #белорусский_язык #татарский_язык | @habr_ai
KoboldCpp — нейросеть для развлечений и работы у нас дома

Представьте, что вы развернули у себя дома полноценную языковую модель — не платного чат-бота из облака с его фильтрами, задержками и цензурой, а вполне безлимитную LLM, которая может быть и надёжным помощником по работе, и вашей вайфу… на абсолютно любую тему. И в 2025 году это уже работает неожиданно хорошо.

Ещё год назад за достойное ролевое общение приходилось платить подиской Character.AI или бороться с ограничениями, но теперь — всё иначе. Домашний чатбот не только не уступает по качеству, но и во многом выигрывает: всего за 5 минут можно добавить генерацию изображений, озвучку (TTS), понимание речи (STT) и полную автономность — без облаков, логов и подписок. Читать далее

#ai #ml #chat #chatbot #чат #чатботы #llm #искусственный_интеллект #генерация_изображений #tts | @habr_ai
KoboldCpp — нейросеть для развлечений и работы у нас дома

Представьте, что вы развернули у себя дома полноценную языковую модель — не платного чат-бота из облака с его фильтрами, задержками и цензурой, а вполне безлимитную LLM, которая может быть и надёжным помощником по работе, и вашей вайфу… на абсолютно любую тему. И в 2025 году это уже работает неожиданно хорошо.

Ещё год назад за достойное ролевое общение приходилось платить подиской Character.AI или бороться с ограничениями, но теперь — всё иначе. Домашний чатбот не только не уступает по качеству, но и во многом выигрывает: всего за 5 минут можно добавить генерацию изображений, озвучку (TTS), понимание речи (STT) и полную автономность — без облаков, логов и подписок. Читать далее

#ai #ml #chat #chatbot #чат #чатботы #llm #искусственный_интеллект #генерация_изображений #tts | @habr_ai
Language Dove: разбираем китайскую и не только грамоту

Я довольно давно живу в Армении и изучаю армянский язык для получения гражданства (“вы должны уметь читать любой документ” - сказали мне в миграционном центре). 

Армянский язык очень сложен, и у меня возникла идея написать приложение для иммерсивного (dove - нырнул, погрузился) чтения на иностранном языке с пословным контекстуальным переводом, которое способно работать с любыми языками, даже с самыми редкими и сложными. Читать далее

#лингвистика #перевод #ии #llm #web_speach_api #tts #английский #армянский #сербский #немецкий | @habr_ai