AI & Robotics Lab
18 subscribers
69 photos
26 videos
9 files
98 links
Explore AI code generation, robotics, and ROS with original projects and hands-on guides. Follow along as I share my experience, code samples, and tips for building intelligent systems.
Download Telegram
Forwarded from AI & Robotics Lab
На первом месте по загрузкам - coqui/XTTS-v2 - поработав с ней понял, что не мое. А вот следующая hexgrad/Kokoro-TTS оказалась именно то, что нужно.

Для английского языка в модели почти 30 голосов - как мужских, так и женских - что-нибудь сгенерировать и послушать как они звучат можно здесь.

Модель с открытыми весами, ее использование максимально просто и удобно - все разворачивается в виртуальном окружении. Места, правда, занимает 5.6 Гб. Зато для работы не нужна видеокарта: на моем ноуте с Ryzen 5 4500U двухчасовой ролик генерируется где-то минут за 50.

Чтобы было удобно пользоваться - сделал небольшой проект pdf2mp3, обернув модель в CLI утилиту: работает как в Linux, так и в Win. Можно выбирать языки (русского, к сожалению, пока нет), голоса, скорость (важно для иностранного языка) и прочие параметры. Генерирует из pdf файла сразу в mp3 - подробное описание как установить и пользоваться.

#projects #kokoro #tts
🔥1🆒1