Voice-Pro
— утилита с веб-интерфейсом на базе
Gradio
, предназначенная для обработки аудио. Разработана на языке
Python и предоставляет широкий спектр функций для работы с голосом и текстом.
Основные возможности:
🔵Загрузка с YouTube: Позволяет скачивать видео с
YouTube и извлекать из них аудио в форматах
mp3,
wav или
flac.
🔵Удаление вокала: Использует технологии
MDX-Net (
UVR5) и
Demucs для разделения вокала и инструментала в аудиофайлах.
🔵Распознавание речи (STT): Поддерживает преобразование речи в текст с использованием моделей
Whisper,
Faster-Whisper и
Whisper-Timestamped.
🔵Переводчик: Интегрирован с
Google Translate для перевода коротких текстов и субтитров на более чем 100 языков.
🔵Синтез речи (TTS): Предоставляет функции преобразования текста в речь с использованием
Edge-TTS, а также моделей
E2 и
F5-TTS, поддерживающих клонирование голоса.
🔵Клонирование голоса: Обеспечивает возможность клонирования голоса для создания подкастов или других аудиоматериалов.
🔵Реальное время и пакетная обработка: Поддерживает как обработку в реальном времени, так и пакетную обработку большого количества файлов.
📱 Репозиторий➡️ Хижина программиста 🌎
Ставьте «🥰», если пост вам понравился⌨️ Теги:#voice-pro
#ai #утилита #gradio #python #maestro7it #maximdupley #quadd4rv1n7 #2025