متن به گفتار فارسی
416 subscribers
6 photos
3 videos
7 files
12 links
گروه گفتگو و تبادل نظر :
@persian_tts_chat

مدیر:
@persian_tts_adminbot
Download Telegram
#همفکری

🔰یکی از مشکلاتی که تعدادی گزارش کردن این بود که ما متن می‌دیم ولی فقط نویز خروجی میگیریم؟!

🧐 بعد از بررسی و پیشنهاد یکی از دوستان فهمیدیم اگه آخر جمله نقطه داشته باشه مدل نویز تولید میکنه

🌐 اگه راهکاری برای حل این مشکل پیدا کردید زیر این پیام بگین
متن به گفتار فارسی pinned «سلام دوستان توی نظرات میتونید سوالاتتون رو بپرسید https://github.com/karim23657/Persian-tts-coqui»
📱🔈اجرای مدل های vits در اندروید!

با برنامه MultiTTS میتونید مدل های vits رو به عنوان موتور متن به گفتار روی گوشی تون اجرا کنید.🤩

فایلشو توی پیام بعدی میزارم ◀️

👌 اگه برنامه ی جالبی پیدا کردید اینجا بگید👇

#معرفی_ابزار #اندروید
MultiTTS_1.7.5(76)-armeabi-v7a-release.apk
98.6 MB
دوستان این برنامه خیلی قابلیت داره که میتونید اونا رو توی کانالش ببینید

https://t.me/MultiTTS_channel

⁉️ سوالاتونو اینجا بپرسید👇
🗣️ اجرای مدل های vits در اندروید و ویندوز !

🔗 از اینجا میتونید آخرین نسخه برنامه رو برای سیستمتون دانلود کنید : https://github.com/k2-fsa/sherpa-onnx

👌 اگه برنامه ی جالبی پیدا کردید اینجا بگید👇

فایل نصبی اندروید در پیام بعدی◀️

#معرفی_ابزار #اندروید #ویندوز
📢 راهکاری برای ساخت دیتاست

اگر به دنبال ساخت دیتاست‌های تبدیل متن به گفتار (TTS) با کیفیت هستید، میتونید از نوت بوک گوگل ManaTTS استفاده کنید.

پایپلاین ManaTTS با ارائه مراحل شفاف و قابل تنظیم، از مراحل جمع‌آوری داده‌ها تا تقطیع صدا و همترازی اجباری، به شما کمک می‌کند تا دادگان گفتاری خود را بسازید. برای مشاهده و استفاده از این ابزار ، به مخزن مراجعه کنید . 🛠️

https://github.com/MahtaFetrat/ManaTTS-Persian-Speech-Dataset#processing-pipeline
📣 آموزش اضافه کردن صدا به برنامه ی MultiTTS راه ۱ :

1⃣ فایل های بکاپ زیر رو دانلود کنید و در یک پوشه قرار بدید

2⃣ برنامه ی MultiTTS رو باز کنید و روی منوی سه نقطه بزنید

3⃣ از گزینه import data فایل بکاپ رو انتخاب کنید

4⃣ اگه صدا ها رو نمی بینید یکبار برنامه رو ببندید و دوباره باز کنید
sherpa+3.zip
242 MB
بکاپ مدل‌های فارسی sherpa onnx برای مولتی تی تی اس
سامل سه صدای زیر :
🧕 haaniye
🙋‍♂ amir
👨‍💼 gyro

@ttsfarsi
This media is not supported in your browser
VIEW IN TELEGRAM
📣 آموزش اضافه کردن صدا به برنامه ی MultiTTS راه ۲ :

1⃣ مدل فارسی رو از اینجا دانلود کنید

https://github.com/k2-fsa/sherpa-onnx/releases/tag/tts-models

 
2⃣ از منوی همبرگری بخش Engines موتور sherpa رو اضافه کنید

3⃣ مدل دانلود شده رو از حالت فشرده استخراج کنید و در مسیر زیر بریزید :
Android/data/org.nobody.multitts/files/voice/sherpa


4⃣ روی + موتور sherpa بزنید و  اسپیکر جدید رو اضافه کنید :
code :   اسم پوشه ای که مدل رو استخراج کردید
locale : fa-IR


🔰 اگه صدا ها رو نمی بینید یکبار برنامه رو ببندید و دوباره باز کنید

@persian_tts
This media is not supported in your browser
VIEW IN TELEGRAM
📣 همه ی مدل های فارسی در یکجا :

🔰 یه برنامه ساختم تا همه ی مدل های vits فارسی رو امتحان کنید :

https://karim23657-persian-tts-sherpa.hf.space/


💠 قابلیت ها :
    تولید صدا با ۱۳ مدل فارسی
    ویرایش و ثبث تلفظ های اشتباه


🔰 پیشنهاداتتون رو بگید تا برنامه رو بهتر کنم

@persian_tts
This media is not supported in your browser
VIEW IN TELEGRAM
🎤‌مدل Zonos - یک مدل متن به گفتار پیشرفته!

با بیش از 200,000 ساعت داده گفتاری چندزبانه، Zonos گفتار با کیفیت بالا و بیان طبیعی تولید می‌کند.

پشتیبانی از زبان‌های مختلف، کنترل دقیق بر پارامترهای صوتی و اجرای سریع، این مدل را به ابزاری قدرتمند تبدیل کرده است!

🔰 فعلن از فارسی پشتیبانی نمی کنه ولی بنظر میاد در نسخه ۲ زبان های بیشتری اضافه بشن.
میتونید از این issue حمایت کنید تا انشاالله فارسی رو هم اضافه کنن.

برای اطلاعات بیشتر و نصب، به لینک زیر مراجعه کنید:

https://github.com/Zyphra/Zonos

🤗 : https://huggingface.co/spaces/Steveeeeeeen/Zonos

@persian_tts
📢 مدل SesameAI CSM-1B 📢

💠 شرکت Sesame یکی از طبیعترین مدلهای مکالمه صوتی رو عرضه کرده که میتونه مکالماتی روان و با احساس مثل یک انسان انجام بده که خیلی هارو در مصنوعی بودنش به شک میندازه.


🔰 ویژگی ها :
- تقلید صدا ( voice cloning)
- بیان احساسات در صدا
- ...

🌐 به دلیل آلودگی داده ها ممکنه بتونه به زبان های غیر انگلیسی حرف بزنه ( فارسی حرف نزد)

🧐 کد train کردن رو هنوز منتشر نکردن

💠 این مدل از دو ترنسفورمر استفاده می‌کند: یک مدل چندوجهی برای پردازش متن و صدا، و یک مدل کوچک‌تر برای بازسازی صدا با کیفیت بالا. این طراحی به مدل این توانایی را می‌دهد که لحن و بیان خود را بر اساس زمینه گفتگو تنظیم کند.

برای اطلاعات بیشتر و نصب، به لینک زیر مراجعه کنید:

https://github.com/SesameAILabs/csm


🤗 دانلود مدل : https://huggingface.co/sesame/csm-1b

🤗 امتحان کنید :
◀️https://huggingface.co/spaces/sesame/csm-1b

◀️ http://sesame.com/voicedemo

@persian_tts
🔈 معرفی مدل OuteTTS

این مدل با استفاده از معماری LLaMa و بدون نیاز به ماژول‌های پیچیده مثل vocoderها، متن رو به صوت طبیعی تبدیل می‌کنه.

ویژگی‌های کلیدی OuteTTS:
- سبک و سریع: نسخه 0.2 این مدل تنها 500M پارامتر داره و با استفاده از معماری GGUF می‌تونه روی سخت‌افزارهای سبک اجرا بشه.
- قابلیت اجرا روی دستگاه: با سازگاری با llama.cpp، امکان اجرای مدل به صورت real-time روی دستگاه فراهم شده.
- کلون کردن صدا: با استفاده از صدای مرجع، می‌تونید صدای دلخواهتون رو تولید کنید.
- چندزبانه: این مدل از زبان‌های مختلف مثل انگلیسی، چینی، فرانسوی و ژاپنی پشتیبانی می‌کنه و قابلیت افزودن زبان‌های جدید رو داره.
- کیفیت بالا: حتی در نسخه‌های کوچک‌تر مثل 350M، کیفیت صدا بسیار طبیعی و جذابه.

مزایا:
- کاهش منابع محاسباتی و هزینه‌ها.
- امکان استفاده در تولید محتوا مثل پادکست‌ها، دستیارهای صوتی



لینک‌ها برای شروع:
- مخزن گیت‌هاب
- 🤗 دمو در Hugging Face
- راهنمای فاین‌تیونینگ

اگر تجربه‌ای با این مدل داشتید یا سوالی دارید، حتما نظرتون رو با ما به اشتراک بذارید!

@persian_tts