#همفکری
🔰یکی از مشکلاتی که تعدادی گزارش کردن این بود که ما متن میدیم ولی فقط نویز خروجی میگیریم؟!
🧐 بعد از بررسی و پیشنهاد یکی از دوستان فهمیدیم اگه آخر جمله نقطه داشته باشه مدل نویز تولید میکنه
🌐 اگه راهکاری برای حل این مشکل پیدا کردید زیر این پیام بگین
🔰یکی از مشکلاتی که تعدادی گزارش کردن این بود که ما متن میدیم ولی فقط نویز خروجی میگیریم؟!
🧐 بعد از بررسی و پیشنهاد یکی از دوستان فهمیدیم اگه آخر جمله نقطه داشته باشه مدل نویز تولید میکنه
🌐 اگه راهکاری برای حل این مشکل پیدا کردید زیر این پیام بگین
متن به گفتار فارسی pinned «سلام دوستان توی نظرات میتونید سوالاتتون رو بپرسید https://github.com/karim23657/Persian-tts-coqui»
📱🔈اجرای مدل های vits در اندروید!
با برنامه MultiTTS میتونید مدل های vits رو به عنوان موتور متن به گفتار روی گوشی تون اجرا کنید.🤩
فایلشو توی پیام بعدی میزارم ◀️
👌 اگه برنامه ی جالبی پیدا کردید اینجا بگید👇
#معرفی_ابزار #اندروید
با برنامه MultiTTS میتونید مدل های vits رو به عنوان موتور متن به گفتار روی گوشی تون اجرا کنید.🤩
فایلشو توی پیام بعدی میزارم ◀️
👌 اگه برنامه ی جالبی پیدا کردید اینجا بگید👇
#معرفی_ابزار #اندروید
MultiTTS_1.7.5(76)-armeabi-v7a-release.apk
98.6 MB
دوستان این برنامه خیلی قابلیت داره که میتونید اونا رو توی کانالش ببینید
https://t.me/MultiTTS_channel
⁉️ سوالاتونو اینجا بپرسید👇
https://t.me/MultiTTS_channel
⁉️ سوالاتونو اینجا بپرسید👇
🗣️ اجرای مدل های vits در اندروید و ویندوز !
🔗 از اینجا میتونید آخرین نسخه برنامه رو برای سیستمتون دانلود کنید : https://github.com/k2-fsa/sherpa-onnx
👌 اگه برنامه ی جالبی پیدا کردید اینجا بگید👇
فایل نصبی اندروید در پیام بعدی◀️
#معرفی_ابزار #اندروید #ویندوز
🔗 از اینجا میتونید آخرین نسخه برنامه رو برای سیستمتون دانلود کنید : https://github.com/k2-fsa/sherpa-onnx
👌 اگه برنامه ی جالبی پیدا کردید اینجا بگید👇
فایل نصبی اندروید در پیام بعدی◀️
#معرفی_ابزار #اندروید #ویندوز
sherpa_onnx_1_10_37_x86_fa_tts_engine_vits_piper_fa_en_rezahedayatfar.apk
79.9 MB
🔈 مدل فارسی انگلیسی با صدای rezahedayatfar-ibrahimwalk برای پردازنده های مختلف
🔰 کانال توسعه دهنده : @ttsfarsi
🌐 ساخته شده با کتابخانه :
https://github.com/k2-fsa/sherpa-onnx
🗂️ Dataset
* URL: https://huggingface.co/datasets/mah92/Hedayatfar-Persian-Quran-Audio-Dataset
* URL2: https://huggingface.co/datasets/mah92/Ibrahim-Walk-English-Quran-Audio-Dataset
🔰 Finetuned from U.S. English lessac voice (medium quality).
🔰 کانال توسعه دهنده : @ttsfarsi
🌐 ساخته شده با کتابخانه :
https://github.com/k2-fsa/sherpa-onnx
🗂️ Dataset
* URL: https://huggingface.co/datasets/mah92/Hedayatfar-Persian-Quran-Audio-Dataset
* URL2: https://huggingface.co/datasets/mah92/Ibrahim-Walk-English-Quran-Audio-Dataset
🔰 Finetuned from U.S. English lessac voice (medium quality).
📢 راهکاری برای ساخت دیتاست
اگر به دنبال ساخت دیتاستهای تبدیل متن به گفتار (TTS) با کیفیت هستید، میتونید از نوت بوک گوگل ManaTTS استفاده کنید.
پایپلاین ManaTTS با ارائه مراحل شفاف و قابل تنظیم، از مراحل جمعآوری دادهها تا تقطیع صدا و همترازی اجباری، به شما کمک میکند تا دادگان گفتاری خود را بسازید. برای مشاهده و استفاده از این ابزار ، به مخزن مراجعه کنید . 🛠️
https://github.com/MahtaFetrat/ManaTTS-Persian-Speech-Dataset#processing-pipeline
اگر به دنبال ساخت دیتاستهای تبدیل متن به گفتار (TTS) با کیفیت هستید، میتونید از نوت بوک گوگل ManaTTS استفاده کنید.
پایپلاین ManaTTS با ارائه مراحل شفاف و قابل تنظیم، از مراحل جمعآوری دادهها تا تقطیع صدا و همترازی اجباری، به شما کمک میکند تا دادگان گفتاری خود را بسازید. برای مشاهده و استفاده از این ابزار ، به مخزن مراجعه کنید . 🛠️
https://github.com/MahtaFetrat/ManaTTS-Persian-Speech-Dataset#processing-pipeline
sherpa+3.zip
242 MB
بکاپ مدلهای فارسی sherpa onnx برای مولتی تی تی اس
سامل سه صدای زیر :
🧕 haaniye
🙋♂ amir
👨💼 gyro
@ttsfarsi
سامل سه صدای زیر :
🧕 haaniye
🙋♂ amir
👨💼 gyro
@ttsfarsi
vocalizer compact, Persian (Iran).zip
9.5 MB
بکاپ صدای داریوش vocalizer
@MultiTTSIndia
@MultiTTSIndia
متن به گفتار فارسی
🗣️ اجرای مدل های vits در اندروید و ویندوز ! 🔗 از اینجا میتونید آخرین نسخه برنامه رو برای سیستمتون دانلود کنید : https://github.com/k2-fsa/sherpa-onnx 👌 اگه برنامه ی جالبی پیدا کردید اینجا بگید👇 فایل نصبی اندروید در پیام بعدی◀️ #معرفی_ابزار #اندروید #ویندوز
💻🗣 اجرای مدل ها onnx در ویندوز :
⬇️مدل های فارسی رو از اینجا دانلود کنید
https://github.com/k2-fsa/sherpa-onnx/releases/tag/tts-models
🔰فایل exe بیلد شده رو هم از اینجا بگیرید:
https://github.com/k2-fsa/sherpa-onnx/releases
💠یا اینکه برای هر صدا فایل exe جدا دانلود کنید :
https://k2-fsa.github.io/sherpa/onnx/flutter/tts-win.html
🔰 البته میتونید کتابخانه پایتونش رو هم نصب کنید.
حالا اجرا کنید🔈
@persian_tts
⬇️مدل های فارسی رو از اینجا دانلود کنید
https://github.com/k2-fsa/sherpa-onnx/releases/tag/tts-models
🔰فایل exe بیلد شده رو هم از اینجا بگیرید:
https://github.com/k2-fsa/sherpa-onnx/releases
💠یا اینکه برای هر صدا فایل exe جدا دانلود کنید :
https://k2-fsa.github.io/sherpa/onnx/flutter/tts-win.html
🔰 البته میتونید کتابخانه پایتونش رو هم نصب کنید.
حالا اجرا کنید🔈
@persian_tts
This media is not supported in your browser
VIEW IN TELEGRAM
📣 آموزش اضافه کردن صدا به برنامه ی MultiTTS راه ۲ :
1⃣ مدل فارسی رو از اینجا دانلود کنید
https://github.com/k2-fsa/sherpa-onnx/releases/tag/tts-models
2⃣ از منوی همبرگری بخش Engines موتور sherpa رو اضافه کنید
3⃣ مدل دانلود شده رو از حالت فشرده استخراج کنید و در مسیر زیر بریزید :
Android/data/org.nobody.multitts/files/voice/sherpa
4⃣ روی + موتور sherpa بزنید و اسپیکر جدید رو اضافه کنید :
code : اسم پوشه ای که مدل رو استخراج کردید
locale :
🔰 اگه صدا ها رو نمی بینید یکبار برنامه رو ببندید و دوباره باز کنید
@persian_tts
1⃣ مدل فارسی رو از اینجا دانلود کنید
https://github.com/k2-fsa/sherpa-onnx/releases/tag/tts-models
2⃣ از منوی همبرگری بخش Engines موتور sherpa رو اضافه کنید
3⃣ مدل دانلود شده رو از حالت فشرده استخراج کنید و در مسیر زیر بریزید :
Android/data/org.nobody.multitts/files/voice/sherpa
4⃣ روی + موتور sherpa بزنید و اسپیکر جدید رو اضافه کنید :
code : اسم پوشه ای که مدل رو استخراج کردید
locale :
fa-IR
🔰 اگه صدا ها رو نمی بینید یکبار برنامه رو ببندید و دوباره باز کنید
@persian_tts
This media is not supported in your browser
VIEW IN TELEGRAM
📣 همه ی مدل های فارسی در یکجا :
🔰 یه برنامه ساختم تا همه ی مدل های vits فارسی رو امتحان کنید :
https://karim23657-persian-tts-sherpa.hf.space/
💠 قابلیت ها :
✅ تولید صدا با ۱۳ مدل فارسی
✅ ویرایش و ثبث تلفظ های اشتباه
🔰 پیشنهاداتتون رو بگید تا برنامه رو بهتر کنم
@persian_tts
🔰 یه برنامه ساختم تا همه ی مدل های vits فارسی رو امتحان کنید :
https://karim23657-persian-tts-sherpa.hf.space/
💠 قابلیت ها :
✅ تولید صدا با ۱۳ مدل فارسی
✅ ویرایش و ثبث تلفظ های اشتباه
🔰 پیشنهاداتتون رو بگید تا برنامه رو بهتر کنم
@persian_tts
This media is not supported in your browser
VIEW IN TELEGRAM
🎤✨مدل Zonos - یک مدل متن به گفتار پیشرفته!
با بیش از 200,000 ساعت داده گفتاری چندزبانه، Zonos گفتار با کیفیت بالا و بیان طبیعی تولید میکند.
پشتیبانی از زبانهای مختلف، کنترل دقیق بر پارامترهای صوتی و اجرای سریع، این مدل را به ابزاری قدرتمند تبدیل کرده است!
🔰 فعلن از فارسی پشتیبانی نمی کنه ولی بنظر میاد در نسخه ۲ زبان های بیشتری اضافه بشن.
میتونید از این issue حمایت کنید تا انشاالله فارسی رو هم اضافه کنن.
برای اطلاعات بیشتر و نصب، به لینک زیر مراجعه کنید:
https://github.com/Zyphra/Zonos
🤗 : https://huggingface.co/spaces/Steveeeeeeen/Zonos
@persian_tts
با بیش از 200,000 ساعت داده گفتاری چندزبانه، Zonos گفتار با کیفیت بالا و بیان طبیعی تولید میکند.
پشتیبانی از زبانهای مختلف، کنترل دقیق بر پارامترهای صوتی و اجرای سریع، این مدل را به ابزاری قدرتمند تبدیل کرده است!
🔰 فعلن از فارسی پشتیبانی نمی کنه ولی بنظر میاد در نسخه ۲ زبان های بیشتری اضافه بشن.
میتونید از این issue حمایت کنید تا انشاالله فارسی رو هم اضافه کنن.
برای اطلاعات بیشتر و نصب، به لینک زیر مراجعه کنید:
https://github.com/Zyphra/Zonos
🤗 : https://huggingface.co/spaces/Steveeeeeeen/Zonos
@persian_tts
📢 مدل SesameAI CSM-1B 📢
💠 شرکت Sesame یکی از طبیعترین مدلهای مکالمه صوتی رو عرضه کرده که میتونه مکالماتی روان و با احساس مثل یک انسان انجام بده که خیلی هارو در مصنوعی بودنش به شک میندازه.
🔰 ویژگی ها :
- تقلید صدا ( voice cloning)
- بیان احساسات در صدا
- ...
🌐 به دلیل آلودگی داده ها ممکنه بتونه به زبان های غیر انگلیسی حرف بزنه ( فارسی حرف نزد)
🧐 کد train کردن رو هنوز منتشر نکردن
💠 این مدل از دو ترنسفورمر استفاده میکند: یک مدل چندوجهی برای پردازش متن و صدا، و یک مدل کوچکتر برای بازسازی صدا با کیفیت بالا. این طراحی به مدل این توانایی را میدهد که لحن و بیان خود را بر اساس زمینه گفتگو تنظیم کند.
برای اطلاعات بیشتر و نصب، به لینک زیر مراجعه کنید:
https://github.com/SesameAILabs/csm
🤗 دانلود مدل : https://huggingface.co/sesame/csm-1b
🤗 امتحان کنید :
◀️https://huggingface.co/spaces/sesame/csm-1b
◀️ http://sesame.com/voicedemo
@persian_tts
💠 شرکت Sesame یکی از طبیعترین مدلهای مکالمه صوتی رو عرضه کرده که میتونه مکالماتی روان و با احساس مثل یک انسان انجام بده که خیلی هارو در مصنوعی بودنش به شک میندازه.
🔰 ویژگی ها :
- تقلید صدا ( voice cloning)
- بیان احساسات در صدا
- ...
🌐 به دلیل آلودگی داده ها ممکنه بتونه به زبان های غیر انگلیسی حرف بزنه ( فارسی حرف نزد)
🧐 کد train کردن رو هنوز منتشر نکردن
💠 این مدل از دو ترنسفورمر استفاده میکند: یک مدل چندوجهی برای پردازش متن و صدا، و یک مدل کوچکتر برای بازسازی صدا با کیفیت بالا. این طراحی به مدل این توانایی را میدهد که لحن و بیان خود را بر اساس زمینه گفتگو تنظیم کند.
برای اطلاعات بیشتر و نصب، به لینک زیر مراجعه کنید:
https://github.com/SesameAILabs/csm
🤗 دانلود مدل : https://huggingface.co/sesame/csm-1b
🤗 امتحان کنید :
◀️https://huggingface.co/spaces/sesame/csm-1b
◀️ http://sesame.com/voicedemo
@persian_tts
🔈 معرفی مدل OuteTTS
این مدل با استفاده از معماری LLaMa و بدون نیاز به ماژولهای پیچیده مثل vocoderها، متن رو به صوت طبیعی تبدیل میکنه.
ویژگیهای کلیدی OuteTTS:
- سبک و سریع: نسخه 0.2 این مدل تنها 500M پارامتر داره و با استفاده از معماری GGUF میتونه روی سختافزارهای سبک اجرا بشه.
- قابلیت اجرا روی دستگاه: با سازگاری با llama.cpp، امکان اجرای مدل به صورت real-time روی دستگاه فراهم شده.
- کلون کردن صدا: با استفاده از صدای مرجع، میتونید صدای دلخواهتون رو تولید کنید.
- چندزبانه: این مدل از زبانهای مختلف مثل انگلیسی، چینی، فرانسوی و ژاپنی پشتیبانی میکنه و قابلیت افزودن زبانهای جدید رو داره.
- کیفیت بالا: حتی در نسخههای کوچکتر مثل 350M، کیفیت صدا بسیار طبیعی و جذابه.
مزایا:
- کاهش منابع محاسباتی و هزینهها.
- امکان استفاده در تولید محتوا مثل پادکستها، دستیارهای صوتی
لینکها برای شروع:
- مخزن گیتهاب
- 🤗 دمو در Hugging Face
- راهنمای فاینتیونینگ
اگر تجربهای با این مدل داشتید یا سوالی دارید، حتما نظرتون رو با ما به اشتراک بذارید!
@persian_tts
این مدل با استفاده از معماری LLaMa و بدون نیاز به ماژولهای پیچیده مثل vocoderها، متن رو به صوت طبیعی تبدیل میکنه.
ویژگیهای کلیدی OuteTTS:
- سبک و سریع: نسخه 0.2 این مدل تنها 500M پارامتر داره و با استفاده از معماری GGUF میتونه روی سختافزارهای سبک اجرا بشه.
- قابلیت اجرا روی دستگاه: با سازگاری با llama.cpp، امکان اجرای مدل به صورت real-time روی دستگاه فراهم شده.
- کلون کردن صدا: با استفاده از صدای مرجع، میتونید صدای دلخواهتون رو تولید کنید.
- چندزبانه: این مدل از زبانهای مختلف مثل انگلیسی، چینی، فرانسوی و ژاپنی پشتیبانی میکنه و قابلیت افزودن زبانهای جدید رو داره.
- کیفیت بالا: حتی در نسخههای کوچکتر مثل 350M، کیفیت صدا بسیار طبیعی و جذابه.
مزایا:
- کاهش منابع محاسباتی و هزینهها.
- امکان استفاده در تولید محتوا مثل پادکستها، دستیارهای صوتی
لینکها برای شروع:
- مخزن گیتهاب
- 🤗 دمو در Hugging Face
- راهنمای فاینتیونینگ
اگر تجربهای با این مدل داشتید یا سوالی دارید، حتما نظرتون رو با ما به اشتراک بذارید!
@persian_tts