ML & AI resources
169 subscribers
165 photos
13 videos
7 files
507 links
Explore AI & Deep Learning with us. Join our Telegram channel for the latest insights and tutorials, managed by CE students from Amirkabir University of Technology.

🆔 @ML_AI_resourses
Download Telegram
Forwarded from Tensorflow(@CVision)
بالاخره صدای زبان فارسی هم شنیده شد!😳

مدل Whisper رو خیلی‌ها می‌شناسن؛ یکی از قوی‌ترین مدل‌ها برای تبدیل صدا به متنه.
اما یه مشکلی که داشت این بود که وقتی نوبت زبان فارسی می‌شد، دقتش پایین میومد و خیلی از کلمات رو درست نمتونست بنویسه.

اما حالا یه نسخه جدید به اسم Whisper-large-fa-v1 منتشر کرده که میتونه زبان فارسی رو به متن تبدیل کنه.
یه فرقی که این نسخه داره اینکه این نسخه روی یه دیتاست تازه به اسم Persian-Voice-v1 دوباره آموزش داده شده. دیتاستی که لهجه‌های مختلف فارسی و اصطلاحات خاص فارسی رو شامل میشه.

نتیجه چیشده؟

تشخیص و رونویسی گفتار فارسی خیلی دقیق‌تر شده.
این یعنی توی کاربردهایی مثل:

زیرنویس‌گذاری خودکار
ساخت دستیارهای صوتی
ابزارهای NLP فارسی

و مهم از همه اینکه این همه‌چی متن‌باز منتشر شده؛ یعنی هر پژوهشگر یا تیمی می‌تونه راحت استفاده کنه، تغییر بده و پروژه‌های جدید بسازه.


لینک مدل: https://huggingface.co/vhdm/whisper-large-fa-v1

لینک دیتاست: https://huggingface.co/datasets/vhdm/persian-voice-v1

منبع: https://www.linkedin.com/feed/update/urn:li:activity:7364194597717073925/
2
Forwarded from DeepMind AI Expert (Farzad 🦅)
اندرو کارپثی گفته بود:
Can you take my 2h13m tokenizer video and translate [into] a book chapter.

We've done it! It includes prose, code & key images. It's a great way to learn this key piece of how LLMs work.
https://www.fast.ai/posts/2025-10-16-karpathy-tokenizers

https://solve.it
آنتروپیک یک شاخص برای مهارت کار با هوش مصنوعی تعریف کرده به اسم AI Fluency index؛ 24 تا مولفه داره که توی این مقاله تعدادی رو بررسی
کرده. برای مثال گفته وقتی Claude خروجی شیک و خوشگل تحویل میده، کاربر‌ها گول ظاهر رو می‌خورن و دیگه به استدلال و منطقش کمتر شک می‌کنن.

https://www.anthropic.com/research/AI-fluency-index
🔥1