اخبار هوش مصنوعی
2.83K subscribers
672 photos
354 videos
1.01K files
1.36K links
Download Telegram
مدل‌ زبانی بزرگ فاین تیوین شده برای زبان فارسی

این مقاله در مورد #LLM فارسی به نام #PersianLLaMA هستش. این مدل روی مجموعه ای از متن‌ها و دیتاست‌های فارسی آموزش داده شده و با دو نسخه با 7 و 13 میلیارد پارامتر ارائه شده است که بر روی متون رسمی و محاوره ای فارسی با دو رویکرد متفاوت آموزش داده شده.
PersianLLaMA: Towards Building First Persian Large Language Model

لینک‌ مقاله

@silicon_brain | از هوش مصنوعی عقب نمانید
کامبک گوگل به دنیای LLM

گوگل دیپ‌مایند (#deep_m8nd) مدل Gemma-2 با دو بیلیون پارامتر رو عرضه کرده. یکی از بزرگترین دستاوردهای این کار، عملکرد بهتر مدل در پلتفرم ارزیابی Chatbot Arena نسبت به مدل GPT-3.5 هست!

مدل GPT-3.5 بیش از 175 بیلیون پارامتر و Gemma-2 تنها با دو بیلیون پارامتر داره! تصویر هم مربوط به LMSYS Chatbot Arena هست که عملکرد مدل Gemma-2 رو نسبت به سایر مدل‌ها نشون میده.

علاوه بر Gemma-2 2B دو نسخه دیگه بنام GemmaShield و GemmaScope هم عرضه شده که اینها هم کاربردهای بسیار جالبی دارن.

شاید ندونید LMSYS Chatbot Arena چی هست؟
یک پلتفرم آنلاین و آزاد هست برای ارزیابی #LLM ها و VLM-هاست. ارزیابی‌های جالبی هم داره؛ مثلا، یک حالت Battle داره. شما یک سوال میپرسید و دو مدل A و B نامشخص بهش جواب میدن. شما جواب‌ها رو میخونید و بعد می‌تونید انتخاب کنید که کدوم جواب بهتر هست. بعد از اینکه جواب دادید، بهتون میگه این دو مدل که بهت جواب دادن اسمشون چی بوده.

وبلاگ Gemma-2

#gemma #lmsys #chatbot_arena
@silicon_brain | از هوش مصنوعی عقب نمانید
این مقاله الف تا یای مدل‌های زبانی رو توی خودش جا داده. از جمع آوری و آماده‌سازی داده گرفته تا آموزش مدل و فاین‌تیون کردن و دیپلوی کردن روی پروداکشن و بهبود پرفورمنس. پیشنهاد می‌کنم یه نگاه چشمی هم شده بهش بندازید.

🖇 لینک مقاله

#LLM
#Generative_AI
#paper

🆔 @lifeAsAService