PyTorch Howsam
3.01K subscribers
341 photos
48 videos
5 files
476 links
از هوش مصنوعی میگیم...

ارتباط با ادمین
@howsam_support
Download Telegram
گوگل مدل جدیدی بنام Gemma 3 270M معرفی کرده؛ همونطور که از اسمش مشخص هست، این مدل فقط 270 میلیون پارامتر داره و طبیعتا در دسته مدل‌های زبانی کوچک (SLM) قرار میگیره. این مدل‌ها خوراک دیوایس‌های کوچک مثل موبایل‌ها، بردهای امبدد و غیره هستن. این مدل به خاطر عملکرد خوب و مصرف انرژی بهینه مورد توجه قرار گرفته.

همونطور که در تصویر بالا آوردم، در تست IFEval عملکرد بهتری از مدل معروف و قدرتمند SmolLM2 هاگینگ‌فیس (یکی از بهترین‌ها در SLM) داشته.

همچنین، روی گوشی Pixel 9 Pro، نسخه کوانتایز شده (INT4) این مدل تنها ۰.۷۵٪ از باتری رو بعد از ۲۵ مکالمه مصرف کرد.

آقای راشکا هم مثل همیشه معماری مدل رو به تصویر کشیده و اون رو با یک مدل معروف دیگه مقایسه کرده. به Pre RMS Norm و Post RMS Norm دقت کنید.

این مدل در X ترند شده و یکسری از افراد دارن این مدل رو روی دیوایس‌های کوچک اجرا میکنن. مثلا فردی نسخه 8 بیتی این مدل رو روی iPad Air M3 با سرعت پردازش 200 توکن بر ثانیه اجرا کرده.

منم که عاشق SLM هستم! :) مطالعه مطالب زیر رو پیشنهاد می‌کنم:
- مدل MobileLLM: لینک 1 | لینک 2 | لینک 3
- مدل SmolLM: لینک
- دوره LLM هوسم: لینک
در پانزدهمین سال برگزاری، استک‌اورفلو بیش از ۴۹,۰۰۰ پاسخ از ۱۷۷ کشور دریافت کرد که شامل ۶۲ سؤال متمرکز بر ۳۱۴ فناوری مختلف بود.
این نظرسنجی سالانه با تمرکز ویژه بر ابزارهای هوش مصنوعی، مدل‌های زبانی بزرگ (LLM) و پلتفرم‌های اجتماعی، تصویری حیاتی از نیازهای جامعه جهانی توسعه‌دهندگان ارائه می‌دهد و بر ابزارها و فناوری‌هایی که استفاده می‌کنند یا تمایل به یادگیری آن‌ها دارند، متمرکز است.

https://survey.stackoverflow.co/2025?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=dev-survey-2025&utm_content=results-announcement-banner