خبرنامه هوش مصنوعی دومان

مایکروسافت مدل Phi2 را معرفی کرد.

با داغ شدن مسابقه مدل‌های بزرگ زبانی (LLM) شاهد معرفی مدل‌های کوچک زبانی (SLM) نیز هستیم. در حال حاضر LLMها از چند ده میلیارد، تا چند میلیارد و حتی چند تریلیون پارامتر دارند. هر چقدر تعداد پارامترهای یک مدل بیشتر باشد، پروسه آموزش آن زمان‌بر و هزینه‌بر شده و در نهایت خروجی آن نیز سایز زیادی خواهد داشت. اجرای مدل‌های بزرگ زبانی نیازمند منابع پردازشی زیاد است. از این‌رو، برای فراهم کردن قابلیت‌های مدل‌های زبانی برای پلتفرم‌های مختلف شاهد توسعه و معرفی مدل‌های کوچک زبانی یا SLMها هستیم. کاهش سایز مدل زبانی و در عین حال افزایش کیفیت آن از ترندهای موجود در حوزه هوش‌مصنوعی مولد است. مدل Phi یکی از این SLMها بوده که توسط مایکروسافت منتشر شده است. نسخه Phi2 که به تازگی منتشر شده در مقایسه با نمونه‌های مشابه نتایج درخور توجهی داشته است.

👈 برای جزئیات بیشتر درباره این مدل اینجا را بخوانید.

#phi
#microsoft

@dumannewsletter

596 views16:59

مدل Phi3 توسط مایکروسافت معرفی شد.

نسخه ۳ مجموعه مدل‌های زبانی Phi توسط مایکروسافت معرفی شد. این مدل‌ها در دسته مدل‌های زبانی کوچک یا SLM قرار گرفته و توانسته‌اند عملکرد قابل توجهی را از خود به نمایش بگذارند. نسخه ۳ با سه سایز مختلف به نام‌های mini با ۳.۸ میلیارد پارامتر، small با ۷ میلیارد پارامتر و medium با ۱۴ میلیارد پارامتر معرفی شده است ولی در حال حاضر تنها نسخه mini با دو سایز مختلف Context Window (۴و ۱۲۸ هزار توکن)در دسترس عموم قرار گرفته و قرار است به زودی سایر نسخه‌ها نیز منتشر شوند. نتایج مقایسه این مجموعه با مدل‌های مشابه نشان‌دهنده عملکرد مناسب آن است. قابل ذکر است که مدل‌های کوچک زبانی نسبت به مدل‌های بزرگ زبانی در بنچ‌مارک‌های factual knowledge نظیر TriviaQA عملکرد ضعیف‌تری دارند، زیرا این مدل‌ها ظرفیت کمتری برای نگهداری اطلاعات دارند.

👈 قبلاً نسخه ۲ را در اینجا معرفی کرده بودم.
👈 برای اطلاعات بیشتری درباره نسخه ۳ اینجا را بخوانید.
👈 برای دسترسی به مجموعه Phi صفحه مایکروسافت در HF را از اینجا مشاهده کنید.

#phi
#microsoft

@dumannewsletter

382 views08:22

خبرنامه هوش مصنوعی دومان

مدل Phi3 توسط مایکروسافت معرفی شد. نسخه ۳ مجموعه مدل‌های زبانی Phi توسط مایکروسافت معرفی شد. این مدل‌ها در دسته مدل‌های زبانی کوچک یا SLM قرار گرفته و توانسته‌اند عملکرد قابل توجهی را از خود به نمایش بگذارند. نسخه ۳ با سه سایز مختلف به نام‌های mini با ۳.۸…

مایکروسافت مدل Phi-3-vision را به مجموعه Phi-3 اضافه کرد. این مدل چند وجهی بوده و می‌تواند ورودی‌های متنی و تصویری را دریافت کند. این مدل یک مدل کوچک با سایز ۴.۲ میلیارد پارامتر است. برای تست آن در Azure اینجا را مشاهده کنید (توضیحات بیشتر).

#phi
#microsoft

@dumannewsletter

336 viewsedited 18:54

خبرنامه هوش مصنوعی دومان

انتشار مدل اپن‌سورس Phi-3.5-MoE توسط مایکروسافت

نسخه جدید مدل زبانی Phi توسط مایکروسافت به نام Phi-3.5-MoE منتشر شد. این نسخه دارای معماری MoE است (برای آشنایی با این معماری اینجا را بخوانید) و جز مدل‌های زبانی کوچک و یا به اختصار SLM است. هر prompt این مدل توانایی دریافت حدودا ۱۲۵ هزار لغت را دارد (سایز context window حدودا ۱۲۸ کیلو بایت است). این نسخه نسبت به مدل‌های مشابه Gemma 2 9B و Llama 3 8B عملکرد بهتری داشته است. Phi-3.5-MoE به صورت اپن‌سورس تحت لایسنس MIT در پلتفرم HuggingFace در دسترس عموم قرار گرفته است (اینجا را مشاهده کنید).

#moe
#phi
#microsoft

@dumannewsletter

338 views20:14

About

Blog

Apps

Platform