خبرنامه هوش مصنوعی دومان

معرفی مدل‌های اپن‌سورس Gemma توسط Google DeepMind

گوگل DeepMind مجموعه‌از مدل‌های سبک را با نام Gemma به صورت اپن‌سورس منتشر کرد. طبق گفته DeepMind این مدل با استفاده از تکنولوژی و نتایج تحقیقاتی جمینای (Gemini) توسعه داده شده است. در حال حاضر دو نسخه از این مدل زبانی کوچک (SLM) با سایزهای 2B و 7B منتشر شده است. هر سایز نیز در نسخه‌های Instruction Tuned (IT) و (PT) Pre Trained موجود است. طبق نتایج منتشر شده نسخه 7B در بنچ‌مارک‌های مختلف عملکرد بهتری از نسخه‌های 7B و 13B مدل Llama2 داشته است. مدل‌های Gemma را می‌توان در کامپیوتر شخصی به صورت لوکال اجرا کرده و مشکلی بابت منابع پردازشی نداشت.

👈 برای مطالعه ادامه مطلب اینجا را بخوانید.

#google
#deepmind
#gemma

@dumannewsletter

365 views13:53

گوگل نسخه جدیدی از مجموعه Gemma را با نام Gemma 2 2B معرفی کرد.

این نسخه ۲.۶ میلیارد پارامتر داشته و با بیش از دو تریلیون توکن آموزش داده شده است. با وجود سایز کوچک آن عملکرد مشابهی با مدل‌های GPT-3.5 و Mixtral-8x7b دارد. این مدل به صورت اپن‌سورس از اینجا در دسترس عموم قرار گرفته است.

#google
#gemma

@dumannewsletter

495 views21:53

About

Blog

Apps

Platform