معرفی مدلهای اپنسورس Gemma توسط Google DeepMind
گوگل DeepMind مجموعهاز مدلهای سبک را با نام Gemma به صورت اپنسورس منتشر کرد. طبق گفته DeepMind این مدل با استفاده از تکنولوژی و نتایج تحقیقاتی جمینای (Gemini) توسعه داده شده است. در حال حاضر دو نسخه از این مدل زبانی کوچک (SLM) با سایزهای 2B و 7B منتشر شده است. هر سایز نیز در نسخههای Instruction Tuned (IT) و (PT) Pre Trained موجود است. طبق نتایج منتشر شده نسخه 7B در بنچمارکهای مختلف عملکرد بهتری از نسخههای 7B و 13B مدل Llama2 داشته است. مدلهای Gemma را میتوان در کامپیوتر شخصی به صورت لوکال اجرا کرده و مشکلی بابت منابع پردازشی نداشت.
👈 برای مطالعه ادامه مطلب اینجا را بخوانید.
#google
#deepmind
#gemma
@dumannewsletter
گوگل DeepMind مجموعهاز مدلهای سبک را با نام Gemma به صورت اپنسورس منتشر کرد. طبق گفته DeepMind این مدل با استفاده از تکنولوژی و نتایج تحقیقاتی جمینای (Gemini) توسعه داده شده است. در حال حاضر دو نسخه از این مدل زبانی کوچک (SLM) با سایزهای 2B و 7B منتشر شده است. هر سایز نیز در نسخههای Instruction Tuned (IT) و (PT) Pre Trained موجود است. طبق نتایج منتشر شده نسخه 7B در بنچمارکهای مختلف عملکرد بهتری از نسخههای 7B و 13B مدل Llama2 داشته است. مدلهای Gemma را میتوان در کامپیوتر شخصی به صورت لوکال اجرا کرده و مشکلی بابت منابع پردازشی نداشت.
👈 برای مطالعه ادامه مطلب اینجا را بخوانید.
#deepmind
#gemma
@dumannewsletter
گوگل نسخه جدیدی از مجموعه Gemma را با نام Gemma 2 2B معرفی کرد.
این نسخه ۲.۶ میلیارد پارامتر داشته و با بیش از دو تریلیون توکن آموزش داده شده است. با وجود سایز کوچک آن عملکرد مشابهی با مدلهای GPT-3.5 و Mixtral-8x7b دارد. این مدل به صورت اپنسورس از اینجا در دسترس عموم قرار گرفته است.
#google
#gemma
@dumannewsletter
این نسخه ۲.۶ میلیارد پارامتر داشته و با بیش از دو تریلیون توکن آموزش داده شده است. با وجود سایز کوچک آن عملکرد مشابهی با مدلهای GPT-3.5 و Mixtral-8x7b دارد. این مدل به صورت اپنسورس از اینجا در دسترس عموم قرار گرفته است.
#gemma
@dumannewsletter