خبرنامه هوش مصنوعی دومان
چتبات Grok اپنسورس میشود! ایلان ماسک در پلتفرم X اعلام کرد در هفته جاری چتبات Grok به صورت اپنسورس توسط xAI منتشر میشود. انتشار این خبر واکنشهای مثبت زیادی را به همراه داشته است. در روزهای اخیر ایلان ماسک، OpenAI را به خاطر سیاستهای بسته خود مورد…
ایلان ماسک به وعده خود عمل کرد و نسخه ۱ مدل Grok را به صورت اپنسورس در دسترس عموم قرار داد.
وزن مدل پایه Grok به همراه سورس کد اجرای آن تحت لایسنس Apache 2.0 منتشر شده است. این مدل دارای ۳۱۴ میلیارد پارامتر است! برای دسترسی به Grok به صفحه گیتهاب آن از اینجا مراجعه کنید. وزنهای مدل را میتوان از تورنت و یا HuggingFace دانلود کرد.
#grok
#xai
@dumannewsletter
وزن مدل پایه Grok به همراه سورس کد اجرای آن تحت لایسنس Apache 2.0 منتشر شده است. این مدل دارای ۳۱۴ میلیارد پارامتر است! برای دسترسی به Grok به صفحه گیتهاب آن از اینجا مراجعه کنید. وزنهای مدل را میتوان از تورنت و یا HuggingFace دانلود کرد.
#grok
#xai
@dumannewsletter
GitHub
GitHub - xai-org/grok-1: Grok open release
Grok open release. Contribute to xai-org/grok-1 development by creating an account on GitHub.
اپل در حال مذاکره با گوگل و مایکروسافت برای استفاده از مدلهای هوشمصنوعی این دو کمپانی درتلفنهای همراه آیفون است. قرار است از این مدلها برای قابلیتهای هوشمصنوعی مولد نظیر تولید متن، ویرایش تصاویر و ویدئوها استفاده شود. هنوز جزئیات بیشتری از این مذاکرات منتشر نشده است. گوگل و مایکروسافت در ماههای اخیر در رقابت تنگاتنگی بودهاند، همکاری هر کدام از این دو کمپانی با اپل برگ برندهای در این رقابت خواهد بود. قابل ذکر است که گوگل اخیراً به خاطر قرارداد انحصاری موتور جستجوی پیشفرض در آیفون مورد انتقاد قرار گرفته و یک پرونده قضایی به خاطر انحصار علیه آن در جریان است (منبع).
#apple
#google
#microsoft
@dumannewsletter
#apple
#microsoft
@dumannewsletter
شماره هفدهم خبرنامه هوشمصنوعی دومان منتشر شد.
هر روزتان نوروز
نوروزتان پیروز
برای مطالعه شماره هفدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پستالکترونیک خود هستید از اینجا ثبتنام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.
#خبرنامه
@dumannewsletter
هر روزتان نوروز
نوروزتان پیروز
برای مطالعه شماره هفدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پستالکترونیک خود هستید از اینجا ثبتنام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.
#خبرنامه
@dumannewsletter
معرفی NVIDIA GROOT
مدل GROOT یک مدل بنیادی مخصوص آموزش رباتهای انساننما در محیط واقعی و شبیهسازی شده است. این مدل توسط جنسن هوآنگ مدیر عامل NVIDIA در کنفرانس GTC معرفی شد. همزمان با معرفی GROOT رباتهای دیزنی (اینجا را بخوانید) روی صحنه حضور پیدا کرده و چاشنی طنز به ارائه جنسن هوآنگ اضافه کردند. GROOT خلاصه عبارت General Robotics 00 Technology بوده و یادآور یکی از شخصیتهای کمیک دنیای مارول با همین نام است. GROOT دیتای چند وجهی (تکست، صوت و ویدئو) و تعاملات قبلی ربات را به عنوان ورودی دریافت کرده و رفتارهای بعدی ربات را براساس آن تولید میکنید (دیاگرام را مشاهده کنید).
#nvidia
#disney
#groot
#robitics
@dumannewsletter
مدل GROOT یک مدل بنیادی مخصوص آموزش رباتهای انساننما در محیط واقعی و شبیهسازی شده است. این مدل توسط جنسن هوآنگ مدیر عامل NVIDIA در کنفرانس GTC معرفی شد. همزمان با معرفی GROOT رباتهای دیزنی (اینجا را بخوانید) روی صحنه حضور پیدا کرده و چاشنی طنز به ارائه جنسن هوآنگ اضافه کردند. GROOT خلاصه عبارت General Robotics 00 Technology بوده و یادآور یکی از شخصیتهای کمیک دنیای مارول با همین نام است. GROOT دیتای چند وجهی (تکست، صوت و ویدئو) و تعاملات قبلی ربات را به عنوان ورودی دریافت کرده و رفتارهای بعدی ربات را براساس آن تولید میکنید (دیاگرام را مشاهده کنید).
#nvidia
#disney
#groot
#robitics
@dumannewsletter
Media is too big
VIEW IN TELEGRAM
در این ویدئو پیشرفتهای NVIDIA در حوزه رباتیک معرفی شده است. NVIDIA در کنار GROOT دو سرویس OSMO و Isaac Lab را نیز معرفی کرد. OSMO پلتفرم Workflow Orchestration و Isaac Lab پلتفرم شبیهسازی یادگیری تقویتی و Transfer Learning برای انواع ربات است. همچنین NVIDIA چیپ مخصوص رباتهای انساننما را با نام Jetson Thor رونمایی کرد. این چیپ یک SoC (System On Chip) بوده و مخصوص اجرای مدلهای هوشمصنوعی در رباتهای انساننما بهینه شده است.
#nvidia
#robitics
@dumannewsletter
#nvidia
#robitics
@dumannewsletter
دیدگاه Andrej Karpathy در مورد AGI
آندره کارپاسی (Andrej Karpathy) از متخصصان برجسته هوشمصنوعی در گفتوگوی اخیرش دیدگاه خود درباره رسیدن به AGI را مطرح کرد. براساس دیدگاه آندره، مسیر رسیدن به AGI از LLM OS میگذرد. ایده LLM OS را آندره اولین بار در توئیتر اعلام کرد (اینجا را بخوانید) که بسیار مورد توجه قرار گرفت. براساس این ایده، LLM به عنوان کرنل با سایر ماژولهای جانبی در تعامل است (اینجا را بخوانید). برای مشاهده ویدئوی کامل اینجا را ببینید.
آندره کارپاسی از دانشگاه استنفورد در زمینه هوشمصنوعی مدرک دکتری گرفته و در سالهای اخیر با تسلا و OpenAI همکاری داشته است.
#andrej_karpathy
#agi
#llm_os
@dumannewsletter
آندره کارپاسی (Andrej Karpathy) از متخصصان برجسته هوشمصنوعی در گفتوگوی اخیرش دیدگاه خود درباره رسیدن به AGI را مطرح کرد. براساس دیدگاه آندره، مسیر رسیدن به AGI از LLM OS میگذرد. ایده LLM OS را آندره اولین بار در توئیتر اعلام کرد (اینجا را بخوانید) که بسیار مورد توجه قرار گرفت. براساس این ایده، LLM به عنوان کرنل با سایر ماژولهای جانبی در تعامل است (اینجا را بخوانید). برای مشاهده ویدئوی کامل اینجا را ببینید.
آندره کارپاسی از دانشگاه استنفورد در زمینه هوشمصنوعی مدرک دکتری گرفته و در سالهای اخیر با تسلا و OpenAI همکاری داشته است.
#andrej_karpathy
#agi
#llm_os
@dumannewsletter
معرفی مدل زبانی DBRX
شرکت Databricks مدل زبانی جدیدی را با نام DBRX به صورت اپنسورس تحت مجوز Open License منتشر کرده است. طبق نتایج منتشر شده، DBRX عملکرد بهتری نسبت به مدلهای GPT 3.5 و Gemini Pro 1.0 دارد. این مدل از معماری MoE استفاده کرده و تا ۲ برابر سرعت بیشتری در Inference نسبت به LLaMA2-70B دارد. سایز این مدل ۴۰ درصد مدل Grok 1 است. در این تصویر عملکرد DBRX در بنچمارکهای مختلف با سایر مدلهای اپنسورس معروف مقایسه شده است. DBRX در دو نسخه Instruct و Base منتشر شده است.
👈 مطالعه جزئیات فنی بیشتر
👈 دسترسی به DBRX در گیتهاب
👈 دسترسی به DBRX در HF
👈 چت کردن با نسخه Instruct
#bdrx
#databricks
@dumannewsletter
شرکت Databricks مدل زبانی جدیدی را با نام DBRX به صورت اپنسورس تحت مجوز Open License منتشر کرده است. طبق نتایج منتشر شده، DBRX عملکرد بهتری نسبت به مدلهای GPT 3.5 و Gemini Pro 1.0 دارد. این مدل از معماری MoE استفاده کرده و تا ۲ برابر سرعت بیشتری در Inference نسبت به LLaMA2-70B دارد. سایز این مدل ۴۰ درصد مدل Grok 1 است. در این تصویر عملکرد DBRX در بنچمارکهای مختلف با سایر مدلهای اپنسورس معروف مقایسه شده است. DBRX در دو نسخه Instruct و Base منتشر شده است.
👈 مطالعه جزئیات فنی بیشتر
👈 دسترسی به DBRX در گیتهاب
👈 دسترسی به DBRX در HF
👈 چت کردن با نسخه Instruct
#bdrx
#databricks
@dumannewsletter
آشنایی با معماری MoE در مدلهای هوشمصنوعی
در معماری Mixture of Experts یا به طور خلاصه MoE مدل از چندین شبکه عصبی به نام Expert و یک شبکه عصبی به نام Gating Network یا Router تشکیل میشود. هر شبکه Expert روی بخشی از دیتا آموزش داده میشود. شبکه Router تصمیم میگیرد که هر توکن ورودی را به کدام Expert داده و تاثیر هر Expert در خروجی چه میزان باشد. معماری MoE امکان افزایش سایز مدل یا دیتاست را با بودجه پردازشی ثابت فراهم میسازد.
👈 مطالعه بیشتر
#moe
#آموزشی
@dumannewsletter
در معماری Mixture of Experts یا به طور خلاصه MoE مدل از چندین شبکه عصبی به نام Expert و یک شبکه عصبی به نام Gating Network یا Router تشکیل میشود. هر شبکه Expert روی بخشی از دیتا آموزش داده میشود. شبکه Router تصمیم میگیرد که هر توکن ورودی را به کدام Expert داده و تاثیر هر Expert در خروجی چه میزان باشد. معماری MoE امکان افزایش سایز مدل یا دیتاست را با بودجه پردازشی ثابت فراهم میسازد.
👈 مطالعه بیشتر
#moe
#آموزشی
@dumannewsletter
انتشار نسخه 1.5 چتبات Grok توسط xAI
کمپانی xAI نسخه 1.5 چتبات Grok را معرفی کرد. قرار است این نسخه بهزودی از طریق پلتفرم X در دسترس کاربران قرار بگیرد. طول ورودی (Context Window) در این نسخه به ۱۲۸هزار توکن (هر توکن را تقریبا یک لغت در نظر بگیرید) رسیده که ۱۶ برابر نسخه 1 است. در این جدول میتوانید عملکرد نسخه 1.5 را نسبت به نسخه 1 و سایر رقبا در بنچمارکهای مختلف مشاهده کنید. همانطور که مشخص است قابلیت استدلال و حل مساله این نسخه نسبت به نسخه قبلی بهبود قابل توجهی داشته است. نسخه 1 این چتبات اخیرا به صورت اپنسورس در دسترس عموم قرار گرفت (منبع).
طبق گفته ایلان ماسک در X، نسخه 2 در حال توسعه است!
#xai
#grok
@dumannewsletter
کمپانی xAI نسخه 1.5 چتبات Grok را معرفی کرد. قرار است این نسخه بهزودی از طریق پلتفرم X در دسترس کاربران قرار بگیرد. طول ورودی (Context Window) در این نسخه به ۱۲۸هزار توکن (هر توکن را تقریبا یک لغت در نظر بگیرید) رسیده که ۱۶ برابر نسخه 1 است. در این جدول میتوانید عملکرد نسخه 1.5 را نسبت به نسخه 1 و سایر رقبا در بنچمارکهای مختلف مشاهده کنید. همانطور که مشخص است قابلیت استدلال و حل مساله این نسخه نسبت به نسخه قبلی بهبود قابل توجهی داشته است. نسخه 1 این چتبات اخیرا به صورت اپنسورس در دسترس عموم قرار گرفت (منبع).
طبق گفته ایلان ماسک در X، نسخه 2 در حال توسعه است!
#xai
#grok
@dumannewsletter
رقیب Devin با نام SWE agent معرفی شد
محققان آزمایشگاه NLP دانشگاه پرینستون رقیب ایجنت برنامهنویسی Devin را با نام SWE agent به صورت اپنسورس تحت لایسنس MIT منتشر کردند. این ایجنت برنامهنویسی دقت نزدیک به Devin در حل issueهای گیتهاب (بنچمارک SWE) دارد و از GPT-4 به عنوان LLM استفاده میکند. معرفی Devin در هفتههای گذشته توجه زیادی را به خود جلب کرده بود. این ایجنتها با استفاده از مدلهای بزرگ زبانی و دسترسی به Code Editor ،Shell و اینترنت میتوانند باگها و خطاهای رخ داده در سورس کد را فیکس کنند.
👈 برای نصب این ایجنت و مشاهده سورس کد به اینجا مراجعه کنید.
👈 برای آشنایی با Devin اینجا را بخوانید.
#swe_agent
#devin
@dumannewsletter
محققان آزمایشگاه NLP دانشگاه پرینستون رقیب ایجنت برنامهنویسی Devin را با نام SWE agent به صورت اپنسورس تحت لایسنس MIT منتشر کردند. این ایجنت برنامهنویسی دقت نزدیک به Devin در حل issueهای گیتهاب (بنچمارک SWE) دارد و از GPT-4 به عنوان LLM استفاده میکند. معرفی Devin در هفتههای گذشته توجه زیادی را به خود جلب کرده بود. این ایجنتها با استفاده از مدلهای بزرگ زبانی و دسترسی به Code Editor ،Shell و اینترنت میتوانند باگها و خطاهای رخ داده در سورس کد را فیکس کنند.
👈 برای نصب این ایجنت و مشاهده سورس کد به اینجا مراجعه کنید.
👈 برای آشنایی با Devin اینجا را بخوانید.
#swe_agent
#devin
@dumannewsletter
همکاری امریکا و انگلیس در ایمنی هوشمصنوعی
دولتهای آمریکا و انگلیس در یک تفاهمنامه جدید توافق کردند با همکاری یکدیگر و با اشتراکگذاری اطلاعات و منابع یک شیوه مشترک برای تست ایمنی هوشمصنوعی توسعه دهند. همچنین در این همکاری قرار است مدلهای موجود هوشمصنوعی از نظر ایمنی مورد ارزیابی قرار بگیرند. تصویر مربوط به همایش ایمنی هوشمصنوعی سال گذشته در انگلیس است (منبع).
#uk
#us
@dumannewsletter
دولتهای آمریکا و انگلیس در یک تفاهمنامه جدید توافق کردند با همکاری یکدیگر و با اشتراکگذاری اطلاعات و منابع یک شیوه مشترک برای تست ایمنی هوشمصنوعی توسعه دهند. همچنین در این همکاری قرار است مدلهای موجود هوشمصنوعی از نظر ایمنی مورد ارزیابی قرار بگیرند. تصویر مربوط به همایش ایمنی هوشمصنوعی سال گذشته در انگلیس است (منبع).
#uk
#us
@dumannewsletter
معرفی مربی فوتبال توسط گوگل DeepMind
گوگل DeepMind مدل جدیدی به نام TacticAI را برای پیشبینی نتیجه کرنر در بازی فوتبال معرفی کرد. این مدل با همکاری باشگاه لیورپول توسعه داده شده است. در این مدل هر بازیکن به منزله یک نود در گراف بوده که با استفاده از Graph Neural Network براساس موقعیت بازیکنهای هر دو تیم نتیجه کرنر را پیشبینی میکند (منبع).
#tacticai
#google
#deepmind
@dumannewsletter
گوگل DeepMind مدل جدیدی به نام TacticAI را برای پیشبینی نتیجه کرنر در بازی فوتبال معرفی کرد. این مدل با همکاری باشگاه لیورپول توسعه داده شده است. در این مدل هر بازیکن به منزله یک نود در گراف بوده که با استفاده از Graph Neural Network براساس موقعیت بازیکنهای هر دو تیم نتیجه کرنر را پیشبینی میکند (منبع).
#tacticai
#deepmind
@dumannewsletter