خبرنامه هوش مصنوعی دومان

چت‌بات Grok اپن‌سورس می‌شود! ایلان ماسک در پلتفرم X اعلام کرد در هفته جاری چت‌بات Grok به صورت اپن‌سورس توسط xAI منتشر می‌شود. انتشار این خبر واکنش‌های مثبت زیادی را به همراه داشته است. در روزهای اخیر ایلان ماسک، OpenAI را به خاطر سیاست‌های بسته خود مورد…

ایلان ماسک به وعده خود عمل کرد و نسخه ۱ مدل Grok را به صورت اپن‌سورس در دسترس عموم قرار داد.
وزن مدل پایه Grok به همراه سورس کد اجرای آن تحت لایسنس Apache 2.0 منتشر شده است. این مدل دارای ۳۱۴ میلیارد پارامتر است! برای دسترسی به Grok به صفحه گیت‌هاب آن از اینجا مراجعه کنید. وزن‌های مدل را می‌توان از تورنت و یا HuggingFace دانلود کرد.

#grok
#xai

@dumannewsletter

GitHub

GitHub - xai-org/grok-1: Grok open release

Grok open release. Contribute to xai-org/grok-1 development by creating an account on GitHub.

341 views09:56

خبرنامه هوش مصنوعی دومان

اپل در حال مذاکره با گوگل و مایکروسافت برای استفاده از مدل‌های هوش‌مصنوعی این دو کمپانی درتلفن‌های همراه آیفون است. قرار است از این مدل‌ها برای قابلیت‌های هوش‌مصنوعی مولد نظیر تولید متن، ویرایش تصاویر و ویدئوها استفاده شود. هنوز جزئیات بیشتری از این مذاکرات منتشر نشده است. گوگل و مایکروسافت در ماه‌های اخیر در رقابت تنگاتنگی بوده‌اند، همکاری هر کدام از این دو کمپانی با اپل برگ برنده‌ای در این رقابت خواهد بود. قابل ذکر است که گوگل اخیراً به خاطر قرارداد انحصاری موتور جستجوی پیش‌فرض در آیفون مورد انتقاد قرار گرفته و یک پرونده قضایی به خاطر انحصار علیه آن در جریان است (منبع).

#apple
#google
#microsoft

@dumannewsletter

392 viewsedited 10:22

خبرنامه هوش مصنوعی دومان

شماره هفدهم خبرنامه هوش‌مصنوعی دومان منتشر شد.

هر روزتان نوروز
نوروزتان پیروز

برای مطالعه شماره هفدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پست‌الکترونیک خود هستید از اینجا ثبت‌نام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.

#خبرنامه

@dumannewsletter

534 views22:14

خبرنامه هوش مصنوعی دومان

3:13

This media is not supported in your browser

VIEW IN TELEGRAM

معرفی NVIDIA GROOT

مدل GROOT یک مدل بنیادی مخصوص آموزش ربات‌های انسان‌نما در محیط واقعی و شبیه‌سازی شده است. این مدل توسط جنسن هوآنگ مدیر عامل NVIDIA در کنفرانس GTC معرفی شد. همزمان با معرفی GROOT ربات‌های دیزنی (اینجا را بخوانید) روی صحنه حضور پیدا کرده و چاشنی طنز به ارائه جنسن هوآنگ اضافه کردند. GROOT خلاصه عبارت General Robotics 00 Technology بوده و یادآور یکی از شخصیت‌های کمیک دنیای مارول با همین نام است. GROOT دیتای چند وجهی (تکست، صوت و ویدئو) و تعاملات قبلی ربات را به عنوان ورودی دریافت کرده و رفتارهای بعدی ربات را براساس آن تولید می‌کنید (دیاگرام را مشاهده کنید).

#nvidia
#disney
#groot
#robitics

@dumannewsletter

356 views10:49

خبرنامه هوش مصنوعی دومان

3:43

Media is too big

VIEW IN TELEGRAM

در این ویدئو پیشرفت‌های NVIDIA در حوزه رباتیک معرفی شده است. NVIDIA در کنار GROOT دو سرویس OSMO و Isaac Lab را نیز معرفی کرد. OSMO پلتفرم Workflow Orchestration و Isaac Lab پلتفرم شبیه‌سازی یادگیری تقویتی و Transfer Learning برای انواع ربات است. همچنین NVIDIA چیپ مخصوص ربات‌های انسان‌نما را با نام Jetson Thor رونمایی کرد. این چیپ یک SoC (System On Chip) بوده و مخصوص اجرای مدل‌های هوش‌مصنوعی در ربات‌های انسان‌نما بهینه شده است.

#nvidia
#robitics

@dumannewsletter

383 viewsedited 14:01

خبرنامه هوش مصنوعی دومان

0:59

This media is not supported in your browser

VIEW IN TELEGRAM

دیدگاه Andrej Karpathy در مورد AGI

آندره کارپاسی (Andrej Karpathy) از متخصصان برجسته هوش‌مصنوعی در گفت‌وگوی اخیرش دیدگاه خود درباره رسیدن به AGI را مطرح کرد. براساس دیدگاه آندره، مسیر رسیدن به AGI از LLM OS می‌گذرد. ایده LLM OS را آندره اولین بار در توئیتر اعلام کرد (اینجا را بخوانید) که بسیار مورد توجه قرار گرفت. براساس این ایده، LLM به عنوان کرنل با سایر ماژول‌های جانبی در تعامل است (اینجا را بخوانید). برای مشاهده ویدئوی کامل اینجا را ببینید.
آندره کارپاسی از دانشگاه استنفورد در زمینه هوش‌مصنوعی مدرک دکتری گرفته و در سال‌های اخیر با تسلا و OpenAI همکاری داشته است.

#andrej_karpathy
#agi
#llm_os

@dumannewsletter

485 views17:02

خبرنامه هوش مصنوعی دومان

معرفی مدل زبانی DBRX

شرکت Databricks مدل زبانی جدیدی را با نام DBRX به صورت اپن‌سورس تحت مجوز Open License منتشر کرده است. طبق نتایج منتشر شده، DBRX عملکرد بهتری نسبت به مدل‌های GPT 3.5 و Gemini Pro 1.0 دارد. این مدل از معماری MoE استفاده کرده و تا ۲ برابر سرعت بیشتری در Inference نسبت به LLaMA2-70B دارد. سایز این مدل ۴۰ درصد مدل Grok 1 است. در این تصویر عملکرد DBRX در بنچ‌مارک‌های مختلف با سایر مدل‌های اپن‌سورس معروف مقایسه شده است. DBRX در دو نسخه Instruct و Base منتشر شده است.

👈 مطالعه جزئیات فنی بیشتر
👈 دسترسی به DBRX در گیت‌هاب
👈 دسترسی به DBRX در HF
👈 چت کردن با نسخه Instruct

#bdrx
#databricks

@dumannewsletter

341 viewsedited 19:34

خبرنامه هوش مصنوعی دومان

آشنایی با معماری MoE در مدل‌های هوش‌مصنوعی

در معماری Mixture of Experts یا به طور خلاصه MoE مدل از چندین شبکه عصبی به نام Expert و یک شبکه عصبی به نام Gating Network یا Router تشکیل می‌شود. هر شبکه Expert روی بخشی از دیتا آموزش داده می‌شود. شبکه Router تصمیم می‌گیرد که هر توکن ورودی را به کدام Expert داده و تاثیر هر Expert در خروجی چه میزان باشد. معماری MoE امکان افزایش سایز مدل یا دیتاست را با بودجه پردازشی ثابت فراهم می‌سازد.

👈 مطالعه بیشتر

#moe
#آموزشی

@dumannewsletter

305 views19:39

خبرنامه هوش مصنوعی دومان

انتشار نسخه 1.5 چت‌بات Grok توسط xAI

کمپانی xAI نسخه 1.5 چت‌بات Grok را معرفی کرد. قرار است این نسخه به‌زودی از طریق پلتفرم X در دسترس کاربران قرار بگیرد. طول ورودی (Context Window) در این نسخه به ۱۲۸هزار توکن (هر توکن را تقریبا یک لغت در نظر بگیرید) رسیده که ۱۶ برابر نسخه 1 است. در این جدول می‌توانید عملکرد نسخه 1.5 را نسبت به نسخه 1 و سایر رقبا در بنچ‌مارک‌های مختلف مشاهده کنید. همان‌طور که مشخص است قابلیت استدلال و حل مساله این نسخه نسبت به نسخه قبلی بهبود قابل توجهی داشته است. نسخه 1 این چت‌بات اخیرا به صورت اپن‌سورس در دسترس عموم قرار گرفت (منبع).
طبق گفته ایلان ماسک در X، نسخه 2 در حال توسعه است!

#xai
#grok

@dumannewsletter

315 views20:15

خبرنامه هوش مصنوعی دومان

2:20

This media is not supported in your browser

VIEW IN TELEGRAM

رقیب Devin با نام SWE agent معرفی شد

محققان آزمایشگاه NLP دانشگاه پرینستون رقیب ایجنت برنامه‌نویسی Devin را با نام SWE agent به صورت اپن‌سورس تحت لایسنس MIT منتشر کردند. این ایجنت برنامه‌نویسی دقت نزدیک به Devin در حل issueهای گیت‌هاب (بنچ‌مارک SWE) دارد و از GPT-4 به عنوان LLM استفاده می‌کند. معرفی Devin در هفته‌های گذشته توجه زیادی را به خود جلب کرده بود. این ایجنت‌ها با استفاده از مدل‌های بزرگ زبانی و دسترسی به Code Editor ،Shell و اینترنت می‌توانند باگ‌ها و خطاهای رخ داده در سورس کد را فیکس کنند.

👈 برای نصب این ایجنت و مشاهده سورس کد به اینجا مراجعه کنید.
👈 برای آشنایی با Devin اینجا را بخوانید.

#swe_agent
#devin

@dumannewsletter

376 views11:40

خبرنامه هوش مصنوعی دومان

همکاری امریکا و انگلیس در ایمنی هوش‌مصنوعی

دولت‌های آمریکا و انگلیس در یک تفاهم‌نامه جدید توافق کردند با همکاری یکدیگر و با اشتراک‌گذاری اطلاعات و منابع یک شیوه مشترک برای تست ایمنی هوش‌مصنوعی توسعه دهند. همچنین در این همکاری قرار است مدل‌های موجود هوش‌مصنوعی از نظر ایمنی مورد ارزیابی قرار بگیرند. تصویر مربوط به همایش ایمنی هوش‌مصنوعی سال گذشته در انگلیس است (منبع).

#uk
#us

@dumannewsletter

373 views11:49

خبرنامه هوش مصنوعی دومان

معرفی مربی فوتبال توسط گوگل DeepMind

گوگل DeepMind مدل جدیدی به نام TacticAI را برای پیش‌بینی نتیجه کرنر در بازی فوتبال معرفی کرد. این مدل با همکاری باشگاه لیورپول توسعه داده شده است. در این مدل هر بازیکن به منزله یک نود در گراف بوده که با استفاده از Graph Neural Network براساس موقعیت بازیکن‌های هر دو تیم نتیجه کرنر را پیش‌بینی می‌کند (منبع).

#tacticai
#google
#deepmind

@dumannewsletter

349 views13:38

About

Blog

Apps

Platform