خبرنامه هوش مصنوعی دومان

اریک اشمیت مدیرعامل سابق گوگل: زمانی که ایجنت‌های هوش‌مصنوعی با زبان جدیدی که ما درک نمی‌کنیم ارتباط برقرار کنند، باید کامپیوترها را از برق بکشیم!

👈 مشاهده ویدئو کامل

#eric_schmidt

@dumannewsletter

429 views18:37

مدل Phi3 توسط مایکروسافت معرفی شد.

نسخه ۳ مجموعه مدل‌های زبانی Phi توسط مایکروسافت معرفی شد. این مدل‌ها در دسته مدل‌های زبانی کوچک یا SLM قرار گرفته و توانسته‌اند عملکرد قابل توجهی را از خود به نمایش بگذارند. نسخه ۳ با سه سایز مختلف به نام‌های mini با ۳.۸ میلیارد پارامتر، small با ۷ میلیارد پارامتر و medium با ۱۴ میلیارد پارامتر معرفی شده است ولی در حال حاضر تنها نسخه mini با دو سایز مختلف Context Window (۴و ۱۲۸ هزار توکن)در دسترس عموم قرار گرفته و قرار است به زودی سایر نسخه‌ها نیز منتشر شوند. نتایج مقایسه این مجموعه با مدل‌های مشابه نشان‌دهنده عملکرد مناسب آن است. قابل ذکر است که مدل‌های کوچک زبانی نسبت به مدل‌های بزرگ زبانی در بنچ‌مارک‌های factual knowledge نظیر TriviaQA عملکرد ضعیف‌تری دارند، زیرا این مدل‌ها ظرفیت کمتری برای نگهداری اطلاعات دارند.

👈 قبلاً نسخه ۲ را در اینجا معرفی کرده بودم.
👈 برای اطلاعات بیشتری درباره نسخه ۳ اینجا را بخوانید.
👈 برای دسترسی به مجموعه Phi صفحه مایکروسافت در HF را از اینجا مشاهده کنید.

#phi
#microsoft

@dumannewsletter

382 views08:22

آیا AI شغل شما را خواهد گرفت؟

دیدگاه شخصیت‌های مختلف در مورد جایگزینی انسان با هوش‌مصنوعی!
برخی از شخصیت‌ها نظیر بیل گیتس و سم آلتمن عقیده دارند که AI منجر به تغییرات مثبت، افزایش بهره‌وری و تولید مشاغل جدید خواهد شد ولی در نقطه مقابل برخی افراد نظیر ایلان ماسک عقیده دارند که در نهایت AI در تمامی ابعاد از انسان کارآمدتر شده و جایگزین او می‌شود (منبع).

@dumannewsletter

386 viewsedited 13:29

3:11

دموی ربات انسان‌نمای S1

این ربات توسط شرکت چینی Astribot توسعه داده شده است.

#robotics
#astribot

@dumannewsletter

524 views13:01

1:28

دموی آخرین وضعیت اپتیموس

#optimus
#tesla
#robotics

@dumannewsletter

429 views08:57

1:21

ساتیا نادلا مدیرعامل مایکروسافت: قانون مور (Moore's Law) با Scaling Laws (قوانین مقیاس پذیری) در انقلاب هوش‌مصنوعی جایگزین شده است.

توضیحات:
👈 قانون مور (به انگلیسی: Moore's Law ) که نخستین بار گوردون مور، از بنیانگذاران شرکت اینتل، در سال ۱۹۶۵ آن را ارائه کرد، قاعده‌ای سرانگشتی است که بیان می‌کند تعداد ترانزیستورهای روی یک تراشه با مساحت ثابت هر ۲ سال، به‌طور تقریبی دو برابر می‌شود (ویکی پدیا).
👈 در ماه‌های گذشته با افزایش مقیاس مدل‌ها و نسخه‌های مختلف هوش‌مصنوعی (افزایش تعداد پارامترها، سایز Context Window، تعداد توکن‌های Trainingو ...) شاهد افزایش قابلیت‌های آن‌ها بوده‌ایم. ساتیا نیز به همین موضوع اشاره کرده و انتظار دارد در سال‌های آینده مقیاس به صورت صعودی (نمایی!) افزایش پیدا کرده و قابلیت‌های سیستم‌های AI بیشتر شود.
👈 مشاهده ویدئو کامل

#satya_nadella

@dumannewsletter

553 viewsedited 09:08

#fun

@dumannewsletter

397 views19:58

این مدت خیلی سرم شلوغ بود و فرصت نکردم کانالو به روز نگه دارم. سعی می‌کنم کم کم اخبار مهم دو هفته گذشته رو پوشش بدم.

262 views15:36

1:23

1:26

معرفی نسخه جدید GPT-4 توسط OpenAI

نسخه GPT-4o توسط OpenAI معرفی شد. این نسخه یک مدل چند وجهی (Multimodal) بوده که می‌تواند انواع دیتای متنی، صوتی و ویدئویی را پردازش کند و عملکرد به مراتب بهتری نسبت به نسخه قبلی (GPT-4T) از خود نشان دهد. این نسخه به طور متوسط با ۳۲۰ میلی ثانیه تاخیر به ورودی صوتی پاسخ می‌‌ دهد که مشابه زمان پاسخ‌دهی انسان در یک مکالمه عادی است. در نسخه‌‌های قبلی ورودی صوتی ابتدا به متن تبدیل شده و پس از آماده شدن پاسخ، متن خروجی به صوت تبدیل می‌‌شد. این فرآیند پاسخ‌دهی مدل را کند کرده و باعث از دست رفتن اطلاعات در این پروسه می‌‌‌‌‌‌‌‌‌‌‌‌شد. اما نسخه جدید از ابتدا به صورت چند وجهی آموزش داده شده و می‌‌تواند ورودی صوتی را مستقیم دریافت کرده و با خروجی صوتی پاسخ دهد. نسخه GPT-4o در متون انگلیسی و کد عملکرد مشابه نسخه Turbo داشته ولی در متون غیر انگلیسی عملکرد به مراتب بهتری نسبت به آن دارد. همچنین سرعت پاسخ دهی آن افزایش پیدا کرده و هزینه استفاده از APIهای آن تا ۵۰ درصد کاهش پیدا کرده است.

#openai
#gpt4o
#gpt4

@dumannewsletter

317 views15:45

معرفی نسخه جدید GPT-4 توسط OpenAI نسخه GPT-4o توسط OpenAI معرفی شد. این نسخه یک مدل چند وجهی (Multimodal) بوده که می‌تواند انواع دیتای متنی، صوتی و ویدئویی را پردازش کند و عملکرد به مراتب بهتری نسبت به نسخه قبلی (GPT-4T) از خود نشان دهد. این نسخه به طور متوسط…

کاهش تعداد توکن‌ های خروجی یکی دیگر از آپدیت های این نسخه بوده است. این کاهش برای زبان فارسی ۱.۹ برابر است. نسخه GPT-4o در بنچ مارک های مختلف ادراک بینایی (Vision Understanding)، ترجمه صوت (Audio Translation) و ارزیابی متن عملکرد بسیار خوبی نسبت به مدل‌‌های موجود در رقابت مدل‌‌های زبانی از خود نشان داده است. در این ویدئوها عملکرد GPT-4o در تشخیص احساسات و مود کاربر از روی چهره و ترجمه همزمان انگلیسی و ایتالیایی را مشاهده می‌‌کنید. برای جزئیات بیشتر درباره این نسخه اینجا را بخوانید.

Openai

Hello GPT-4o

We’re announcing GPT-4 Omni, our new flagship model which can reason across audio, vision, and text in real time.

269 viewsedited 15:45

همکاری Reddit و OpenAI

طبق این همکاری OpenAI دسترسی برخط (real-time) به محتوای Reddit خواهد داشت و در عوض Reddit نیز از سرویس‌‌های OpenAI برای ارائه قابلیت‌های جدید هوش‌مصنوعی به کاربرانش استفاده خواهد کرد. پلتفرم‌های Q&A یکی از مهم ترین منابع آموزش مدل‌های زبانی می‌باشند.

#reddit
#openai

@dumannewsletter

298 views20:26

ایلیا سوتسکور (Ilya Sutskever) از موسسان OpenAI و دانشمندان برجسته حوزه هوش‌مصنوعی از این کمپانی جدا شد. طبق شنیده‌ها ایلیا در ماجرای اخراج سم آلتمن نقش مهی داشت. بعد از بازگشت سم آلتمن به مدیریت OpenAI و تغییر هیئت مدیره تا مدت‌ها در مورد موقعیت ایلیا در OpenAI گمانه‌زنی می‌شد تا اینکه خبر استفای او به صورت رسمی اعلام شد (توئیت ایلیا).
ایلیا در وسط این جمع قرار دارد.

مطالعه این مقاله پیشنهاد می‌شود:
👈ماجرای اخراج غیرمنتظره سم‌آلتمن مدیرعامل OpenAI!

#openai
#ilya_sutskever

@dumannewsletter

316 viewsedited 20:42

نسخه ۳ آلفافولد (AlphaFold) توسط گوگل DeepMind معرفی شد!

نسخه ۳ مدل‌ هوش‌‌مصنوعی AlphaFold با همکاری گوگل DeepMind و Isomorphic Labs توسعه داده شده است. این مدل برای پیش‌بینی ساختار مولکول‌های پروتئین، DNA، RNA و سایر اجزای بیولوژیکی سازنده حیات و نحوه تعامل آن‌ها به کار می‌رود. مهم‌ترین کاربرد این مدل کشف داروهای جدید و نحوه عملکرد آن بر روی انسان است. نسخه ۲ این مدل در سال ۲۰۲۰ معرفی شد و برای کشف واکسن مالاریا، داروهای سرطان و طراحی آنزیم مورد استفاده قرار گرفت. AlphaFold 3 از تمامی نمونه‌های مشابه عملکرد بهتر و دقیق‌تری دارد و از اینجا در دسترس محققان دنیا قرار گرفته است. گوگل نحوه استفاده از این مدل قدرتمند هوش‌مصنوعی را در قالب یک کورس در اینجا آموزش داده است. علاوه بر این، گوگل ساختار بیش از ۲۰۰ میلیون مولکول پروتئین را که با استفاده از پروژه AlphaFold استخراج شده به صورت رایگان در اینجا در دسترس عموم قرار داده است (منبع).

#google
#deepmind
#alphafold
#isomorphic_labs

@dumannewsletter

382 viewsedited 10:42

رقابت برای ساخت گجت‌های پوشیدنی مبتنی بر AI
در این تصویر برندهای موجود برای هر نوع گجت پوشیدنی را مشاهده می‌کنید.

@dumannewsletter

302 views10:44

همکاری Reddit و OpenAI طبق این همکاری OpenAI دسترسی برخط (real-time) به محتوای Reddit خواهد داشت و در عوض Reddit نیز از سرویس‌‌های OpenAI برای ارائه قابلیت‌های جدید هوش‌مصنوعی به کاربرانش استفاده خواهد کرد. پلتفرم‌های Q&A یکی از مهم ترین منابع آموزش مدل‌های…

همکاری OpenAI و Stackoverflow

در هفته‌های گذشته همکاری مشابهی بین OpenAI و Stackoverflow آغاز شد. طبق این همکاری پلتفرم محبوب Stackoverflow از مدل‌های OpenAI برای توسعه محصول OverflowAI خود استفاده خواهد کرد و OpenAI نیز به محتوای منتشر شده در این پلتفرم Q&A دسترسی خواهد داشت (منبع).
مطالعه این مقاله پیشنهاد می‌شود:

👈 تلاش Stackoverflow برای بقا در تلاطم هوش‌مصنوعی

#openai
#stackoverflow

@dumannewsletter

270 views10:53

3:00

#eleven_labs

@dumannewsletter

تولید موسیقی با ElevenLabs 🎵

استارتاپ ElevenLabs سرویس جدید تولید موسیقی خود را دمو کرد. این سرویس هنوز در دسترس عموم قرار نگرفته است. موسیقی و متن آن کاملاً توسط AI تهیه شده است(منبع)!

Style: “Pop pop-rock, country, top charts song.”

300 viewsedited 12:09

Forwarded from خبرنامه هوش مصنوعی دومان

مدل‌های تولید موسیقی

با استفاده از مدل‌های زیر می‌توانید موسیقی موردنظر خود را شرح داده و خروجی تولید شده توسط آن را بشنوید.

1. MusicGen (Meta AI)
2. Stable Audio (Stability AI)
3. MusicFX (Google)
4. Suno
5. Udio
6. ElevenLabs (coming soon)

#musicgen
#stable_audio
#musicfx
#suno
#udio
#eleven_labs

@dumannewsletter

298 views12:12

#fun @dumannewsletter

#fun

@dumannewsletter

328 views12:18