خبرنامه هوش مصنوعی دومان
711 subscribers
265 photos
180 videos
2 files
307 links
ابزار، نوآوری‌ها و اخبار هوش مصنوعی و رباتیک

📌 ارتباط با من:

dumannewsletter@gmail.com

📌 لینک Boost کانال:

https://t.me/dumannewsletter?boost

📌 آرشیو وبسایت (به روز نمی‌شود):

duman.pouyae.ir

#هوش_مصنوعی
#رباتیک
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
رقیب چینی مدل Sora با نام Vidu معرفی شد!

این مدل می‌تواند براساس متن ورودی یک ویدئوی ۱۶ ثانیه‌ای با کیفیت HD تولید کند (منبع).

#vidu
#sora

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
اریک اشمیت مدیرعامل سابق گوگل: زمانی که ایجنت‌های هوش‌مصنوعی با زبان جدیدی که ما درک نمی‌کنیم ارتباط برقرار کنند، باید کامپیوترها را از برق بکشیم!

👈 مشاهده ویدئو کامل

#eric_schmidt

@dumannewsletter
مدل Phi3 توسط مایکروسافت معرفی شد.

نسخه ۳ مجموعه مدل‌های زبانی Phi توسط مایکروسافت معرفی شد. این مدل‌ها در دسته مدل‌های زبانی کوچک یا SLM قرار گرفته و توانسته‌اند عملکرد قابل توجهی را از خود به نمایش بگذارند. نسخه ۳ با سه سایز مختلف به نام‌های mini با ۳.۸ میلیارد پارامتر، small با ۷ میلیارد پارامتر و medium با ۱۴ میلیارد پارامتر معرفی شده است ولی در حال حاضر تنها نسخه mini با دو سایز مختلف Context Window (۴و ۱۲۸ هزار توکن)در دسترس عموم قرار گرفته و قرار است به زودی سایر نسخه‌ها نیز منتشر شوند. نتایج مقایسه این مجموعه با مدل‌های مشابه نشان‌دهنده عملکرد مناسب آن است. قابل ذکر است که مدل‌های کوچک زبانی نسبت به مدل‌های بزرگ زبانی در بنچ‌مارک‌های factual knowledge نظیر TriviaQA عملکرد ضعیف‌تری دارند، زیرا این مدل‌ها ظرفیت کمتری برای نگهداری اطلاعات دارند.

👈 قبلاً نسخه ۲ را در اینجا معرفی کرده بودم.
👈 برای اطلاعات بیشتری درباره نسخه ۳ اینجا را بخوانید.
👈 برای دسترسی به مجموعه Phi صفحه مایکروسافت در HF را از اینجا مشاهده کنید.

#phi
#microsoft

@dumannewsletter
آیا AI شغل شما را خواهد گرفت؟

دیدگاه شخصیت‌های مختلف در مورد جایگزینی انسان با هوش‌مصنوعی!
برخی از شخصیت‌ها نظیر بیل گیتس و سم آلتمن عقیده دارند که AI منجر به تغییرات مثبت، افزایش بهره‌وری و تولید مشاغل جدید خواهد شد ولی در نقطه مقابل برخی افراد نظیر ایلان ماسک عقیده دارند که در نهایت AI در تمامی ابعاد از انسان کارآمدتر شده و جایگزین او می‌شود (منبع).

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
دموی ربات انسان‌نمای S1

این ربات توسط شرکت چینی Astribot توسعه داده شده است.

#robotics
#astribot

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
ساتیا نادلا مدیرعامل مایکروسافت: قانون مور (Moore's Law) با Scaling Laws (قوانین مقیاس پذیری) در انقلاب هوش‌مصنوعی جایگزین شده است.

توضیحات:
👈 قانون مور (به انگلیسی: Moore's Law ) که نخستین بار گوردون مور، از بنیانگذاران شرکت اینتل، در سال ۱۹۶۵ آن را ارائه کرد، قاعده‌ای سرانگشتی است که بیان می‌کند تعداد ترانزیستورهای روی یک تراشه با مساحت ثابت هر ۲ سال، به‌طور تقریبی دو برابر می‌شود (ویکی پدیا).
👈 در ماه‌های گذشته با افزایش مقیاس مدل‌ها و نسخه‌های مختلف هوش‌مصنوعی (افزایش تعداد پارامترها، سایز Context Window، تعداد توکن‌های Trainingو ...) شاهد افزایش قابلیت‌های آن‌ها بوده‌ایم. ساتیا نیز به همین موضوع اشاره کرده و انتظار دارد در سال‌های آینده مقیاس به صورت صعودی (نمایی!) افزایش پیدا کرده و قابلیت‌های سیستم‌های AI بیشتر شود.
👈 مشاهده ویدئو کامل

#satya_nadella

@dumannewsletter
این مدت خیلی سرم شلوغ بود و فرصت نکردم کانالو به روز نگه دارم. سعی می‌کنم کم کم اخبار مهم دو هفته گذشته رو پوشش بدم.
معرفی نسخه جدید GPT-4 توسط OpenAI

نسخه GPT-4o توسط OpenAI معرفی شد. این نسخه یک مدل چند وجهی (Multimodal) بوده که می‌تواند انواع دیتای متنی، صوتی و ویدئویی را پردازش کند و عملکرد به مراتب بهتری نسبت به نسخه قبلی (GPT-4T) از خود نشان دهد. این نسخه به طور متوسط با ۳۲۰ میلی ثانیه تاخیر به ورودی صوتی پاسخ می‌‌ دهد که مشابه زمان پاسخ‌دهی انسان در یک مکالمه عادی است. در نسخه‌‌های قبلی ورودی صوتی ابتدا به متن تبدیل شده و پس از آماده شدن پاسخ، متن خروجی به صوت تبدیل می‌‌شد. این فرآیند پاسخ‌دهی مدل را کند کرده و باعث از دست رفتن اطلاعات در این پروسه می‌‌‌‌‌‌‌‌‌‌‌‌شد. اما نسخه جدید از ابتدا به صورت چند وجهی آموزش داده شده و می‌‌تواند ورودی صوتی را مستقیم دریافت کرده و با خروجی صوتی پاسخ دهد. نسخه GPT-4o در متون انگلیسی و کد عملکرد مشابه نسخه Turbo داشته ولی در متون غیر انگلیسی عملکرد به مراتب بهتری نسبت به آن دارد. همچنین سرعت پاسخ دهی آن افزایش پیدا کرده و هزینه استفاده از APIهای آن تا ۵۰ درصد کاهش پیدا کرده است.

#openai
#gpt4o
#gpt4

@dumannewsletter
خبرنامه هوش مصنوعی دومان
معرفی نسخه جدید GPT-4 توسط OpenAI نسخه GPT-4o توسط OpenAI معرفی شد. این نسخه یک مدل چند وجهی (Multimodal) بوده که می‌تواند انواع دیتای متنی، صوتی و ویدئویی را پردازش کند و عملکرد به مراتب بهتری نسبت به نسخه قبلی (GPT-4T) از خود نشان دهد. این نسخه به طور متوسط…
کاهش تعداد توکن‌ های خروجی یکی دیگر از آپدیت های این نسخه بوده است. این کاهش برای زبان فارسی ۱.۹ برابر است. نسخه GPT-4o در بنچ مارک های مختلف ادراک بینایی (Vision Understanding)، ترجمه صوت (Audio Translation) و ارزیابی متن عملکرد بسیار خوبی نسبت به مدل‌‌های موجود در رقابت مدل‌‌های زبانی از خود نشان داده است. در این ویدئوها عملکرد GPT-4o در تشخیص احساسات و مود کاربر از روی چهره و ترجمه همزمان انگلیسی و ایتالیایی را مشاهده می‌‌کنید. برای جزئیات بیشتر درباره این نسخه اینجا را بخوانید.
همکاری Reddit و OpenAI

طبق این همکاری OpenAI دسترسی برخط (real-time) به محتوای Reddit خواهد داشت و در عوض Reddit نیز از سرویس‌‌های OpenAI برای ارائه قابلیت‌های جدید هوش‌مصنوعی به کاربرانش استفاده خواهد کرد. پلتفرم‌های Q&A یکی از مهم ترین منابع آموزش مدل‌های زبانی می‌باشند.

#reddit
#openai

@dumannewsletter
ایلیا سوتسکور (Ilya Sutskever) از موسسان OpenAI و دانشمندان برجسته حوزه هوش‌مصنوعی از این کمپانی جدا شد. طبق شنیده‌ها ایلیا در ماجرای اخراج سم آلتمن نقش مهی داشت. بعد از بازگشت سم آلتمن به مدیریت OpenAI و تغییر هیئت مدیره تا مدت‌ها در مورد موقعیت ایلیا در OpenAI گمانه‌زنی می‌شد تا اینکه خبر استفای او به صورت رسمی اعلام شد (توئیت ایلیا).
ایلیا در وسط این جمع قرار دارد.

مطالعه این مقاله پیشنهاد می‌شود:
👈ماجرای اخراج غیرمنتظره سم‌آلتمن مدیرعامل OpenAI!

#openai
#ilya_sutskever

@dumannewsletter
نسخه ۳ آلفافولد (AlphaFold) توسط گوگل DeepMind معرفی شد!

نسخه ۳ مدل‌ هوش‌‌مصنوعی AlphaFold با همکاری گوگل DeepMind و Isomorphic Labs توسعه داده شده است. این مدل برای پیش‌بینی ساختار مولکول‌های پروتئین، DNA، RNA و سایر اجزای بیولوژیکی سازنده حیات و نحوه تعامل آن‌ها به کار می‌رود. مهم‌ترین کاربرد این مدل کشف داروهای جدید و نحوه عملکرد آن بر روی انسان است. نسخه ۲ این مدل در سال ۲۰۲۰ معرفی شد و برای کشف واکسن مالاریا، داروهای سرطان و طراحی آنزیم مورد استفاده قرار گرفت. AlphaFold 3 از تمامی نمونه‌های مشابه عملکرد بهتر و دقیق‌تری دارد و از اینجا در دسترس محققان دنیا قرار گرفته است. گوگل نحوه استفاده از این مدل قدرتمند هوش‌مصنوعی را در قالب یک کورس در اینجا آموزش داده است. علاوه بر این، گوگل ساختار بیش از ۲۰۰ میلیون مولکول پروتئین را که با استفاده از پروژه AlphaFold استخراج شده به صورت رایگان در اینجا در دسترس عموم قرار داده است (منبع).

#google
#deepmind
#alphafold
#isomorphic_labs

@dumannewsletter
رقابت برای ساخت گجت‌های پوشیدنی مبتنی بر AI
در این تصویر برندهای موجود برای هر نوع گجت پوشیدنی را مشاهده می‌کنید.

@dumannewsletter
خبرنامه هوش مصنوعی دومان
همکاری Reddit و OpenAI طبق این همکاری OpenAI دسترسی برخط (real-time) به محتوای Reddit خواهد داشت و در عوض Reddit نیز از سرویس‌‌های OpenAI برای ارائه قابلیت‌های جدید هوش‌مصنوعی به کاربرانش استفاده خواهد کرد. پلتفرم‌های Q&A یکی از مهم ترین منابع آموزش مدل‌های…
همکاری OpenAI و Stackoverflow

در هفته‌های گذشته همکاری مشابهی بین OpenAI و Stackoverflow آغاز شد. طبق این همکاری پلتفرم محبوب Stackoverflow از مدل‌های OpenAI برای توسعه محصول OverflowAI خود استفاده خواهد کرد و OpenAI نیز به محتوای منتشر شده در این پلتفرم Q&A دسترسی خواهد داشت (منبع).
مطالعه این مقاله پیشنهاد می‌شود:

👈 تلاش Stackoverflow برای بقا در تلاطم هوش‌مصنوعی

#openai
#stackoverflow

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
تولید موسیقی با ElevenLabs 🎵

استارتاپ ElevenLabs سرویس جدید تولید موسیقی خود را دمو کرد. این سرویس هنوز در دسترس عموم قرار نگرفته است. موسیقی و متن آن کاملاً توسط AI تهیه شده است(منبع)!
Style: “Pop pop-rock, country, top charts song.”

#eleven_labs

@dumannewsletter
مدل‌های تولید موسیقی

با استفاده از مدل‌های زیر می‌توانید موسیقی موردنظر خود را شرح داده و خروجی تولید شده توسط آن را بشنوید.

1. MusicGen (Meta AI)
2.
Stable Audio (Stability AI)
3
. MusicFX (Google)
4. Suno
5.
Udio
6. ElevenLabs (coming soon)


#musicgen
#stable_audio
#musicfx
#suno
#udio
#eleven_labs

@dumannewsletter
خبرنامه هوش مصنوعی دومان
معرفی نسخه جدید GPT-4 توسط OpenAI نسخه GPT-4o توسط OpenAI معرفی شد. این نسخه یک مدل چند وجهی (Multimodal) بوده که می‌تواند انواع دیتای متنی، صوتی و ویدئویی را پردازش کند و عملکرد به مراتب بهتری نسبت به نسخه قبلی (GPT-4T) از خود نشان دهد. این نسخه به طور متوسط…
سم آلتمن مدیرعامل OpenAI بعد از انتشار نسخه جدید ChatGPT با یادآوری فیلم her در پلتفرم X به نوعی دیدگاه خود درباره این نسخه را مطرح کرد.
او (به انگلیسی: Her) فیلمی در گونه کمدی-درام رمانتیکاست که اسپایک جونز نویسندگی و کارگردانی آن را بر عهده داشته‌است. در این فیلم ستارگانی چون واکین فینیکس، امی آدامز، رونی مارا، اولیویا وایلد و اسکارلت جوهانسون (صداپیشه سامانتا) حضور دارند. داستان فیلم در سالهای مابین ۲۰۱۷ تا ۲۰۷۷ اتفاق می‌افتد. محوریت داستان در مورد مردی است که با یک سیستم‌عامل هوشمند رایانه‌ای که دارای صدا و شخصیت یک زن است رابطه عاطفی برقرار می‌کند (ویکی پدیا).

#sam_altman
#openai
#gpt4o

@dumannewsletter