خبرنامه هوش مصنوعی دومان
711 subscribers
265 photos
180 videos
2 files
307 links
ابزار، نوآوری‌ها و اخبار هوش مصنوعی و رباتیک

📌 ارتباط با من:

dumannewsletter@gmail.com

📌 لینک Boost کانال:

https://t.me/dumannewsletter?boost

📌 آرشیو وبسایت (به روز نمی‌شود):

duman.pouyae.ir

#هوش_مصنوعی
#رباتیک
Download Telegram
امروز GPT Store به صورت رسمی در دسترس قرار گرفت. کاربران OpenAI می‌توانند نسخه‌های کاستومایز شده خود از مدل هوش‌مصنوعی این کمپانی را در این استور برای فروش منتشر کنند. GPT Store در کنفرانس OpenAI Dev Day که در آبان ماه برگزار شد معرفی شده بود.

👈 مشاهده GPT Store
👈 گزارش کنفرانس OpenAI Dev Day

#openai
#gpt_store

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
دموی ربات‌‌های انسان‌نمای ساخت 1x Robotics

رقابت برای ساخت ربات‌های انسان‌نما (humanoid) تنها به #atlas #optimus, #figure, #digit و نمونه‌های چینی ختم نشده است. شرکت نروژی 1x Robotics یکی دیگر از رقیبان این حوزه بوده که اخیراً با جذب سرمایه ۱۰۰ میلیون دلاری از سمت OpenAI مورد توجه قرار گرفته است. ربات‌های انسان‌نما می‌توانند تعامل بیشتری با محیط داشته و در کارهای روزمره مورد استفاده قرار بگیرند. از طرفی این موضوع می‌تواند فرصت بیشتری را برای ساخت هوش‌مصنوعی مشابه انسان فراهم سازد. شاید یکی از دلایل علاقه OpenAI برای سرمایه‌گذاری در 1x Robotics و Figure همین موضوع باشد.

#openai
#1x_robotics

@dumannewsletter
گروه‌های معترض به فعالیت‌های OpenAI در توسعه AGI و همکاری با پنتاگون مقابل دفتر این کمپانی در لس‌آنجلس جمع شده و اعتراض خود را بیان کردند (منبع خبر).

#openai

@dumannewsletter
Media is too big
VIEW IN TELEGRAM
معرفی مدل جدید OpenAI برای تولید ویدیو | معرفی Sora

مدل جدید OpenAI با نام Sora می‌تواند ویدئو با طول یک دقیقه تولید کند. ویدئوی تولید شده توسط Sora در تمام طول آن ضمن حفظ کیفیت از prompt کاربر تبعیت می‌کند. Sora فعلا برای تست و دریافت فیدبک در اختیار عده محدودی از کاربران قرار گرفته است. در این ویدئو می‌توانید خروجی‌های نمونه به همراه prompt هرکدام را مشاهده کنید (صوت ندارد). با وجود کیفیت فوق‌العاده آن هنوز دارای ضعف‌هایی نیز هست. به عنوان مثال اثر یک اتفاق روی یک شی اعمال نمی‌شود (وقتی که به کوکی گاز زده می‌شود بدون تغییر باقی می‌ماند) و یا مختصات فضایی نظیر چپ و راست را اشتباه می‌کند. Sora از مدل Diffusion و معماری ترنسفورمر استفاده می‌کند. علاوه بر ورودی متنی (text) می‌تواند با دریافت تصویر برای آن ویدئو خلق کرده و یا با اضافه کردن به طول یک ویدئو زمان آن را طولانی‌تر کند. در صورتی که به صورت عمومی در دسترس قرار بگیرد، متا دیتای C2PA همانند DALL.E در خروجی‌های آن گنجانده خواهد شد تا جلوی سواستفاده از آن با نشر Deep Fake گرفته شود (منبع).

#openai
#sora

@dumannewsletter
شکایت ماسک از سم آلتمن!

ایلان ماسک از سم آلتمن مدیرعامل OpenAI به خاطر تخطی از اهداف اولیه OpenAI در بدو تاسیس شکایت کرد! OpenAI در سال ۲۰۱۵ به عنوان سازمان غیرانتفاعی (Non-Profit) با هدف توسعه سیستم‌های هوش‌مصنوعی اپن سورس و منتفع ساختن بشر از قابلیت‌های این تکنولوژی با همراهی تعدادی از متخصصان و افراد سرشناس از جمله ایلان ماسک و سم آلتمن تاسیس شد. در بدو تاسیس این کمپانی ایلان ماسک یکی از حمایت‌کنندگان اصلی OpenAI بود. اما در سال ۲۰۱۸ به خاطر تضاد منافع با تسلا از موقعیت خود استعفا داد و از OpenAI جدا شد. در سال ۲۰۱۹ این کمپانی تغییر رویه داده و از سازمان غیرانتفاعی به انتفاعی تبدیل شد. در همین سال با جذب سرمایه هنگفت از سمت مایکروسافت فصل جدیدی را آغاز کرد که در حال حاضر نتیجه آن را با معرفی محصولاتی نظیر ChatGPT، DALL E و Sora مشاهده می‌کنیم. در سال‌های اخیر همواره OpenAI به خاطر سیاست‌های بسته خود مورد انتقاد قرار گرفته است.

#openai
#sam_altman
#elon_musk

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
اولین دموی همکاری OpenAI و Figure

تنها حدود دو هفته بعد از شروع سرمایه‌گذاری OpenAI در Figure نتیجه همکاری این دو کمپانی به نمایش گذاشته شد. ربات Figure با استفاده از مدل VLM شرکت OpenAI توانایی درک زبان (Language Understanding) و استدلال بینایی (Visual Reasoning) پیدا کرده است! همان‌طور که در این ویدئو نمایش داده شده این مدل در پاسخ به گرسنه بودن کاربر به درستی از میان اشیای مختلف روی میز سیب را به وی تعارف می‌کند. همچنین می‌تواند اشیای روی میز را تشخیص داده و به درستی مرتب کند. مدل‌های VLM (Vision Language Model) توانایی تحلیل دیتای بصری را دارند.

#figure
#openai
#robotics

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
پاسخ مدل GTP-4 در آپدیت جدید کوتاه‌تر و مفیدتر شده است. در این ویدئو سکشن سمت چپ پاسخ نسخه جدید و سکسشن سمت راست پاسخ نسخه قبلی است.

#gpt4
#chatgpt
#openai

@dumannewsletter
معرفی نسخه جدید GPT-4 توسط OpenAI

نسخه GPT-4o توسط OpenAI معرفی شد. این نسخه یک مدل چند وجهی (Multimodal) بوده که می‌تواند انواع دیتای متنی، صوتی و ویدئویی را پردازش کند و عملکرد به مراتب بهتری نسبت به نسخه قبلی (GPT-4T) از خود نشان دهد. این نسخه به طور متوسط با ۳۲۰ میلی ثانیه تاخیر به ورودی صوتی پاسخ می‌‌ دهد که مشابه زمان پاسخ‌دهی انسان در یک مکالمه عادی است. در نسخه‌‌های قبلی ورودی صوتی ابتدا به متن تبدیل شده و پس از آماده شدن پاسخ، متن خروجی به صوت تبدیل می‌‌شد. این فرآیند پاسخ‌دهی مدل را کند کرده و باعث از دست رفتن اطلاعات در این پروسه می‌‌‌‌‌‌‌‌‌‌‌‌شد. اما نسخه جدید از ابتدا به صورت چند وجهی آموزش داده شده و می‌‌تواند ورودی صوتی را مستقیم دریافت کرده و با خروجی صوتی پاسخ دهد. نسخه GPT-4o در متون انگلیسی و کد عملکرد مشابه نسخه Turbo داشته ولی در متون غیر انگلیسی عملکرد به مراتب بهتری نسبت به آن دارد. همچنین سرعت پاسخ دهی آن افزایش پیدا کرده و هزینه استفاده از APIهای آن تا ۵۰ درصد کاهش پیدا کرده است.

#openai
#gpt4o
#gpt4

@dumannewsletter
همکاری Reddit و OpenAI

طبق این همکاری OpenAI دسترسی برخط (real-time) به محتوای Reddit خواهد داشت و در عوض Reddit نیز از سرویس‌‌های OpenAI برای ارائه قابلیت‌های جدید هوش‌مصنوعی به کاربرانش استفاده خواهد کرد. پلتفرم‌های Q&A یکی از مهم ترین منابع آموزش مدل‌های زبانی می‌باشند.

#reddit
#openai

@dumannewsletter
ایلیا سوتسکور (Ilya Sutskever) از موسسان OpenAI و دانشمندان برجسته حوزه هوش‌مصنوعی از این کمپانی جدا شد. طبق شنیده‌ها ایلیا در ماجرای اخراج سم آلتمن نقش مهی داشت. بعد از بازگشت سم آلتمن به مدیریت OpenAI و تغییر هیئت مدیره تا مدت‌ها در مورد موقعیت ایلیا در OpenAI گمانه‌زنی می‌شد تا اینکه خبر استفای او به صورت رسمی اعلام شد (توئیت ایلیا).
ایلیا در وسط این جمع قرار دارد.

مطالعه این مقاله پیشنهاد می‌شود:
👈ماجرای اخراج غیرمنتظره سم‌آلتمن مدیرعامل OpenAI!

#openai
#ilya_sutskever

@dumannewsletter
خبرنامه هوش مصنوعی دومان
همکاری Reddit و OpenAI طبق این همکاری OpenAI دسترسی برخط (real-time) به محتوای Reddit خواهد داشت و در عوض Reddit نیز از سرویس‌‌های OpenAI برای ارائه قابلیت‌های جدید هوش‌مصنوعی به کاربرانش استفاده خواهد کرد. پلتفرم‌های Q&A یکی از مهم ترین منابع آموزش مدل‌های…
همکاری OpenAI و Stackoverflow

در هفته‌های گذشته همکاری مشابهی بین OpenAI و Stackoverflow آغاز شد. طبق این همکاری پلتفرم محبوب Stackoverflow از مدل‌های OpenAI برای توسعه محصول OverflowAI خود استفاده خواهد کرد و OpenAI نیز به محتوای منتشر شده در این پلتفرم Q&A دسترسی خواهد داشت (منبع).
مطالعه این مقاله پیشنهاد می‌شود:

👈 تلاش Stackoverflow برای بقا در تلاطم هوش‌مصنوعی

#openai
#stackoverflow

@dumannewsletter
خبرنامه هوش مصنوعی دومان
معرفی نسخه جدید GPT-4 توسط OpenAI نسخه GPT-4o توسط OpenAI معرفی شد. این نسخه یک مدل چند وجهی (Multimodal) بوده که می‌تواند انواع دیتای متنی، صوتی و ویدئویی را پردازش کند و عملکرد به مراتب بهتری نسبت به نسخه قبلی (GPT-4T) از خود نشان دهد. این نسخه به طور متوسط…
سم آلتمن مدیرعامل OpenAI بعد از انتشار نسخه جدید ChatGPT با یادآوری فیلم her در پلتفرم X به نوعی دیدگاه خود درباره این نسخه را مطرح کرد.
او (به انگلیسی: Her) فیلمی در گونه کمدی-درام رمانتیکاست که اسپایک جونز نویسندگی و کارگردانی آن را بر عهده داشته‌است. در این فیلم ستارگانی چون واکین فینیکس، امی آدامز، رونی مارا، اولیویا وایلد و اسکارلت جوهانسون (صداپیشه سامانتا) حضور دارند. داستان فیلم در سالهای مابین ۲۰۱۷ تا ۲۰۷۷ اتفاق می‌افتد. محوریت داستان در مورد مردی است که با یک سیستم‌عامل هوشمند رایانه‌ای که دارای صدا و شخصیت یک زن است رابطه عاطفی برقرار می‌کند (ویکی پدیا).

#sam_altman
#openai
#gpt4o

@dumannewsletter
انتشار نسخه ارزان GPT-4o mini

شرکت OpenAI ارزان‌ترین مدل کارآمد خود را با نام GPT-4o mini منتشر کرد. قیمت دسترسی به APIهای این مدل ۱۵ سنت به ازای یک میلیون توکن ورودی و ۶۰ سنت به ازای یک میلیون توکن خروجی است (سایز ورودی و خروجی ریکوئست در محاسبه هزینه مدل‌های زبانی لحاظ می‌شود). تا قبل از معرفی این نسخه ارزان‌ترین مدل OpenAI نسخه GPT-3.5 Turbo بود. به این ترتیب با معرفی GPT-4o mini ارزان‌ترین مدل OpenAI حدود ۶۰ درصد ارزان‌تر شده است! ضمن کاهش قابل توجه هزینه، بهره‌وری نسخه GPT-4o mini در بنچ‌مارک‌های مختلف از نسخه GPT-3.5 Turbo بهتر است. قرار است در آینده نزدیک فرم‌های مختلف دیتا نیز توسط GPT-4o mini ساپورت شود. سایز Context Window آن ۱۲۸ کیلوبایت بوده و دیتای استفاده شده برای آموزش آن تا اکتبر ۲۰۲۳ به روز بوده است. این کاهش هزینه امکان استفاده از مدل‌های زبانی را در اپلیکیشن‌های بیشتری میسر می‌سازد (جزئیات بیشتر).

#openai
#gpt4o
#gpt4o_mini
#هوش_مصنوعی

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
شرکت OpenAI پروتوتایپ موتور جستجوی خود را با نام SearchGPT معرفی کرد. برای استفاده از این سرویس از اینجا در لیست انتظار ثبت نام کنید. با توجه به سرمایه‌گذاری مایکروسافت در OpenAI و همکاری این دو شرکت انتظار می‌رود این محصول بسیار مشابه موتور جستجوی Bing باشد.

#openai
#searchgpt

@dumannewsletter
انتشار مدل جدید OpenAI

کمپانی OpenAI مدل جدیدی را با نام OpenAI o1 معرفی کرد. قبلاً اطلاعات اندکی از این مدل تحت عنوان Project Strawberry/Q* درز کرده بود. فعلاً این مدل در دسترس کاربران تیمی و پلاس ChatGPT قرار گرفته است. OpenAI o1 نسبت به مدل‌های GPT این کمپانی در حل مسائل ریاضی و چالش‌های برنامه‌نویسی عملکرد بهتری دارد. به عنوان نمونه مدل GPT-4o تنها به ۱۳ درصد سوالات المپیاد جهانی ریاضی پاسخ داده در حالی‌که این مدل جدید ۸۳ درصد سوالات را به درستی پاسخ داده است. طبق ادعای OpenAI این مدل قبل از پاسخ دادن زمان بیشتری را برای فکر کردن صرف کرده و راه‌حل‌های مختلف و اشتباهات آن‌ها را ارزیابی می‌کند، به همین جهت عملکرد بهتری برای استدلال‌های پیچیده دارد. در این ویدئو مدل OpenAI o1 برای حل چالش برنامه‌نویسی دمو شده است. همچنین در این تصویر OpenAI o1 با GPT-4o در بنچ‌مارک‌های مختلف مقایسه شده است.
برای مطالعه جزئیات بیشتر اینجا را بخوانید.

#openai
#openai_o1

@dumannewsletter
خانم Mira Murati مدیرفنی OpenAI طی پیامی در X خروج خود از این شرکت را اعلام کرد. در این تصویر خروج اعضای کلیدی OpenAI در ماه‌های اخیر به ترتیب نشان داده شده است.

#openai

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
قابلیت Advanced Voice سرویس ChatGPT که به تازگی در اختیار کاربران پلاس و تیمی قرار گرفته است.

#chatgtp
#openai

@dumannewsletter
سرمایه‌گذاری جدید در OpenAI

کمپانی OpenAI با سرمایه‌گذاری ۶.۶ میلیارد دلاری به ارزش تقریبی ۱۵۷ میلیارد دلار رسید. سرمایه جدید تزریق شده قرار است برای تحقیقات و توسعه ابزارهای جدید مورد استفاده قرار بگیرد. انتظار می‌رود درآمد OpenAI تا سال ۲۰۲۶ به ۲۵ میلیارد دلار و تا سال ۲۰۲۹ به ۱۰۰ میلیارد دلار در سال برسد. OpenAI در ابتدا به صورت غیرانتفاعی تاسیس شد ولی در گذر زمان با جذب سرمایه از مایکروسافت عمدتاً به عنوان شرکت انتفاعی خود را معرفی کرد. هر چند که تلاش‌های محدودی برای معرفی ابزارهای اپن‌سورس انجام داد. خروج اعضای کلیدی این شرکت در ماه‌های اخیر نیز با هدف تمرکز بیشتر برای تبدیل شرکت به یک مجموعه کاملاً انتفاعی تلقی می‌شود(منبع).

#openai

@dumannewsletter
شرکت OpenAI بنچ‌مارک جدیدی به نام MLE-bench را معرفی کرد. این بنچ‌مارک برای مقایسه مدل‌های هوش‌مصنوعی در حوزه مهندسی یادگیری ماشین است. برای جزئیات بیشتر اینجا را بخوانید.

#openai

@dumannewsletter