خبرنامه هوش مصنوعی دومان
711 subscribers
259 photos
178 videos
2 files
301 links
ابزار، نوآوری‌ها و اخبار هوش مصنوعی و رباتیک

📌 ارتباط با من:

dumannewsletter@gmail.com

📌 لینک Boost کانال:

https://t.me/dumannewsletter?boost

📌 آرشیو وبسایت (به روز نمی‌شود):

duman.pouyae.ir

#هوش_مصنوعی
#رباتیک
Download Telegram
Media is too big
VIEW IN TELEGRAM
قابلیت‌های جدید ویندوز به کمک مدل‌های OpenAI

اخیراً مایکروسافت مدل GPT-4 را در قالب یک اپلیکیشن با نام Copilot برای کاربران ویندوز ۱۱ و ۱۰ در دسترس قرار داد. علاوه‌بر معرفی Copilot برای کاربران ویندوز، جدیداً مدل DALL.E با نام Cocreator به نرم‌افزار محبوب Paint در ویندوز ۱۱ اضافه شده است. البته Cocreator هنوز برای تمامی زبان‌ها و کشورها فراهم نشده است ولی قرار است به زودی در دسترس تمامی کاربران قرار بگیرد. Copilot در ویندوز علاوه بر فراهم کردن قابلیت‌های GPT-4 نظیر پرسش و پاسخ و خلاصه‌سازی، تغییر تنظیمات ویندوز را برای کاربران ساده‌تر می‌کند. علاوه بر این، ابزارهای Snipping Tools، Photos و تعدادی دیگر از ابزارهای کاربردی نیز با قابلیت‌های هوش‌مصنوعی به روز شده‌اند. برای راهنمایی دسترسی به DALL.E در Paint اینجا و دسترسی به Copilot اینجا را بخوانید.

#microsoft
#openai
#windows

@dumannewsletter
صحبت‌های هلن تونر عضو سابق هیئت مدیره OpenAI درباره اخراج سم آلتمن

اخیراً نیویورک تایمز با خانم هلن تونر (Helen Toner) عضو سابق هیئت مدیره OpenAI و یکی از افراد اصلی که در اخراج سم آلتمن نقش داشت مصاحبه کرد. هلن تونر که در زمینه ایمنی هوش‌مصنوعی نیز فعالیت دارد، چند ماه پیش با همکاران خود در موسسه CSET در این زمینه مقاله‌ای منتشر کرد. در این مقاله OpenAI به خاطر انتشار عمومی ChatGPT مورد انتقاد قرار گرفته است. زیرا با انتشار ChatGPT سایر رقبا نظیر گوگل و آنتروپیک نیز برای رقابت مصمم شده و اقدام به انتشار محصولات و سرویس‌های مشابه کرده‌اند. ظاهراً این انتقاد از سمت هلن تونر به عنوان عضو هیئت مدیره OpenAI موجب بحث و اختلاف نظر او با سم آلتمن در روزهای قبل از اخراج شده است. تونر اخراج سم آلتمن به خاطر نگرانی‌ها حول موضوع ایمنی را رد کرد و تاکید کرد از بین رفتن اعتماد دلیل اخراج سم آلتمن از مدیریت OpenAI بوده است. تونر همچین از وفاداری کارمندان نسبت به آلتمن ابراز تعجب کرد و گفت وظیفه OpenAI نسبت به مدیریتش نیست بلکه نسبت به ماموریتش است.

👈 ماجرای اخراج سم آلتمن را از اینجا بخوانید.

#openai

@dumannewsletter
امروز GPT Store به صورت رسمی در دسترس قرار گرفت. کاربران OpenAI می‌توانند نسخه‌های کاستومایز شده خود از مدل هوش‌مصنوعی این کمپانی را در این استور برای فروش منتشر کنند. GPT Store در کنفرانس OpenAI Dev Day که در آبان ماه برگزار شد معرفی شده بود.

👈 مشاهده GPT Store
👈 گزارش کنفرانس OpenAI Dev Day

#openai
#gpt_store

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
دموی ربات‌‌های انسان‌نمای ساخت 1x Robotics

رقابت برای ساخت ربات‌های انسان‌نما (humanoid) تنها به #atlas #optimus, #figure, #digit و نمونه‌های چینی ختم نشده است. شرکت نروژی 1x Robotics یکی دیگر از رقیبان این حوزه بوده که اخیراً با جذب سرمایه ۱۰۰ میلیون دلاری از سمت OpenAI مورد توجه قرار گرفته است. ربات‌های انسان‌نما می‌توانند تعامل بیشتری با محیط داشته و در کارهای روزمره مورد استفاده قرار بگیرند. از طرفی این موضوع می‌تواند فرصت بیشتری را برای ساخت هوش‌مصنوعی مشابه انسان فراهم سازد. شاید یکی از دلایل علاقه OpenAI برای سرمایه‌گذاری در 1x Robotics و Figure همین موضوع باشد.

#openai
#1x_robotics

@dumannewsletter
گروه‌های معترض به فعالیت‌های OpenAI در توسعه AGI و همکاری با پنتاگون مقابل دفتر این کمپانی در لس‌آنجلس جمع شده و اعتراض خود را بیان کردند (منبع خبر).

#openai

@dumannewsletter
Media is too big
VIEW IN TELEGRAM
معرفی مدل جدید OpenAI برای تولید ویدیو | معرفی Sora

مدل جدید OpenAI با نام Sora می‌تواند ویدئو با طول یک دقیقه تولید کند. ویدئوی تولید شده توسط Sora در تمام طول آن ضمن حفظ کیفیت از prompt کاربر تبعیت می‌کند. Sora فعلا برای تست و دریافت فیدبک در اختیار عده محدودی از کاربران قرار گرفته است. در این ویدئو می‌توانید خروجی‌های نمونه به همراه prompt هرکدام را مشاهده کنید (صوت ندارد). با وجود کیفیت فوق‌العاده آن هنوز دارای ضعف‌هایی نیز هست. به عنوان مثال اثر یک اتفاق روی یک شی اعمال نمی‌شود (وقتی که به کوکی گاز زده می‌شود بدون تغییر باقی می‌ماند) و یا مختصات فضایی نظیر چپ و راست را اشتباه می‌کند. Sora از مدل Diffusion و معماری ترنسفورمر استفاده می‌کند. علاوه بر ورودی متنی (text) می‌تواند با دریافت تصویر برای آن ویدئو خلق کرده و یا با اضافه کردن به طول یک ویدئو زمان آن را طولانی‌تر کند. در صورتی که به صورت عمومی در دسترس قرار بگیرد، متا دیتای C2PA همانند DALL.E در خروجی‌های آن گنجانده خواهد شد تا جلوی سواستفاده از آن با نشر Deep Fake گرفته شود (منبع).

#openai
#sora

@dumannewsletter
شکایت ماسک از سم آلتمن!

ایلان ماسک از سم آلتمن مدیرعامل OpenAI به خاطر تخطی از اهداف اولیه OpenAI در بدو تاسیس شکایت کرد! OpenAI در سال ۲۰۱۵ به عنوان سازمان غیرانتفاعی (Non-Profit) با هدف توسعه سیستم‌های هوش‌مصنوعی اپن سورس و منتفع ساختن بشر از قابلیت‌های این تکنولوژی با همراهی تعدادی از متخصصان و افراد سرشناس از جمله ایلان ماسک و سم آلتمن تاسیس شد. در بدو تاسیس این کمپانی ایلان ماسک یکی از حمایت‌کنندگان اصلی OpenAI بود. اما در سال ۲۰۱۸ به خاطر تضاد منافع با تسلا از موقعیت خود استعفا داد و از OpenAI جدا شد. در سال ۲۰۱۹ این کمپانی تغییر رویه داده و از سازمان غیرانتفاعی به انتفاعی تبدیل شد. در همین سال با جذب سرمایه هنگفت از سمت مایکروسافت فصل جدیدی را آغاز کرد که در حال حاضر نتیجه آن را با معرفی محصولاتی نظیر ChatGPT، DALL E و Sora مشاهده می‌کنیم. در سال‌های اخیر همواره OpenAI به خاطر سیاست‌های بسته خود مورد انتقاد قرار گرفته است.

#openai
#sam_altman
#elon_musk

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
اولین دموی همکاری OpenAI و Figure

تنها حدود دو هفته بعد از شروع سرمایه‌گذاری OpenAI در Figure نتیجه همکاری این دو کمپانی به نمایش گذاشته شد. ربات Figure با استفاده از مدل VLM شرکت OpenAI توانایی درک زبان (Language Understanding) و استدلال بینایی (Visual Reasoning) پیدا کرده است! همان‌طور که در این ویدئو نمایش داده شده این مدل در پاسخ به گرسنه بودن کاربر به درستی از میان اشیای مختلف روی میز سیب را به وی تعارف می‌کند. همچنین می‌تواند اشیای روی میز را تشخیص داده و به درستی مرتب کند. مدل‌های VLM (Vision Language Model) توانایی تحلیل دیتای بصری را دارند.

#figure
#openai
#robotics

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
پاسخ مدل GTP-4 در آپدیت جدید کوتاه‌تر و مفیدتر شده است. در این ویدئو سکشن سمت چپ پاسخ نسخه جدید و سکسشن سمت راست پاسخ نسخه قبلی است.

#gpt4
#chatgpt
#openai

@dumannewsletter
معرفی نسخه جدید GPT-4 توسط OpenAI

نسخه GPT-4o توسط OpenAI معرفی شد. این نسخه یک مدل چند وجهی (Multimodal) بوده که می‌تواند انواع دیتای متنی، صوتی و ویدئویی را پردازش کند و عملکرد به مراتب بهتری نسبت به نسخه قبلی (GPT-4T) از خود نشان دهد. این نسخه به طور متوسط با ۳۲۰ میلی ثانیه تاخیر به ورودی صوتی پاسخ می‌‌ دهد که مشابه زمان پاسخ‌دهی انسان در یک مکالمه عادی است. در نسخه‌‌های قبلی ورودی صوتی ابتدا به متن تبدیل شده و پس از آماده شدن پاسخ، متن خروجی به صوت تبدیل می‌‌شد. این فرآیند پاسخ‌دهی مدل را کند کرده و باعث از دست رفتن اطلاعات در این پروسه می‌‌‌‌‌‌‌‌‌‌‌‌شد. اما نسخه جدید از ابتدا به صورت چند وجهی آموزش داده شده و می‌‌تواند ورودی صوتی را مستقیم دریافت کرده و با خروجی صوتی پاسخ دهد. نسخه GPT-4o در متون انگلیسی و کد عملکرد مشابه نسخه Turbo داشته ولی در متون غیر انگلیسی عملکرد به مراتب بهتری نسبت به آن دارد. همچنین سرعت پاسخ دهی آن افزایش پیدا کرده و هزینه استفاده از APIهای آن تا ۵۰ درصد کاهش پیدا کرده است.

#openai
#gpt4o
#gpt4

@dumannewsletter
همکاری Reddit و OpenAI

طبق این همکاری OpenAI دسترسی برخط (real-time) به محتوای Reddit خواهد داشت و در عوض Reddit نیز از سرویس‌‌های OpenAI برای ارائه قابلیت‌های جدید هوش‌مصنوعی به کاربرانش استفاده خواهد کرد. پلتفرم‌های Q&A یکی از مهم ترین منابع آموزش مدل‌های زبانی می‌باشند.

#reddit
#openai

@dumannewsletter
ایلیا سوتسکور (Ilya Sutskever) از موسسان OpenAI و دانشمندان برجسته حوزه هوش‌مصنوعی از این کمپانی جدا شد. طبق شنیده‌ها ایلیا در ماجرای اخراج سم آلتمن نقش مهی داشت. بعد از بازگشت سم آلتمن به مدیریت OpenAI و تغییر هیئت مدیره تا مدت‌ها در مورد موقعیت ایلیا در OpenAI گمانه‌زنی می‌شد تا اینکه خبر استفای او به صورت رسمی اعلام شد (توئیت ایلیا).
ایلیا در وسط این جمع قرار دارد.

مطالعه این مقاله پیشنهاد می‌شود:
👈ماجرای اخراج غیرمنتظره سم‌آلتمن مدیرعامل OpenAI!

#openai
#ilya_sutskever

@dumannewsletter
خبرنامه هوش مصنوعی دومان
همکاری Reddit و OpenAI طبق این همکاری OpenAI دسترسی برخط (real-time) به محتوای Reddit خواهد داشت و در عوض Reddit نیز از سرویس‌‌های OpenAI برای ارائه قابلیت‌های جدید هوش‌مصنوعی به کاربرانش استفاده خواهد کرد. پلتفرم‌های Q&A یکی از مهم ترین منابع آموزش مدل‌های…
همکاری OpenAI و Stackoverflow

در هفته‌های گذشته همکاری مشابهی بین OpenAI و Stackoverflow آغاز شد. طبق این همکاری پلتفرم محبوب Stackoverflow از مدل‌های OpenAI برای توسعه محصول OverflowAI خود استفاده خواهد کرد و OpenAI نیز به محتوای منتشر شده در این پلتفرم Q&A دسترسی خواهد داشت (منبع).
مطالعه این مقاله پیشنهاد می‌شود:

👈 تلاش Stackoverflow برای بقا در تلاطم هوش‌مصنوعی

#openai
#stackoverflow

@dumannewsletter
خبرنامه هوش مصنوعی دومان
معرفی نسخه جدید GPT-4 توسط OpenAI نسخه GPT-4o توسط OpenAI معرفی شد. این نسخه یک مدل چند وجهی (Multimodal) بوده که می‌تواند انواع دیتای متنی، صوتی و ویدئویی را پردازش کند و عملکرد به مراتب بهتری نسبت به نسخه قبلی (GPT-4T) از خود نشان دهد. این نسخه به طور متوسط…
سم آلتمن مدیرعامل OpenAI بعد از انتشار نسخه جدید ChatGPT با یادآوری فیلم her در پلتفرم X به نوعی دیدگاه خود درباره این نسخه را مطرح کرد.
او (به انگلیسی: Her) فیلمی در گونه کمدی-درام رمانتیکاست که اسپایک جونز نویسندگی و کارگردانی آن را بر عهده داشته‌است. در این فیلم ستارگانی چون واکین فینیکس، امی آدامز، رونی مارا، اولیویا وایلد و اسکارلت جوهانسون (صداپیشه سامانتا) حضور دارند. داستان فیلم در سالهای مابین ۲۰۱۷ تا ۲۰۷۷ اتفاق می‌افتد. محوریت داستان در مورد مردی است که با یک سیستم‌عامل هوشمند رایانه‌ای که دارای صدا و شخصیت یک زن است رابطه عاطفی برقرار می‌کند (ویکی پدیا).

#sam_altman
#openai
#gpt4o

@dumannewsletter
انتشار نسخه ارزان GPT-4o mini

شرکت OpenAI ارزان‌ترین مدل کارآمد خود را با نام GPT-4o mini منتشر کرد. قیمت دسترسی به APIهای این مدل ۱۵ سنت به ازای یک میلیون توکن ورودی و ۶۰ سنت به ازای یک میلیون توکن خروجی است (سایز ورودی و خروجی ریکوئست در محاسبه هزینه مدل‌های زبانی لحاظ می‌شود). تا قبل از معرفی این نسخه ارزان‌ترین مدل OpenAI نسخه GPT-3.5 Turbo بود. به این ترتیب با معرفی GPT-4o mini ارزان‌ترین مدل OpenAI حدود ۶۰ درصد ارزان‌تر شده است! ضمن کاهش قابل توجه هزینه، بهره‌وری نسخه GPT-4o mini در بنچ‌مارک‌های مختلف از نسخه GPT-3.5 Turbo بهتر است. قرار است در آینده نزدیک فرم‌های مختلف دیتا نیز توسط GPT-4o mini ساپورت شود. سایز Context Window آن ۱۲۸ کیلوبایت بوده و دیتای استفاده شده برای آموزش آن تا اکتبر ۲۰۲۳ به روز بوده است. این کاهش هزینه امکان استفاده از مدل‌های زبانی را در اپلیکیشن‌های بیشتری میسر می‌سازد (جزئیات بیشتر).

#openai
#gpt4o
#gpt4o_mini
#هوش_مصنوعی

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
شرکت OpenAI پروتوتایپ موتور جستجوی خود را با نام SearchGPT معرفی کرد. برای استفاده از این سرویس از اینجا در لیست انتظار ثبت نام کنید. با توجه به سرمایه‌گذاری مایکروسافت در OpenAI و همکاری این دو شرکت انتظار می‌رود این محصول بسیار مشابه موتور جستجوی Bing باشد.

#openai
#searchgpt

@dumannewsletter
انتشار مدل جدید OpenAI

کمپانی OpenAI مدل جدیدی را با نام OpenAI o1 معرفی کرد. قبلاً اطلاعات اندکی از این مدل تحت عنوان Project Strawberry/Q* درز کرده بود. فعلاً این مدل در دسترس کاربران تیمی و پلاس ChatGPT قرار گرفته است. OpenAI o1 نسبت به مدل‌های GPT این کمپانی در حل مسائل ریاضی و چالش‌های برنامه‌نویسی عملکرد بهتری دارد. به عنوان نمونه مدل GPT-4o تنها به ۱۳ درصد سوالات المپیاد جهانی ریاضی پاسخ داده در حالی‌که این مدل جدید ۸۳ درصد سوالات را به درستی پاسخ داده است. طبق ادعای OpenAI این مدل قبل از پاسخ دادن زمان بیشتری را برای فکر کردن صرف کرده و راه‌حل‌های مختلف و اشتباهات آن‌ها را ارزیابی می‌کند، به همین جهت عملکرد بهتری برای استدلال‌های پیچیده دارد. در این ویدئو مدل OpenAI o1 برای حل چالش برنامه‌نویسی دمو شده است. همچنین در این تصویر OpenAI o1 با GPT-4o در بنچ‌مارک‌های مختلف مقایسه شده است.
برای مطالعه جزئیات بیشتر اینجا را بخوانید.

#openai
#openai_o1

@dumannewsletter