معرفی نسخه جدید GPT-4 توسط OpenAI
نسخه GPT-4o توسط OpenAI معرفی شد. این نسخه یک مدل چند وجهی (Multimodal) بوده که میتواند انواع دیتای متنی، صوتی و ویدئویی را پردازش کند و عملکرد به مراتب بهتری نسبت به نسخه قبلی (GPT-4T) از خود نشان دهد. این نسخه به طور متوسط با ۳۲۰ میلی ثانیه تاخیر به ورودی صوتی پاسخ می دهد که مشابه زمان پاسخدهی انسان در یک مکالمه عادی است. در نسخههای قبلی ورودی صوتی ابتدا به متن تبدیل شده و پس از آماده شدن پاسخ، متن خروجی به صوت تبدیل میشد. این فرآیند پاسخدهی مدل را کند کرده و باعث از دست رفتن اطلاعات در این پروسه میشد. اما نسخه جدید از ابتدا به صورت چند وجهی آموزش داده شده و میتواند ورودی صوتی را مستقیم دریافت کرده و با خروجی صوتی پاسخ دهد. نسخه GPT-4o در متون انگلیسی و کد عملکرد مشابه نسخه Turbo داشته ولی در متون غیر انگلیسی عملکرد به مراتب بهتری نسبت به آن دارد. همچنین سرعت پاسخ دهی آن افزایش پیدا کرده و هزینه استفاده از APIهای آن تا ۵۰ درصد کاهش پیدا کرده است.
#openai
#gpt4o
#gpt4
@dumannewsletter
نسخه GPT-4o توسط OpenAI معرفی شد. این نسخه یک مدل چند وجهی (Multimodal) بوده که میتواند انواع دیتای متنی، صوتی و ویدئویی را پردازش کند و عملکرد به مراتب بهتری نسبت به نسخه قبلی (GPT-4T) از خود نشان دهد. این نسخه به طور متوسط با ۳۲۰ میلی ثانیه تاخیر به ورودی صوتی پاسخ می دهد که مشابه زمان پاسخدهی انسان در یک مکالمه عادی است. در نسخههای قبلی ورودی صوتی ابتدا به متن تبدیل شده و پس از آماده شدن پاسخ، متن خروجی به صوت تبدیل میشد. این فرآیند پاسخدهی مدل را کند کرده و باعث از دست رفتن اطلاعات در این پروسه میشد. اما نسخه جدید از ابتدا به صورت چند وجهی آموزش داده شده و میتواند ورودی صوتی را مستقیم دریافت کرده و با خروجی صوتی پاسخ دهد. نسخه GPT-4o در متون انگلیسی و کد عملکرد مشابه نسخه Turbo داشته ولی در متون غیر انگلیسی عملکرد به مراتب بهتری نسبت به آن دارد. همچنین سرعت پاسخ دهی آن افزایش پیدا کرده و هزینه استفاده از APIهای آن تا ۵۰ درصد کاهش پیدا کرده است.
#openai
#gpt4o
#gpt4
@dumannewsletter
خبرنامه هوش مصنوعی دومان
معرفی نسخه جدید GPT-4 توسط OpenAI نسخه GPT-4o توسط OpenAI معرفی شد. این نسخه یک مدل چند وجهی (Multimodal) بوده که میتواند انواع دیتای متنی، صوتی و ویدئویی را پردازش کند و عملکرد به مراتب بهتری نسبت به نسخه قبلی (GPT-4T) از خود نشان دهد. این نسخه به طور متوسط…
کاهش تعداد توکن های خروجی یکی دیگر از آپدیت های این نسخه بوده است. این کاهش برای زبان فارسی ۱.۹ برابر است. نسخه GPT-4o در بنچ مارک های مختلف ادراک بینایی (Vision Understanding)، ترجمه صوت (Audio Translation) و ارزیابی متن عملکرد بسیار خوبی نسبت به مدلهای موجود در رقابت مدلهای زبانی از خود نشان داده است. در این ویدئوها عملکرد GPT-4o در تشخیص احساسات و مود کاربر از روی چهره و ترجمه همزمان انگلیسی و ایتالیایی را مشاهده میکنید. برای جزئیات بیشتر درباره این نسخه اینجا را بخوانید.
Openai
Hello GPT-4o
We’re announcing GPT-4 Omni, our new flagship model which can reason across audio, vision, and text in real time.
همکاری Reddit و OpenAI
طبق این همکاری OpenAI دسترسی برخط (real-time) به محتوای Reddit خواهد داشت و در عوض Reddit نیز از سرویسهای OpenAI برای ارائه قابلیتهای جدید هوشمصنوعی به کاربرانش استفاده خواهد کرد. پلتفرمهای Q&A یکی از مهم ترین منابع آموزش مدلهای زبانی میباشند.
#reddit
#openai
@dumannewsletter
طبق این همکاری OpenAI دسترسی برخط (real-time) به محتوای Reddit خواهد داشت و در عوض Reddit نیز از سرویسهای OpenAI برای ارائه قابلیتهای جدید هوشمصنوعی به کاربرانش استفاده خواهد کرد. پلتفرمهای Q&A یکی از مهم ترین منابع آموزش مدلهای زبانی میباشند.
#openai
@dumannewsletter
ایلیا سوتسکور (Ilya Sutskever) از موسسان OpenAI و دانشمندان برجسته حوزه هوشمصنوعی از این کمپانی جدا شد. طبق شنیدهها ایلیا در ماجرای اخراج سم آلتمن نقش مهی داشت. بعد از بازگشت سم آلتمن به مدیریت OpenAI و تغییر هیئت مدیره تا مدتها در مورد موقعیت ایلیا در OpenAI گمانهزنی میشد تا اینکه خبر استفای او به صورت رسمی اعلام شد (توئیت ایلیا).
ایلیا در وسط این جمع قرار دارد.
مطالعه این مقاله پیشنهاد میشود:
👈ماجرای اخراج غیرمنتظره سمآلتمن مدیرعامل OpenAI!
#openai
#ilya_sutskever
@dumannewsletter
ایلیا در وسط این جمع قرار دارد.
مطالعه این مقاله پیشنهاد میشود:
👈ماجرای اخراج غیرمنتظره سمآلتمن مدیرعامل OpenAI!
#openai
#ilya_sutskever
@dumannewsletter
نسخه ۳ آلفافولد (AlphaFold) توسط گوگل DeepMind معرفی شد!
نسخه ۳ مدل هوشمصنوعی AlphaFold با همکاری گوگل DeepMind و Isomorphic Labs توسعه داده شده است. این مدل برای پیشبینی ساختار مولکولهای پروتئین، DNA، RNA و سایر اجزای بیولوژیکی سازنده حیات و نحوه تعامل آنها به کار میرود. مهمترین کاربرد این مدل کشف داروهای جدید و نحوه عملکرد آن بر روی انسان است. نسخه ۲ این مدل در سال ۲۰۲۰ معرفی شد و برای کشف واکسن مالاریا، داروهای سرطان و طراحی آنزیم مورد استفاده قرار گرفت. AlphaFold 3 از تمامی نمونههای مشابه عملکرد بهتر و دقیقتری دارد و از اینجا در دسترس محققان دنیا قرار گرفته است. گوگل نحوه استفاده از این مدل قدرتمند هوشمصنوعی را در قالب یک کورس در اینجا آموزش داده است. علاوه بر این، گوگل ساختار بیش از ۲۰۰ میلیون مولکول پروتئین را که با استفاده از پروژه AlphaFold استخراج شده به صورت رایگان در اینجا در دسترس عموم قرار داده است (منبع).
#google
#deepmind
#alphafold
#isomorphic_labs
@dumannewsletter
نسخه ۳ مدل هوشمصنوعی AlphaFold با همکاری گوگل DeepMind و Isomorphic Labs توسعه داده شده است. این مدل برای پیشبینی ساختار مولکولهای پروتئین، DNA، RNA و سایر اجزای بیولوژیکی سازنده حیات و نحوه تعامل آنها به کار میرود. مهمترین کاربرد این مدل کشف داروهای جدید و نحوه عملکرد آن بر روی انسان است. نسخه ۲ این مدل در سال ۲۰۲۰ معرفی شد و برای کشف واکسن مالاریا، داروهای سرطان و طراحی آنزیم مورد استفاده قرار گرفت. AlphaFold 3 از تمامی نمونههای مشابه عملکرد بهتر و دقیقتری دارد و از اینجا در دسترس محققان دنیا قرار گرفته است. گوگل نحوه استفاده از این مدل قدرتمند هوشمصنوعی را در قالب یک کورس در اینجا آموزش داده است. علاوه بر این، گوگل ساختار بیش از ۲۰۰ میلیون مولکول پروتئین را که با استفاده از پروژه AlphaFold استخراج شده به صورت رایگان در اینجا در دسترس عموم قرار داده است (منبع).
#deepmind
#alphafold
#isomorphic_labs
@dumannewsletter
رقابت برای ساخت گجتهای پوشیدنی مبتنی بر AI
در این تصویر برندهای موجود برای هر نوع گجت پوشیدنی را مشاهده میکنید.
@dumannewsletter
در این تصویر برندهای موجود برای هر نوع گجت پوشیدنی را مشاهده میکنید.
@dumannewsletter
خبرنامه هوش مصنوعی دومان
همکاری Reddit و OpenAI طبق این همکاری OpenAI دسترسی برخط (real-time) به محتوای Reddit خواهد داشت و در عوض Reddit نیز از سرویسهای OpenAI برای ارائه قابلیتهای جدید هوشمصنوعی به کاربرانش استفاده خواهد کرد. پلتفرمهای Q&A یکی از مهم ترین منابع آموزش مدلهای…
همکاری OpenAI و Stackoverflow
در هفتههای گذشته همکاری مشابهی بین OpenAI و Stackoverflow آغاز شد. طبق این همکاری پلتفرم محبوب Stackoverflow از مدلهای OpenAI برای توسعه محصول OverflowAI خود استفاده خواهد کرد و OpenAI نیز به محتوای منتشر شده در این پلتفرم Q&A دسترسی خواهد داشت (منبع).
مطالعه این مقاله پیشنهاد میشود:
👈 تلاش Stackoverflow برای بقا در تلاطم هوشمصنوعی
#openai
#stackoverflow
@dumannewsletter
در هفتههای گذشته همکاری مشابهی بین OpenAI و Stackoverflow آغاز شد. طبق این همکاری پلتفرم محبوب Stackoverflow از مدلهای OpenAI برای توسعه محصول OverflowAI خود استفاده خواهد کرد و OpenAI نیز به محتوای منتشر شده در این پلتفرم Q&A دسترسی خواهد داشت (منبع).
مطالعه این مقاله پیشنهاد میشود:
👈 تلاش Stackoverflow برای بقا در تلاطم هوشمصنوعی
#openai
#stackoverflow
@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
تولید موسیقی با ElevenLabs 🎵
استارتاپ ElevenLabs سرویس جدید تولید موسیقی خود را دمو کرد. این سرویس هنوز در دسترس عموم قرار نگرفته است. موسیقی و متن آن کاملاً توسط AI تهیه شده است(منبع)!
#eleven_labs
@dumannewsletter
استارتاپ ElevenLabs سرویس جدید تولید موسیقی خود را دمو کرد. این سرویس هنوز در دسترس عموم قرار نگرفته است. موسیقی و متن آن کاملاً توسط AI تهیه شده است(منبع)!
Style: “Pop pop-rock, country, top charts song.”
#eleven_labs
@dumannewsletter
Forwarded from خبرنامه هوش مصنوعی دومان
مدلهای تولید موسیقی
با استفاده از مدلهای زیر میتوانید موسیقی موردنظر خود را شرح داده و خروجی تولید شده توسط آن را بشنوید.
1. MusicGen (Meta AI)
2. Stable Audio (Stability AI)
3. MusicFX (Google)
4. Suno
5. Udio
6. ElevenLabs (coming soon)
#musicgen
#stable_audio
#musicfx
#suno
#udio
#eleven_labs
@dumannewsletter
با استفاده از مدلهای زیر میتوانید موسیقی موردنظر خود را شرح داده و خروجی تولید شده توسط آن را بشنوید.
1. MusicGen (Meta AI)
2. Stable Audio (Stability AI)
3. MusicFX (Google)
4. Suno
5. Udio
6. ElevenLabs (coming soon)
#musicgen
#stable_audio
#musicfx
#suno
#udio
#eleven_labs
@dumannewsletter
خبرنامه هوش مصنوعی دومان
معرفی نسخه جدید GPT-4 توسط OpenAI نسخه GPT-4o توسط OpenAI معرفی شد. این نسخه یک مدل چند وجهی (Multimodal) بوده که میتواند انواع دیتای متنی، صوتی و ویدئویی را پردازش کند و عملکرد به مراتب بهتری نسبت به نسخه قبلی (GPT-4T) از خود نشان دهد. این نسخه به طور متوسط…
سم آلتمن مدیرعامل OpenAI بعد از انتشار نسخه جدید ChatGPT با یادآوری فیلم her در پلتفرم X به نوعی دیدگاه خود درباره این نسخه را مطرح کرد.
او (به انگلیسی: Her) فیلمی در گونه کمدی-درام رمانتیکاست که اسپایک جونز نویسندگی و کارگردانی آن را بر عهده داشتهاست. در این فیلم ستارگانی چون واکین فینیکس، امی آدامز، رونی مارا، اولیویا وایلد و اسکارلت جوهانسون (صداپیشه سامانتا) حضور دارند. داستان فیلم در سالهای مابین ۲۰۱۷ تا ۲۰۷۷ اتفاق میافتد. محوریت داستان در مورد مردی است که با یک سیستمعامل هوشمند رایانهای که دارای صدا و شخصیت یک زن است رابطه عاطفی برقرار میکند (ویکی پدیا).
#sam_altman
#openai
#gpt4o
@dumannewsletter
او (به انگلیسی: Her) فیلمی در گونه کمدی-درام رمانتیکاست که اسپایک جونز نویسندگی و کارگردانی آن را بر عهده داشتهاست. در این فیلم ستارگانی چون واکین فینیکس، امی آدامز، رونی مارا، اولیویا وایلد و اسکارلت جوهانسون (صداپیشه سامانتا) حضور دارند. داستان فیلم در سالهای مابین ۲۰۱۷ تا ۲۰۷۷ اتفاق میافتد. محوریت داستان در مورد مردی است که با یک سیستمعامل هوشمند رایانهای که دارای صدا و شخصیت یک زن است رابطه عاطفی برقرار میکند (ویکی پدیا).
#sam_altman
#openai
#gpt4o
@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
دموی آخرین وضعیت ربات چینی Unitree G1
قیمت پایه این ربات انساننما از ۱۶ هزار دلار آغاز میشود. ویدئوی این دمو به تقلید از نسخه جدید ربات اطلس ساخته شده است (توضیحات فنی).
- وزن: ۴۷ کیلوگرم
- قد: ۱۲۷ سانتیمتر
- عمر باتری: ۲ ساعت
#robotics
#unitree
#g1
@dumannewsletter
قیمت پایه این ربات انساننما از ۱۶ هزار دلار آغاز میشود. ویدئوی این دمو به تقلید از نسخه جدید ربات اطلس ساخته شده است (توضیحات فنی).
- وزن: ۴۷ کیلوگرم
- قد: ۱۲۷ سانتیمتر
- عمر باتری: ۲ ساعت
#robotics
#unitree
#g1
@dumannewsletter
خبرنامه هوش مصنوعی دومان
مدل Phi3 توسط مایکروسافت معرفی شد. نسخه ۳ مجموعه مدلهای زبانی Phi توسط مایکروسافت معرفی شد. این مدلها در دسته مدلهای زبانی کوچک یا SLM قرار گرفته و توانستهاند عملکرد قابل توجهی را از خود به نمایش بگذارند. نسخه ۳ با سه سایز مختلف به نامهای mini با ۳.۸…
مایکروسافت مدل Phi-3-vision را به مجموعه Phi-3 اضافه کرد. این مدل چند وجهی بوده و میتواند ورودیهای متنی و تصویری را دریافت کند. این مدل یک مدل کوچک با سایز ۴.۲ میلیارد پارامتر است. برای تست آن در Azure اینجا را مشاهده کنید (توضیحات بیشتر).
#phi
#microsoft
@dumannewsletter
#phi
#microsoft
@dumannewsletter
خبرنامه هوش مصنوعی دومان
گجت پوشیدنی Humane توسط دیزاینرهای سابق اپل معرفی شد. این گجت مشابه یک پین به لباس وصل شده و کاربر میتواند سوالات خود را از آن بپرسد. برای دستور دادن به این گجت باید روی آن ضربه زد. گجت Humane قابلیتهای هوشمصنوعی OpenAI را در اختیار کاربر قرار میدهد.…
بنابر گزارش بلومبرگ گجت پوشیدنی Humane که در زمان معرفی سر و صدای زیادی به همراه داشت به دنبال فروش سهام خود به ارزش ۷۵۰ میلیون الی یک میلیارد دلار است. این استارتاپ توانسته بود حدود ۲۳۰ میلیون دلار سرمایه از منابع مختلف جمعآوری کند. سم آلتمن مدیرعامل OpenAI نیز یکی از سرمایهگذاران این استارتاپ است. Humane ریویوها و کامنتهای منفی زیادی را در کامیونیتی دریافت کرده است. عدم کاربردی بودن، عدم اطمینان و اشتراک ماهانه از جمله نقدهای منفی این محصول است.
#humane
@dumannewsletter
#humane
@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
مارک اندرسون بنیانگذار موسسه مدیریت سرمایه a16z: توسعه رباتهای General Puprose (نظیر رباتهای انساننما) باعث میشود که هر کسی خدمتکار خانگی خود را داشته باشد و این موضوع منجر به فراهم شدن زمان برای سازندگی و خودشکوفایی شخص میشود.
The Future of the American Dream
#marc_andreessen
#robotics
@dumannewsletter
The Future of the American Dream
#marc_andreessen
#robotics
@dumannewsletter
نسخههای ۸ میلیارد و ۳۵ میلیارد پارامتری مجموعه مدلهای زبانی Aya 23 توسط Cohere به صورت اپنسورس منتشر شد. این مجموعه ۲۳ زبان مختلف از جمله فارسی را پوشش میدهد. برای مطالعه جزئیات فنی اینجا را بخوانید. برای تست نسخه 35B اینجا را مشاهده کنید.
#aya
#cohere
@dumannewsletter
#aya
#cohere
@dumannewsletter
Media is too big
VIEW IN TELEGRAM
حدود ده روز پیش گوگل در کنفرانس Google IO 24 مجموعهای از محصولات و آپدیتهای جدید خود در حوزه AI را معرفی کرد. مهمترین نکات این کنفرانس عبارتند از:
- یکپارچه شدن جمینای با محصولات مختلف گوگل به خصوص سرچ
- افزایش Context Window جمینای از ۱.۵ میلیون توکن به ۲ میلیون توکن
- معرفی ایجنت هوشمصنوعی Project Astra: چند وجهی بودن و Context Window بزرگ دو ویژگی مهم جمینای برای فراهم کردن توسعه چنین ایجنتهایی است.
- معرفی نسخه Gemini 1.5 Flash: این نسخه نسبت به Pro سبکتر است و هدف از معرفی آن کاهش هزینه و افزایش سرعت بوده است.
- معرفی مدل Veo برای تولید ویدئو از متن
- معرفی نسل جدید پردازندههای تریلیوم
- اضافه شدن مدل PhaliGemma به مجموعه Gemma و معرفی نسخه ۲ مجموعه Gemma در ماه ژوئن
#google
@dumannewsletter
- یکپارچه شدن جمینای با محصولات مختلف گوگل به خصوص سرچ
- افزایش Context Window جمینای از ۱.۵ میلیون توکن به ۲ میلیون توکن
- معرفی ایجنت هوشمصنوعی Project Astra: چند وجهی بودن و Context Window بزرگ دو ویژگی مهم جمینای برای فراهم کردن توسعه چنین ایجنتهایی است.
- معرفی نسخه Gemini 1.5 Flash: این نسخه نسبت به Pro سبکتر است و هدف از معرفی آن کاهش هزینه و افزایش سرعت بوده است.
- معرفی مدل Veo برای تولید ویدئو از متن
- معرفی نسل جدید پردازندههای تریلیوم
- اضافه شدن مدل PhaliGemma به مجموعه Gemma و معرفی نسخه ۲ مجموعه Gemma در ماه ژوئن
@dumannewsletter
دموی ایجنت هوشمصنوعی Project Astra
این ایجنت هوشمصنوعی توسط گوگل DeepMind با استفاده از مدلهای جمینای توسعه داده شده است. در این ویدئوها کار با این دستیار هوشمصنوعی با استفاده از عینک گوگل و تلفن همراه نمایش داده شده است. در یکی به حل مساله ریاضی کمک کرده و در دیگری به سوالات کاربر حول تصویر پاسخ میدهد (مشاهده نمونههای بیشتر).
#google
#deepmind
#project_astra
@dumannewsletter
این ایجنت هوشمصنوعی توسط گوگل DeepMind با استفاده از مدلهای جمینای توسعه داده شده است. در این ویدئوها کار با این دستیار هوشمصنوعی با استفاده از عینک گوگل و تلفن همراه نمایش داده شده است. در یکی به حل مساله ریاضی کمک کرده و در دیگری به سوالات کاربر حول تصویر پاسخ میدهد (مشاهده نمونههای بیشتر).
#deepmind
#project_astra
@dumannewsletter