خبرنامه هوش مصنوعی دومان
712 subscribers
262 photos
180 videos
2 files
303 links
ابزار، نوآوری‌ها و اخبار هوش مصنوعی و رباتیک

📌 ارتباط با من:

dumannewsletter@gmail.com

📌 لینک Boost کانال:

https://t.me/dumannewsletter?boost

📌 آرشیو وبسایت (به روز نمی‌شود):

duman.pouyae.ir

#هوش_مصنوعی
#رباتیک
Download Telegram
گوگل DeepMind را برای رقابت با ChatGPT به میدان می‌فرستد!

اخیراً Demis Hassabis مدیرعامل DeepMind اعلام کرد که این شرکت مدل LLM جدیدی به نام Gemini را منتشر می‌کند که با ChatGPT رقابت کرده و حتی از آن برتری خواهد داشت. طبق این خبر Gemini علاوه‌بر تحلیل متن توانایی حل مساله را نیز دارد. به نظر می‌رسد مدیران گوگل رضایت کافی از انتشار چت‌بات Bard را نداشته‌ و می‌خواهند با ایده جدید وارد میدان رقابت شوند. به گفته Demis Hassabis استفاده از یادگیری تقویتی در Gemini منجر به بهبود این مدل در اجرای دستوراتی شده است که مدل‌های معمولی LLM در اجرای آن به چالش می‌خورند.

👈 برای جزئیات بیشتر به این لینک مراجعه کنید.

#google
#deepmind
#gemini

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
رقیب GPT-4 توسط گوگل منتشر شد | معرفی Gemini

بالاخره بعد از مدت‌ها انتظار گوگل قدرتمندترین مدل هوش‌مصنوعی خود به نام Gemini (با تلفظ جمینای) را منتشر کرد. این مدل توانایی درک دیتا به شکل‌های مختلف متن، کد، تصویر، ویدئو و صوت را دارد. از این رو اصطلاحاً یک multimodal (مولتی مدال) نامیده می‌شود. نسخه 1.0 مدل Gemini در سه سایز مختلف بهینه شده است: نسخه Nano برای گوشی‌های هوشمند، نسخه Pro برای اجرای گستره‌ای از تسک‌های مختلف و نسخه Ultra برای اجرای تسک‌های بسیار پیچیده. بنابر گزارش فنی منتشر شده، نسخه Gemini Ultra در ۳۰ مورد از ۳۲ بنچمارک‌ معتبر از مدل GPT-4 بهتر عمل کرده است. در حال حاضر از نسخه Pro در چت‌بات بارد استفاده شده و قرار است به زودی در مجموعه‌ای از محصولات گوگل نیز مورد بهره‌برداری قرار بگیرد. نسخه Nano نیز در گوشی پرچم‌دار پیکسل ۸ به صورت آفلاین مورد استفاده قرار می‌گیرد و قرار است ابتدای سال بعد نسخه Ultra با معرفی Bard Advanced در اختیار علاقه‌مندان قرار بگیرد.

👈 برای مطالعه جزئیات بیشتر کلیک کنید.

#gemini
#google

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
قابلیت‌های جدید پیکسل ۸ با استفاده از Gemini Nano

گوگل با بروزرسانی پیکسل ۸ مجموعه‌ای از قابلیت‌های هوش‌مصنوعی را برای کاربران این گوشی پرچم‌دار معرفی کرد. در این بروزرسانی از مدل Gemini Nano استفاده شده است. این مدل اخیراً توسط گوگل برای فراهم کردن قابلیت‌های هوش‌مصنوعی مولد به صورت آفلاین در گوشی‌های اندرویدی معرفی شد. خلاصه کردن صوت به صورت متن، ارائه پاسخ پیشنهادی در Gboard و بهبود کیفیت عکس و ویدئو از جمله این قابلیت‌ها است.

👈 برای آشنایی بیشتر درباره Gemini اینجا را بخوانید.

#gemini
#pixel
#google

@dumannewsletter
به‌روزرسانی‌های گوگل بارد (جمینای)

- گوگل نام سرویس هوش‌مصنوعی بارد را به جمینای تغییر داد. سرویس بارد بعد از معرفی ChatGPT برای رقابت با آن معرفی شد ولی در آن زمان اقبال چندانی پیدا نکرد. پس از این ماجرا گوگل برای حفظ موقعیت خود در بازار مدل قدرتمندی به نام جمینای (Gemini) را منتشر کرد. سپس به مرور از نسخه Pro این مدل در سرویس بارد استفاده کرد و آن را برای ۴۰ زبان مختلف در ۲۳۰ کشور در دسترس قرار داد.
- نسخه Ultra مدل جمینای در دسترس قرار گرفت. مدل جمینای در سه نسخه Nano، Pro و Ultra معرفی شده بود ولی انتشار عمومی نسخه Ultra در آن زمان به بعد موکول شده بود. نسخه Nano برای تلفن همراه، نسخه Pro برای کاربردهای معمولی و نسخه Ultra برای کاربردهای پیچیده‌تر طراحی شده است. برای دسترسی به Ultra باید اشتراک ماهانه پرداخت کنید ولی Pro از اینجا در دسترس است.
- جمینای در تلفن‌های همراه آیفون و اندرویدی نیز در دسترس قرار گرفته است. برای نصب آن در اندروید به اینجا مراجعه کنید. در آیفون نیز طی روزهای آینده از طریق گوگل اپ در دسترس قرار خواهد گرفت.

👈 معرفی Gemini

#google
#gemini

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
نسخه Gemini Pro 1.5 معرفی شد.

نسخه 1.5 سرویس هوش‌مصنوعی گوگل با نام Gemini Pro به صورت محدود برای تست در دسترس عده محدودی از کاربران قرار گرفته است. این نسخه توانایی دریافت ۱ میلیون توکن را به عنوان ورودی دارد! (هر توکن را معادل یک لغت در نظر بگیرید). سایز ورودی مدل‌های هوش‌مصنوعی با عنوان سایز Context Window معرفی می‌شود. هر چقدر این مقدار بیشتر باشد، امکان دریافت ورودی‌های بزرگ نظیر یک کتاب قطور نیز برای آن فراهم می‌شود. قابل ذکر است که سایز Context Windows در آخرین نسخه مدل GPT-4 برابر ۱۲۸ هزار توکن است. ۱ میلیون توکن معادل یک ساعت ویدئو، ۱۱ ساعت صوت، بیش از ۳۰ هزار خط کد و بیش از ۷۰۰ هزار لغت است(منبع خبر)!

#gemini
#google

@dumannewsletter
گوگل امکان تولید تصویر انسان در جمینای را برای مدتی غیر فعال کرد.
براساس تصاویر منتشر شده در شبکه‌های اجتماعی مدل Imagen گوگل که برای تولید تصاویر در جمینای مورد استفاده قرار می‌گرفته بیش از اندازه به diversity اهمیت داده و این موضوع باعث تولید تصاویر اشتباه از انسان در کشورها، برهه‌های زمانی و موقعیت‌های مختلف شده است. یکی از چالش‌های مدل‌های هوش‌مصنوعی بایاس بودن آن به موضوعاتی نظیر جنسیت و نژاد است به‌همین جهت برای جلوگیری از این بایاس‌ها تغییراتی در مدل داده می‌شود. اما همان‌طور که در تصاویر مشخص شده، در مورد گوگل این تغییرات بیش از اندازه بوده است. طبق اعلام گوگل، بعد از اصلاح این مشکل دوباره امکان تولید تصویر انسان در جمینای در دسترس قرار خواهد گرفت.

#google
#gemini

@dumannewsletter
تیم Project Zero گوگل با استفاده از فریم ورک Big Sleep یک آسیب‌پذیری روز صفر (zero day) در SQLite پیدا کرد. این آسیب‌پذیری از نوع stack buffer underflow بوده و با استفاده از ابزارهای مرسوم نظیر Fuzzer قبلاً پیدا نشده بود. فریم‌ورک Big Sleep با استفاده از مدل‌های بزرگ زبانی به دنبال آسیب‌پذیری‌های روز صفر در سورس کد می‌گردد. این پروژه توسط تیمی از متخصصان امنیتی گوگل در ادامه پروژه Naptime توسعه داده شده است. برای پیدا کردن این آسیب‌پذیری از مدل Gemini Pro استفاده شده است. برای توضیحات فنی بیشتر اینجا را بخوانید.

#google
#gemini
#project_zero

@dumannewsletter