خبرنامه هوش مصنوعی دومان
712 subscribers
262 photos
180 videos
2 files
303 links
ابزار، نوآوری‌ها و اخبار هوش مصنوعی و رباتیک

📌 ارتباط با من:

dumannewsletter@gmail.com

📌 لینک Boost کانال:

https://t.me/dumannewsletter?boost

📌 آرشیو وبسایت (به روز نمی‌شود):

duman.pouyae.ir

#هوش_مصنوعی
#رباتیک
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
معرفی اپلیکیشن Lookout گوگل برای افراد کم‌بینا و نابینا

اپلیکیشن Lookout گوگل به افراد کم‌بینا و نابینا با استفاده از ماشین‌بینایی و هوش‌مصنوعی مولد کمک می‌کند. این اپلیکیشن دارای قابلیتی به نام Image Q&A است که امکان پرسش و پاسخ حول یک تصویر را از طریق صدا برای کاربر فراهم می‌سازد. به عنوان مثال کاربر می‌تواند از محیط عکس گرفته و آن را در اپلیکیشن آپلود کند و سپس درباره چیزهایی که در تصویر موجود بوده و جزئیاتی نظیر رنگ سوال پرسیده و پاسخ اپلیکیشن درباره سوال خود را بشنود. برای دسترسی به این اپلیکیشن اینجا را ببینید.

#lookout_app
#google
#accessibility

@dumannewsletter
به‌روزرسانی‌های گوگل بارد (جمینای)

- گوگل نام سرویس هوش‌مصنوعی بارد را به جمینای تغییر داد. سرویس بارد بعد از معرفی ChatGPT برای رقابت با آن معرفی شد ولی در آن زمان اقبال چندانی پیدا نکرد. پس از این ماجرا گوگل برای حفظ موقعیت خود در بازار مدل قدرتمندی به نام جمینای (Gemini) را منتشر کرد. سپس به مرور از نسخه Pro این مدل در سرویس بارد استفاده کرد و آن را برای ۴۰ زبان مختلف در ۲۳۰ کشور در دسترس قرار داد.
- نسخه Ultra مدل جمینای در دسترس قرار گرفت. مدل جمینای در سه نسخه Nano، Pro و Ultra معرفی شده بود ولی انتشار عمومی نسخه Ultra در آن زمان به بعد موکول شده بود. نسخه Nano برای تلفن همراه، نسخه Pro برای کاربردهای معمولی و نسخه Ultra برای کاربردهای پیچیده‌تر طراحی شده است. برای دسترسی به Ultra باید اشتراک ماهانه پرداخت کنید ولی Pro از اینجا در دسترس است.
- جمینای در تلفن‌های همراه آیفون و اندرویدی نیز در دسترس قرار گرفته است. برای نصب آن در اندروید به اینجا مراجعه کنید. در آیفون نیز طی روزهای آینده از طریق گوگل اپ در دسترس قرار خواهد گرفت.

👈 معرفی Gemini

#google
#gemini

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
نسخه Gemini Pro 1.5 معرفی شد.

نسخه 1.5 سرویس هوش‌مصنوعی گوگل با نام Gemini Pro به صورت محدود برای تست در دسترس عده محدودی از کاربران قرار گرفته است. این نسخه توانایی دریافت ۱ میلیون توکن را به عنوان ورودی دارد! (هر توکن را معادل یک لغت در نظر بگیرید). سایز ورودی مدل‌های هوش‌مصنوعی با عنوان سایز Context Window معرفی می‌شود. هر چقدر این مقدار بیشتر باشد، امکان دریافت ورودی‌های بزرگ نظیر یک کتاب قطور نیز برای آن فراهم می‌شود. قابل ذکر است که سایز Context Windows در آخرین نسخه مدل GPT-4 برابر ۱۲۸ هزار توکن است. ۱ میلیون توکن معادل یک ساعت ویدئو، ۱۱ ساعت صوت، بیش از ۳۰ هزار خط کد و بیش از ۷۰۰ هزار لغت است(منبع خبر)!

#gemini
#google

@dumannewsletter
معرفی مدل‌های اپن‌سورس Gemma توسط Google DeepMind

گوگل DeepMind مجموعه‌از مدل‌های سبک را با نام Gemma به صورت اپن‌سورس منتشر کرد. طبق گفته DeepMind این مدل با استفاده از تکنولوژی و نتایج تحقیقاتی جمینای (Gemini) توسعه داده شده است. در حال حاضر دو نسخه از این مدل زبانی کوچک (SLM) با سایزهای 2B و 7B منتشر شده است. هر سایز نیز در نسخه‌های Instruction Tuned (IT) و (PT) Pre Trained موجود است. طبق نتایج منتشر شده نسخه 7B در بنچ‌مارک‌های مختلف عملکرد بهتری از نسخه‌های 7B و 13B مدل Llama2 داشته است. مدل‌های Gemma را می‌توان در کامپیوتر شخصی به صورت لوکال اجرا کرده و مشکلی بابت منابع پردازشی نداشت.

👈 برای مطالعه ادامه مطلب اینجا را بخوانید.

#google
#deepmind
#gemma

@dumannewsletter
گوگل امکان تولید تصویر انسان در جمینای را برای مدتی غیر فعال کرد.
براساس تصاویر منتشر شده در شبکه‌های اجتماعی مدل Imagen گوگل که برای تولید تصاویر در جمینای مورد استفاده قرار می‌گرفته بیش از اندازه به diversity اهمیت داده و این موضوع باعث تولید تصاویر اشتباه از انسان در کشورها، برهه‌های زمانی و موقعیت‌های مختلف شده است. یکی از چالش‌های مدل‌های هوش‌مصنوعی بایاس بودن آن به موضوعاتی نظیر جنسیت و نژاد است به‌همین جهت برای جلوگیری از این بایاس‌ها تغییراتی در مدل داده می‌شود. اما همان‌طور که در تصاویر مشخص شده، در مورد گوگل این تغییرات بیش از اندازه بوده است. طبق اعلام گوگل، بعد از اصلاح این مشکل دوباره امکان تولید تصویر انسان در جمینای در دسترس قرار خواهد گرفت.

#google
#gemini

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
مدل جدید گوگل برای تولید بازی!

گوگل مدل جدیدی به نام Genie را برای تولید بازی ویدئویی تعاملی معرفی کرد. این مدل می‌تواند محیط جدیدی را خلق کرده که کاربر می‌تواند کاراکتر اصلی آن را حرکت داده و کنترل کند. این مدل، یک مدل پایه (Foundation Model) بوده که با ویدئوهای بدون لیبل آموزش داده شده است. در حال حاضر Genie به صورت عمومی در دسترس قرار نگرفته است. برای مطالعه جزئیات فنی اینجا را بخوانید.

#genie
#google

@dumannewsletter
گوگل DeepMind ایجنت هوش مصنوعی SIMA را برای بازی‌های ویدئویی معرفی کرد. این ایجنت تنها با دستورات متنی و تصاویر محیط روی بازی‌های مختلف آموزش داده شده و با بیش از ۱۵۰۰ تسک مختلف در دسته‌هایی نظیر جهت‌یابی، تعامل با اشیا و جمع‌آوری منابع مورد ارزیابی قرار گرفته است. طبق نتایج این ایجنت عملکرد مشابه انسان داشته است. از چنین مدل‌هایی می‌توان برای پیاده‌سازی NPC در بازی‌های ویدئویی استفاده کرد. حتی در آینده با فراهم شدن زیرساخت‌های مورد نیاز امکان تعامل ربات و انسان در محیط‌های واقعی نیز دور از انتظار نخواهد بود(منبع).

#deepmind
#google
#sima

@dumannewsletter
اپل در حال مذاکره با گوگل و مایکروسافت برای استفاده از مدل‌های هوش‌مصنوعی این دو کمپانی درتلفن‌های همراه آیفون است. قرار است از این مدل‌ها برای قابلیت‌های هوش‌مصنوعی مولد نظیر تولید متن، ویرایش تصاویر و ویدئوها استفاده شود. هنوز جزئیات بیشتری از این مذاکرات منتشر نشده است. گوگل و مایکروسافت در ماه‌های اخیر در رقابت تنگاتنگی بوده‌اند، همکاری هر کدام از این دو کمپانی با اپل برگ برنده‌ای در این رقابت خواهد بود. قابل ذکر است که گوگل اخیراً به خاطر قرارداد انحصاری موتور جستجوی پیش‌فرض در آیفون مورد انتقاد قرار گرفته و یک پرونده قضایی به خاطر انحصار علیه آن در جریان است (منبع).

#apple
#google
#microsoft

@dumannewsletter
معرفی مربی فوتبال توسط گوگل DeepMind

گوگل DeepMind مدل جدیدی به نام TacticAI را برای پیش‌بینی نتیجه کرنر در بازی فوتبال معرفی کرد. این مدل با همکاری باشگاه لیورپول توسعه داده شده است. در این مدل هر بازیکن به منزله یک نود در گراف بوده که با استفاده از Graph Neural Network براساس موقعیت بازیکن‌های هر دو تیم نتیجه کرنر را پیش‌بینی می‌کند (منبع).

#tacticai
#google
#deepmind

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
نسخه ۲ مدل Imagen گوگل DeepMind در آپدیت جدید می‌تواند متن را به ویدئوی کوتاه ۴ ثانیه‌ای تبدیل کند. این مدل از تکنولوژی Diffusion استفاده کرده و برای مشخص کردن محتوای تولید شده توسط AI از SynthID استفاده می‌کند (منبع).

#imagen
#google

@dumannewsletter
ساخت پردازنده‌‌های اختصاصی توسط کمپانی‌های بزرگ

با سودآوری حیرت‌انگیز کمپانی NVIDIA در موج هوش‌مصنوعی کمپانی‌های بزرگ تلاش‌ها برای ساخت پردازنده‌‌های اختصاصی را بیشتر کرده‌اند. در روزهای اخیر شاهد معرفی پردازنده ARM-based جدید توسط گوگل با نام Google Axion و نسخه جدید تراشه MTIA توسط متا بوده‌ایم. علاوه بر گوگل و متا کمپانی‌های بزرگ دیگری نظیر آمازون و IBM نیز در این زمینه در حال توسعه و پیشرفت هستند.

👈 برای آشنایی بیشتر با تراشه گوگل اینجا را بخوانید.
👈 برای آشنایی بیشتر با تراشه متا اینجا را بخوانید.

#meta
#google
#chip

@dumannewsletter
نسخه ۳ آلفافولد (AlphaFold) توسط گوگل DeepMind معرفی شد!

نسخه ۳ مدل‌ هوش‌‌مصنوعی AlphaFold با همکاری گوگل DeepMind و Isomorphic Labs توسعه داده شده است. این مدل برای پیش‌بینی ساختار مولکول‌های پروتئین، DNA، RNA و سایر اجزای بیولوژیکی سازنده حیات و نحوه تعامل آن‌ها به کار می‌رود. مهم‌ترین کاربرد این مدل کشف داروهای جدید و نحوه عملکرد آن بر روی انسان است. نسخه ۲ این مدل در سال ۲۰۲۰ معرفی شد و برای کشف واکسن مالاریا، داروهای سرطان و طراحی آنزیم مورد استفاده قرار گرفت. AlphaFold 3 از تمامی نمونه‌های مشابه عملکرد بهتر و دقیق‌تری دارد و از اینجا در دسترس محققان دنیا قرار گرفته است. گوگل نحوه استفاده از این مدل قدرتمند هوش‌مصنوعی را در قالب یک کورس در اینجا آموزش داده است. علاوه بر این، گوگل ساختار بیش از ۲۰۰ میلیون مولکول پروتئین را که با استفاده از پروژه AlphaFold استخراج شده به صورت رایگان در اینجا در دسترس عموم قرار داده است (منبع).

#google
#deepmind
#alphafold
#isomorphic_labs

@dumannewsletter