خبرنامه هوش مصنوعی دومان
705 subscribers
222 photos
137 videos
2 files
265 links
ابزار، نوآوری‌ها و اخبار هوش مصنوعی و رباتیک

📌 ارتباط با من:

dumannewsletter@gmail.com
@pouyation

📌 لینک Boost کانال:

https://t.me/dumannewsletter?boost

📌 آرشیو وبسایت (به روز نمی‌شود):

duman.pouyae.ir

#هوش_مصنوعی
#رباتیک
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
ربات انسان‌نمای Figure قهوه درست می‌کند! ☕️

شرکت رباتیک Figure دقت و ظرافت ربات انسان‌نمای خود به نام Figure 01 را با تهیه یک لیوان قهوه در معرض نمایش گذاشت. ربات Figure 01 با ۱۰ ساعت ویدئو تهیه قهوه توسط انسان آموزش داده شده است.

#robotics
#figure

@dumannewsletter
انتشار فریم‌ورک MLX توسط اپل

تیم یادگیری ماشین اپل فریم‌ورک MLX را برای توسعه و استقرار ساده‌تر مدل‌های هوش‌مصنوعی در پردازنده‌های سری M اپل موسوم به Apple Silicon منتشر کرد. این فریم‌ورک برای پردازش‌های برداری در یادگیری ماشین با الهام از فریم‌ورک‌‌های مشابه نظیر Numpy و PyTorch طراحی شده است. برای جزئیات فنی بیشتر ریپوزیتوری گیت‌هاب این پروژه را از اینجا مشاهده کنید.

#apple
#mlx

@dumannewsletter
گزارش رویداد CES 2024 | معرفی محصولات جدید مبتنی بر هوش‌مصنوعی

نمایشگاه CES یکی از بزرگترین رویدادهای تکنولوژی در دنیاست که هر ساله با حضور کمپانی‌های تکنولوژی و علاقه‌مندان آن برگزار می‌شود. رویداد امسال CES 2024 در لاس‌وگاس آمریکا در حال برگزاری است (۹ الی ۱۲ ژانویه). امسال نیز مانند سال‌های گذشته نوآوری‌ها و محصولات جدید تکنولوژی معرفی شده است. همان‌طور که انتظار می‌رود، نقش هوش‌مصنوعی در این رویداد نیز پررنگ بوده و محصولات جدیدی مبتنی بر آن معرفی شده است. در این مقاله تعدادی از این محصولات معرفی شده است.
( تا پایان رویداد به روز می شود)

#ces2024
#ces

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
استفاده از ChatGPT در خودروهای فولکس‌واگن

فولکس‌واگن خودروساز بزرگ آلمانی اعلام کرد از فصل دوم سال جاری چت‌بات ChatGPT با دستیار صوتی ماشین‌های این کمپانی (IDA) یکپارچه خواهد شد. به این ترتیب قابلیت‌های این چت‌بات قدرتمند به تعامل بین خودرو و راننده کمک خواهد کرد. این یکپارچه‌سازی در ابتدا برای مشتریان اروپایی این کمپانی فعال خواهد شد.

#chatgpt
#volkswagen

@dumannewsletter
امروز GPT Store به صورت رسمی در دسترس قرار گرفت. کاربران OpenAI می‌توانند نسخه‌های کاستومایز شده خود از مدل هوش‌مصنوعی این کمپانی را در این استور برای فروش منتشر کنند. GPT Store در کنفرانس OpenAI Dev Day که در آبان ماه برگزار شد معرفی شده بود.

👈 مشاهده GPT Store
👈 گزارش کنفرانس OpenAI Dev Day

#openai
#gpt_store

@dumannewsletter
استفاده از هوش‌مصنوعی برای کاهش زمان کشف دارو

شرکت Isomorphic Labs در یک قرارداد به ارزش ۳ میلیارد دلار با شرکت‌های داروسازی Novartis و Eli Lilly می‌خواهد زمان کشف دارو را به نصف کاهش دهد. Isomorphic Labs توسط گوگل برای کشف دارو با استفاده از هوش‌مصنوعی در سال ۲۰۲۱ راه‌اندازی شده است. هوش‌مصنوعی با پیش‌بینی ترکیبات بیوشیمیایی، ترکیبات محتمل برای فراهم کردن اثرات مطلوب در بدن انسان را پیشنهاد می‌دهد. این موضوع می‌تواند کشف داروهای جدید را که فرآیندی زمان‌بر و پرهزینه بوده تسهیل کند.

#drug_discovery
#isomorphic_labs

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
معرفی مدل MagicVideo-V2 برای تولید ویدئو از متن

شرکت ByteDance (شرکت مادر TikTok) مدل جدیدی به نام MagicVideo-V2 را برای تولید ویدئوی کوتاه از متن معرفی کرد. این مدل در ابتدا یک تصویر با رزولوشن بالا تولید کرده و سپس از آن تصویر دنباله‌ای از حرکات را تهیه می‌کند.
برای دیدن نمونه‌های بیشتر و مقایسه آن با مدل‌های مشابه نظیر #pika اینجا را مشاهده کنید.

متن ویدئوی خرگوش چاق:

"A fat rabbit wearing a purple robe walking through a fantasy landscape."

#bytedance
#magicvideo

@dumannewsletter
معرفی گجت R1 | رویداد CES 2024

تولید گجت‌های همراهی که از قابلیت‌های هوش‌مصنوعی مولد بهره می‌برند در ماه‌های اخیر مورد توجه قرار گرفته است. شرکت Rabbit با معرفی گجت R1 در رویداد CES 2024 یکی از شرکت‌هایی است که وارد این حوزه شده است. اخیراً نیز معرفی #humane توجه زیادی را به خود جلب کرده بود. Rabbit R1 شبیه تلفن همراه بوده و برای انجام امور دیجیتالی با استفاده از هوش‌مصنوعی طراحی شده است. طبق گفته سازنده آن فعلاً قصد جایگزینی تلفن‌های همراه هوشمند را ندارد. این گجت همراه برای انجام اموری چون جستجو در اینترنت، پیدا کردن هتل برای سفر پیش‌رو و امثالهم مورد استفاده قرار می‌گیرد. استارتاپ Rabbit سازنده این گجت سال گذشته توانست ۳۰ میلیون دلار سرمایه جذب کند.

👈 جزئیات بیشتر از CES 2024 را اینجا شرح داده‌ام.

#rabbit
#ces2024

@dumannewsletter
معرفی مدل ReplaceAnything

شرکت علی‌بابا مدل جدیدی به نام ReplaceAnything را برای ویرایش تصاویر معرفی کرد. با استفاده از این مدل می‌توانید لباس شخص و یا پس زمینه تصویر را تغییر دهید. برای اینکار ابتدا شی یا چهره مورد نظر را از تصویر Foreground انتخاب کرده تا در تصویر ‌Background به همان شکل قرار داده شود. علاوه بر آپلود تصویر پس‌زمینه می‌توانید با نوشتن Prompt پس‌زمینه تصویر را شرح دهید. برای تست این مدل وارد تب Image Create از اینجا شوید.

#alibaba
#replaceanything

@dumannewsletter
استفاده از مدل‌های بزرگ زبانی (LLM) برای عملیاتی کردن ربات‌ها

کمپانی Google DeepMind روش جدیدی به نام AutoRT را برای عملیاتی کردن ربات‌ها در محیط‌های جدید ارائه کرد. در روش AutoRT ربات تصویر محیط اطراف را برای مدل VLM ارسال می‌کند. مدل VLM محیط و اشیای موجود در آن را شناسایی کرده و با استفاده از LLM مجموعه‌ای از وظایف را مخصوص آن محیط پیشنهاد می‌کند. سپس وظایف پیشنهاد شده براساس شرایط فیلتر شده و برای اجرا به ربات ارسال می‌شود. این پروسه دوباره تکرار می‌شود. این مراحل طی پنج مرحله در تصویر نمایش داده شده است. در این آزمایش،AutoRT به مدت ۷ ماه در ۴ ساختمان مختلف تست شده است. این روش می‌تواند برای کنترل و عملیاتی کردن گروهی از ربات‌ها توسط مدل‌های VLM و LLM مرکزی مورد استفاده قرار بگیرد. آزمایش AutoRT نشان می‌دهد که هوش‌مصنوعی مولد چگونه می‌تواند ربات‌ها را در محیط‌های جدید با کمترین دخالت انسان عملیاتی کند. کمبود دیتاست برای آموزش ربات در محیط‌ها و عملیات مختلف یکی از چالش‌های اساسی در توسعه رباتیک است. برای مطالعه جزئیات فنی بیشتر اینجا را بخوانید.

#deepmind
#autort
#robotics

@dumannewsletter
قابلیت‌های جدید الکسا آمازون

با داغ شدن هوش‌مصنوعی مولد در ماه‌های اخیر، آمازون نیز قابلیت‌های جدیدی را به دستیار صوتی الکسا اضافه کرده است. این قابلیت‌ها در رویداد CES 2024 معرفی شد:

- با استفاده از character.ai می‌تواند با شخصیت‌های مختلف با کاربر صحبت کند.
- با استفاده از Splash می‌تواند آهنگ‌های جدید تولید کند.
- با استفاده از Volley می‌تواند ۲۰سوالی با کاربر بازی کند.

👈 جزئیات بیشتر از CES 2024 را اینجا شرح داده‌ام.

#amazon
#alexa

@dumannewsletter
گوگل ریسرچ سیستم جدیدی به نام AMIE را برای تشخیص و مکالمه پزشکی معرفی کرد.

سیستم AMIE از یک LLM استفاده کرده که برای تشخیص پزشکی بهینه شده است. این سیستم با پرسیدن سوال‌های مناسب طی مکالمه تشخیص خود را بهبود می‌بخشد. علاوه‌ بر آن با ایجاد همدردی تلاش می‌کند با کاربر ارتباط ایجاد کرده تا شرایط یک مکالمه اثربخش را فراهم کند. طبق نتایج ارائه شده از نظر دقت و کیفیت، AMIE حداقل به اندازه پزشک مراقبت‌های اولیه عملکرد داشته است. به عقیده گوگل معرفی چنین سیستم‌هایی می‌تواند دسترس‌پذیری و کیفیت مراقبت‌های پزشکی را برای عموم افزایش دهد.

#google
#amie

@dumannewsletter
رقابت DeepMind با برنده مدال طلای المپیاد ریاضی | معرفی مدل AlphaGeometry

شرکت Google DeepMind مدل جدیدی به نام AlphaGeometry را برای حل مسائل هندسه معرفی کرد. بنا بر ادعای DeepMind این مدل می‌تواند در حد دارنده مدال طلای المپیاد ریاضی مسائل هندسه را حل کند. AlphaGeometry در زمان استاندارد این رقابت ۲۵ سوال از ۳۰ سوال را به درستی حل کرده است. این ۳۰ مسأله از میان مسائل سال‌های ۲۰۰۰ الی ۲۰۲۲ المپیاد ریاضی انتخاب شده‌اند. AlphaGeometry با الهام از کتاب معروف Thinking, Fast and Slow از دو بخش LLM و Symbolic Engine تشکیل شده است. بخش LLM یا مدل زبانی مشابه قسمت سریع ذهن عمل کرده و ایده‌های اولیه برای حل مسأله را به سرعت ارائه می‌دهد. مدل‌های بزرگ زبانی در شناسایی الگوها به خوبی عمل کرده ولی در استنتاج دارای ضعف هستند. برای پوشش این ضعف بخش Symbolic Engine وارد عمل می‌شود. بخش Symbolic Engine براساس قوانین منطقی نتایج را استنتاج کرده و ارائه می‌دهد. نتایج این مدل در مجله nature منتشر شده است.

👈 مطالعه جزئیات بیشتر

#deepmind
#google
#alpha_geometry

@dumannewsletter