خبرنامه هوش مصنوعی دومان
711 subscribers
259 photos
178 videos
2 files
301 links
ابزار، نوآوری‌ها و اخبار هوش مصنوعی و رباتیک

📌 ارتباط با من:

dumannewsletter@gmail.com

📌 لینک Boost کانال:

https://t.me/dumannewsletter?boost

📌 آرشیو وبسایت (به روز نمی‌شود):

duman.pouyae.ir

#هوش_مصنوعی
#رباتیک
Download Telegram
مذاکرات مایکروسافت با Figure برای سرمایه‌گذاری ۵۰۰ میلیون دلاری

مایکروسافت و OpenAI در حال مذاکره با استارتاپ رباتیک Figure برای سرمایه‌گذاری هستند. طبق اخبار منتشر شده، ارزش این سرمایه‌گذاری ۵۰۰ میلیون دلار خواهد بود. Figure در سال ۲۰۲۲ شروع بکار کرد و در حال حاضر روی توسعه ربات‌های انسان‌نما فعالیت می‌کند. اخیراً محصول این شرکت در حال تهیه قهوه دمو شد (اینجا را مشاهده کنید). اواسط ماه ژانویه نیز همکاری Figure با خودروسازی ‌BMW اعلام شد. قرار است از ربات‌های انسان‌نمای آن در کارخانه ‌BMW در آمریکا استفاده شود. انتظار می‌رود در سال ۲۰۲۴ سرمایه‌گذاری در حوزه ساخت‌ ربات‌های انسان‌نما بیشتر شود (منبع خبر).

#figure
#robotics
#microsoft

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
گوگل بارد نقاشی می‌کشد!

گوگل بارد با مدل Gemini Pro در بیش از ۲۳۰ کشور و ۴۰ زبان مختلف در دسترس عموم قرار گرفته است. در به‌روزرسانی جدید، این سرویس به مدل تولید تصویر گوگل به نام Imagen متصل شده و اکنون می‌تواند با دریافت prompt از کاربر تصویر موردنظر وی را بکشد (منبع).

#google
#bard
#imagen

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
قابلیت‌های هوش‌مصنوعی تلفن‌ همراه Galaxy S24 Ultra که اخیراً معرفی شد.

#samsung

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
معرفی چت‌بات Rufus آمازون

آمازون نسخه بتا چت‌بات جدیدی به نام Rufus را برای عده محدودی از خریداران فروشگاه آنلاین خود در دسترس قرار داد. این چت‌بات می‌تواند به سوالات مختلفی درباره کالا و مقایسه آن پاسخ دهد. چت‌بات Rufus از اطلاعاتی نظیر ریویو کاربران، پرسش و پاسخ کامیونیتی و اطلاعات لیست شده محصول برای پاسخ دادن استفاده می‌کند(منبع خبر).

#rufus
#amazon

@dumannewsletter
شماره چهاردهم خبرنامه هوش‌مصنوعی دومان منتشر شد!

برای مطالعه شماره چهاردهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پست‌الکترونیک خود هستید از اینجا ثبت‌نام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.

#خبرنامه

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
دموی ربات انسان‌نمای اطلس برای انجام کارهای کارگری

#atlas
#boston_dynamics

@dumannewsletter
معرفی رقیب GPT Store توسط HuggingFace

پلتفرم HuggingFace نسخه بتای Assistants را در اختیار کاربران خود قرار داده است. با استفاده از این قابلیت هر کسی می‌تواند دستیارهای مبتنی بر مدل‌های اپن‌سورس هوش‌مصنوعی نظیر Mistral، Llama و Claude را ساخته و منتشر کند. Assistants مشابه GPT Store است ولی در حال حاضر بسیار ساده‌تر بوده و قابلیت‌هایی نظیر وب‌سرچ، API Call و تولید تصویر را ندارد. قرار است در آینده این قابلیت‌ها نیز به آن اضافه شود. در حال حاضر می‌توانید از اینجا Assistants را مشاهده کرده و دستیار هوش‌مصنوعی خود را بسازید.

#hugging_face
#assistants

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
معرفی اپلیکیشن Lookout گوگل برای افراد کم‌بینا و نابینا

اپلیکیشن Lookout گوگل به افراد کم‌بینا و نابینا با استفاده از ماشین‌بینایی و هوش‌مصنوعی مولد کمک می‌کند. این اپلیکیشن دارای قابلیتی به نام Image Q&A است که امکان پرسش و پاسخ حول یک تصویر را از طریق صدا برای کاربر فراهم می‌سازد. به عنوان مثال کاربر می‌تواند از محیط عکس گرفته و آن را در اپلیکیشن آپلود کند و سپس درباره چیزهایی که در تصویر موجود بوده و جزئیاتی نظیر رنگ سوال پرسیده و پاسخ اپلیکیشن درباره سوال خود را بشنود. برای دسترسی به این اپلیکیشن اینجا را ببینید.

#lookout_app
#google
#accessibility

@dumannewsletter
به‌روزرسانی‌های گوگل بارد (جمینای)

- گوگل نام سرویس هوش‌مصنوعی بارد را به جمینای تغییر داد. سرویس بارد بعد از معرفی ChatGPT برای رقابت با آن معرفی شد ولی در آن زمان اقبال چندانی پیدا نکرد. پس از این ماجرا گوگل برای حفظ موقعیت خود در بازار مدل قدرتمندی به نام جمینای (Gemini) را منتشر کرد. سپس به مرور از نسخه Pro این مدل در سرویس بارد استفاده کرد و آن را برای ۴۰ زبان مختلف در ۲۳۰ کشور در دسترس قرار داد.
- نسخه Ultra مدل جمینای در دسترس قرار گرفت. مدل جمینای در سه نسخه Nano، Pro و Ultra معرفی شده بود ولی انتشار عمومی نسخه Ultra در آن زمان به بعد موکول شده بود. نسخه Nano برای تلفن همراه، نسخه Pro برای کاربردهای معمولی و نسخه Ultra برای کاربردهای پیچیده‌تر طراحی شده است. برای دسترسی به Ultra باید اشتراک ماهانه پرداخت کنید ولی Pro از اینجا در دسترس است.
- جمینای در تلفن‌های همراه آیفون و اندرویدی نیز در دسترس قرار گرفته است. برای نصب آن در اندروید به اینجا مراجعه کنید. در آیفون نیز طی روزهای آینده از طریق گوگل اپ در دسترس قرار خواهد گرفت.

👈 معرفی Gemini

#google
#gemini

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
دموی ربات‌‌های انسان‌نمای ساخت 1x Robotics

رقابت برای ساخت ربات‌های انسان‌نما (humanoid) تنها به #atlas #optimus, #figure, #digit و نمونه‌های چینی ختم نشده است. شرکت نروژی 1x Robotics یکی دیگر از رقیبان این حوزه بوده که اخیراً با جذب سرمایه ۱۰۰ میلیون دلاری از سمت OpenAI مورد توجه قرار گرفته است. ربات‌های انسان‌نما می‌توانند تعامل بیشتری با محیط داشته و در کارهای روزمره مورد استفاده قرار بگیرند. از طرفی این موضوع می‌تواند فرصت بیشتری را برای ساخت هوش‌مصنوعی مشابه انسان فراهم سازد. شاید یکی از دلایل علاقه OpenAI برای سرمایه‌گذاری در 1x Robotics و Figure همین موضوع باشد.

#openai
#1x_robotics

@dumannewsletter
معرفی مدل Stable Audio برای تولید موسیقی

استارتاپ Stability AI مدل جدیدی به نام Stable Audio AudioSparx 1.0 را برای تولید موسیقی معرفی کرده است. این مدل می‌تواند موسیقی استریو طولانی با مدت زمان متغیر را در فرکانس ۴۴.۱ کیلو هرتز تولید کند. با استفاده از این مدل، تولید موسیقی ۹۵ ثانیه‌ای با پردازنده گرافیکی A100 حدود ۸ ثانیه زمان می‌برد. بنابرادعای Stability AI این مدل از نمونه‌های AudioLDM2 و MusicGen بهتر عمل می‌کند. برای شنیدن نمونه‌های بیشتر اینجا را نگاه کنید و برای مطالعه جزئیات فنی درباره این مدل اینجا را بخوانید.

#stability_ai
#audio_diffusion

@dumannewsletter
به روزرسانی‌های جدید ElevenLabs

- محصول Speech to Speech استارتاپ ElevenLabs اکنون ۲۹ زبان مختلف را پشتیبانی می‌کند. با استفاده از این قابلیت می‌توانید صدای ضبط شده خود را به لحن‌ها و کاراکترهای مختلف تبدیل کنید (برای تست اینجا را نگاه کنید).

- همانطور که وعده داده شده بود، از این به بعد کاربران می‌توانند کلون صدای خود را برای کسب درآمد در این پلتفرم منتشر کنند. برای اینکار باید فایل صوتی حداقل ۳۰ دقیقه‌ای در VoiceLab آپلود کرد. این فایل‌های صوتی در ElevenLabs Voice Library منتشر شده و در اختیار کاربران دیگر قرار می‌گیرد. در صورت استفاده از آن، سهم صاحب صدا پرداخت خواهد شد.

#eleven_labs

@dumannewsletter
گروه‌های معترض به فعالیت‌های OpenAI در توسعه AGI و همکاری با پنتاگون مقابل دفتر این کمپانی در لس‌آنجلس جمع شده و اعتراض خود را بیان کردند (منبع خبر).

#openai

@dumannewsletter