خبرنامه هوش مصنوعی دومان
706 subscribers
245 photos
168 videos
2 files
287 links
ابزار، نوآوری‌ها و اخبار هوش مصنوعی و رباتیک

📌 ارتباط با من:

dumannewsletter@gmail.com

📌 لینک Boost کانال:

https://t.me/dumannewsletter?boost

📌 آرشیو وبسایت (به روز نمی‌شود):

duman.pouyae.ir

#هوش_مصنوعی
#رباتیک
Download Telegram
دوره Prompt نویسی برای مدل Llama با همکاری Meta AI در پلتفرم آموزشی DeepLearning.AI به صورت رایگان منتشر شد. این دوره حدود یک ساعت بوده و از اینجا می‌توانید به آن دسترسی داشته باشید.

#llama

@dumannewsletter
Media is too big
VIEW IN TELEGRAM
شرکت Adobe ابزار جدید خود برای تولید موسیقی را دمو کرد. با استفاده از این ابزار می‌توان prompt ورودی را به موسیقی تبدیل کرد. همچنین کاربر می‌تواند علاوه بر ژانر، شدت و طول خروجی را کنترل کرده و یا به آن loop اضافه کند. هنوز این ابزار در دسترس عموم قرار نگرفته است. Adobe مجموعه ابزارهای مبتنی بر هوش‌مصنوعی مولد را تحت عنوان Firefly در ماه‌های اخیر منتشر کرده است (منبع).

👈 مشاهده ابزارهای Firefly
👈 معرفی ابزارهای تولید موسیقی با هوش‌مصنوعی

#adobe
#firefly

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
دموی نسخه ۳ ربات‌انسان نمای Unitree H1

شرکت چینی Unitree Robotics در ویدئوی جدید قدرت و انعطاف ربات انسان‌نمای خود را به نمایش گذاشت. طبق ادعای این کمپانی رکورد سرعت ربات‌ انسان‌نما توسط H1 شکسته شده است. رکورد قبلی ۲.۵ متر بر ثانیه بوده ولی این ربات می‌تواند با سرعت ۳.۳ متر بر ثانیه راه برود.

#unitree
#robotics

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
مدل جدید گوگل برای تولید بازی!

گوگل مدل جدیدی به نام Genie را برای تولید بازی ویدئویی تعاملی معرفی کرد. این مدل می‌تواند محیط جدیدی را خلق کرده که کاربر می‌تواند کاراکتر اصلی آن را حرکت داده و کنترل کند. این مدل، یک مدل پایه (Foundation Model) بوده که با ویدئوهای بدون لیبل آموزش داده شده است. در حال حاضر Genie به صورت عمومی در دسترس قرار نگرفته است. برای مطالعه جزئیات فنی اینجا را بخوانید.

#genie
#google

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
نسخه 2.5 سرویس تبدیل متن به ویدئو Playgound معرفی شد. برای تست آن به اینجا مراجعه کنید.

#playground

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
شرکت علی‌بابا مدلی به نام Emote Portrait Alive (EMO) را برای تولید ویدئو از روی صوت معرفی کرد! این مدل تصویر ورودی را براساس صوت متحرک می‌کند! جزئیات حرکت لب‌ها و چشم‌ها و حالت چهره نیز با صوت هماهنگ می‌شود! برای مطالعه جزئیات فنی به اینجا مراجعه کنید.

#alibaba
#emo

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
سرویس تولید ویدئوی Pika قابلیت Lip Sync را به سرویس خود اضافه کرد. این قابلیت جزئیات حرکت لب‌های کاراکتر را براساس متن هماهنگ می‌کند. برای استفاده از این قابلیت باید سرویس پریمیوم را خریداری کنید. همچنین می‌توانید با استفاده از سرویس ElvenLabs برای ویدئوی خود صدای دلخواه تولید کنید!

pika.art 👈

#pika
#lip_sync

@dumannewsletter
با استفاده از این سرویس می‌توانید عکس خودتان را به همراه prompt به استیکرهای کارتونی تبدیل کنید:

fofr/face-to-sticker 👈

#fofr

@dumannewsletter
مدل زبانی یک بیتی مایکروسافت!

مایکروسافت در یک مقاله تحقیقاتی با عنوان The Era of 1-bit LLMs مدل جدیدی را به نام BitNet b1.58 معرفی کرد. در این مدل هر پارامتر یک مقدار سه‌تایی (Ternary) است. به عبارت دیگر هر پارامتر این مدل یکی از مقادیر +۱، -۱ و یا ۰ است. این مدل در مقایسه با نسخه ۱۶بیتی Llama چهار برابر کوچک‌تر و ۷۰ برابر انرژی کمتر مصرف کرده در حالیکه عملکرد یکسانی با آن دارد. برای مطالعه جزئیات فنی اینجا را بخوانید. تلاش برای ساختن مدل‌های کوچک‌تر و بهینه‌تر مسیر را برای استفاده از قابلیت‌های مدل‌های زبانی در تلفن‌های هوشمند هموارتر می‌کند.

#microsoft

@dumannewsletter
شکایت ماسک از سم آلتمن!

ایلان ماسک از سم آلتمن مدیرعامل OpenAI به خاطر تخطی از اهداف اولیه OpenAI در بدو تاسیس شکایت کرد! OpenAI در سال ۲۰۱۵ به عنوان سازمان غیرانتفاعی (Non-Profit) با هدف توسعه سیستم‌های هوش‌مصنوعی اپن سورس و منتفع ساختن بشر از قابلیت‌های این تکنولوژی با همراهی تعدادی از متخصصان و افراد سرشناس از جمله ایلان ماسک و سم آلتمن تاسیس شد. در بدو تاسیس این کمپانی ایلان ماسک یکی از حمایت‌کنندگان اصلی OpenAI بود. اما در سال ۲۰۱۸ به خاطر تضاد منافع با تسلا از موقعیت خود استعفا داد و از OpenAI جدا شد. در سال ۲۰۱۹ این کمپانی تغییر رویه داده و از سازمان غیرانتفاعی به انتفاعی تبدیل شد. در همین سال با جذب سرمایه هنگفت از سمت مایکروسافت فصل جدیدی را آغاز کرد که در حال حاضر نتیجه آن را با معرفی محصولاتی نظیر ChatGPT، DALL E و Sora مشاهده می‌کنیم. در سال‌های اخیر همواره OpenAI به خاطر سیاست‌های بسته خود مورد انتقاد قرار گرفته است.

#openai
#sam_altman
#elon_musk

@dumannewsletter
انتشار نسخه ۳ Claude

شرکت آنتروپیک نسخه ۳ مدل زبانی خود به نام Claude را در سه سایز مختلف به نام‌های Opus، Sonnet و Haiku منتشر کرد. همانطور که مشاهده می‌کنید، نسخه Opus در بنچ‌مارک‌های مختلف از مدل‌های GPT-4 و جمینای عملکرد بهتری داشته است. نسخه Opus برای کاربران پرمیوم و نسخه Sonnet به صورت رایگان در اینجا در دسترس قرار گرفته است.

👈 مطالعه جزئیات بیشتر

#anthropic
#claude

@dumannewsletter
شماره شانزدهم خبرنامه هوش‌مصنوعی دومان منتشر شد.

در این شماره می‌خوانید:

👈 رقابت برای معرفی مدل‌های زبانی در دو جبهه ادامه دارد: معرفی مدل‌های کوچک با کارایی زیاد و معرفی مدل‌های بزرگ زبانی قدرتمندتر!
👈 در دو هفته گذشته شاهد معرفی و به‌روزرسانی‌های زیادی در حوزه تولید تصویر از متن و حتی صوت بودیم!
👈 استارتاپی به نام Groq اولین پردازنده مخصوص مدل‌های زبانی را با نام LPU معرفی کرد!
👈 استارتاپ Figure همزمان با دموی آخرین نسخه ربات‌انسان‌ خود از جذب سرمایه جدید خبر داد.
👈 ایلان ماسک از سم آلتمن شکایت کرد!

برای مطالعه شماره شانزدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پست‌الکترونیک خود هستید از اینجا ثبت‌نام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.

#خبرنامه

@dumannewsletter
افزایش IQ چت‌بات Pi

هدف Inflection AI از توسعه Pi معرفی چت‌باتی است که ضمن ایمنی و مفید بودن بتواند ارتباط همدلانه با کاربر ایجاد کرده و مقداری حس شوخ‌طبعی از خود نشان دهد. این چت‌بات از مدل پایه‌ Inflection استفاده می‌کند. نسخه ۲ این مدل در ماه نوامبر معرفی شده بود و اکنون نسخه ۲.۵ آن معرفی شده که قابلیت‌های جدیدی از جمله امکان سرچ در اینترنت را برای چت‌بات Pi فراهم کرده است. در چارت نمایش داده شده دقت نسخه ۲.۵ با نسخه ۲ و همچنین مدل GPT-4 شرکت OpenAI در بنچ مارک‌های مختلف مقایسه شده است. همانطور که مشخص است نسخه ۲.۵ بهبود قابل توجهی نسبت به نسخه ۲ داشته و تا حد خوبی به دقت GPT-4 نزدیک شده است. در حال حاضر Pi بیش از ۶ میلیون کاربر ماهانه داشته و هر مکالمه آن به طور متوسط ۳۳ دقیقه به طول می‌کشد (منبع).

👈 از اینجا با Pi صحبت کنید.
👈 نصب Pi در iOS
👈 نصب Pi در اندروید

مطالعه این مطلب نیز پیشنهاد می‌شود:

👈 جذب سرمایه ۱.۳ میلیارد دلاری توسط Inflection AI

#inflection_ai
#pi

@dumannewsletter
نظر Andrew Ng درباره ظهور AGI

به عقیده Andrew Ng زمانی که بسیاری از مردم به صورت اتفاقی از یک تکنولوژی آگاه می‌شوند، دیدگاه عمومی نسبت به رشد آن ناپیوسته می‌شود. در حالی‌که رشد هوش‌مصنوعی به صورت پیوسته بوده و چیزی نیست که در یک شب اتفاق بیفتد. به همین جهت به نظر وی مسیر رسیدن به AGI از قدم‌های زیادی در پیش رو تشکیل شده که به توسعه پیوسته و آرام در این حوزه منجر می‌شود. همچنین Andrew Ng با نقل قول از این مقاله گفت که بسیاری از دستاوردهای حوزه هوش‌مصنوعی به خاطر نوع انتخاب متریک‌های اندازه‌گیری بوده و نه به خاطر تغییرات بنیادی در این حوزه (منبع).
دکتر Andrew Ng از اساتید برجسته هوش‌مصنوعی است که در حال حاضر در دانشگاه استنفورد تدریس می‌کند. علاوه بر تدریس با راه‌اندازی سرویس‌های مختلف (نظیر Landing AI و AI Fund) در این حوزه فعالیت و سرمایه‌گذاری نیز انجام می‌دهد (منبع).

#andrew_ng
#agi

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
سرویس تولید ویدئوی Pika صدا را به ویدئوهای تولیدی خود اضافه کرد. این صدا براساس محتوای ویدئو تولید می‌شود.

#pika

@dumannewsletter
چت‌بات Grok اپن‌سورس می‌شود!

ایلان ماسک در پلتفرم X اعلام کرد در هفته جاری چت‌بات Grok به صورت اپن‌سورس توسط xAI منتشر می‌شود. انتشار این خبر واکنش‌های مثبت زیادی را به همراه داشته است. در روزهای اخیر ایلان ماسک، OpenAI را به خاطر سیاست‌های بسته خود مورد انتقادهای گسترده قرار داده است. هر چند که با بروزرسانی‌های اخیر رقبا فعلاً Grok موقعیت برتری در مقایسه با دیگران ندارد ولی انتشار آن به صورت اپن‌سورس به دموکراتیزه شدن هوش‌مصنوعی کمک فراوانی خواهد کرد.

👈 برای آشنایی بیشتر با xAI اینجا را بخوانید.
👈 در مورد شکایت ماسک از سم آلتمن اینجا را بخوانید.

#grok
#xai
#elon_musk

@dumannewsletter