خبرنامه هوش مصنوعی دومان
712 subscribers
262 photos
180 videos
2 files
303 links
ابزار، نوآوری‌ها و اخبار هوش مصنوعی و رباتیک

📌 ارتباط با من:

dumannewsletter@gmail.com

📌 لینک Boost کانال:

https://t.me/dumannewsletter?boost

📌 آرشیو وبسایت (به روز نمی‌شود):

duman.pouyae.ir

#هوش_مصنوعی
#رباتیک
Download Telegram
رقابت DeepMind با برنده مدال طلای المپیاد ریاضی | معرفی مدل AlphaGeometry

شرکت Google DeepMind مدل جدیدی به نام AlphaGeometry را برای حل مسائل هندسه معرفی کرد. بنا بر ادعای DeepMind این مدل می‌تواند در حد دارنده مدال طلای المپیاد ریاضی مسائل هندسه را حل کند. AlphaGeometry در زمان استاندارد این رقابت ۲۵ سوال از ۳۰ سوال را به درستی حل کرده است. این ۳۰ مسأله از میان مسائل سال‌های ۲۰۰۰ الی ۲۰۲۲ المپیاد ریاضی انتخاب شده‌اند. AlphaGeometry با الهام از کتاب معروف Thinking, Fast and Slow از دو بخش LLM و Symbolic Engine تشکیل شده است. بخش LLM یا مدل زبانی مشابه قسمت سریع ذهن عمل کرده و ایده‌های اولیه برای حل مسأله را به سرعت ارائه می‌دهد. مدل‌های بزرگ زبانی در شناسایی الگوها به خوبی عمل کرده ولی در استنتاج دارای ضعف هستند. برای پوشش این ضعف بخش Symbolic Engine وارد عمل می‌شود. بخش Symbolic Engine براساس قوانین منطقی نتایج را استنتاج کرده و ارائه می‌دهد. نتایج این مدل در مجله nature منتشر شده است.

👈 مطالعه جزئیات بیشتر

#deepmind
#google
#alpha_geometry

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
اپتیموس در حال تا کردن لباس

طبق گفته ایلان ماسک اپتیموس هنوز توانایی تا کردن لباس به صورت مستقل و عمومی را ندارد. این ویدئو در شرایط خاص تهیه شده است.

#optimus
#robotics

@dumannewsletter
افزایش سرمایه ۷۳.۶ میلیون دلاری موتور جستجوی Perplexity AI

موتور جستجوی Perplexity AI در جدیدترین دور افزایش سرمایه توانست ۷۳.۶ میلیون دلار از شرکت‌ها و افراد مختلف سرمایه جذب کند. در میان سرمایه‌گذاران جدید نام جف بزوس بنیان‌گذار آمازون نیز دیده می‌شود. به این ترتیب ارزش این موتور جستجو به ۵۲۰ میلیون دلار رسید. موتور جستجوی Perplexity AI از سال ۲۰۲۲ راه‌اندازی شده و با استفاده از هوش‌مصنوعی مولد تلاش می‌کند در قالب یک چت‌بات نتایج مرتبط با جستجو و یا سوال کاربر را ارائه دهد. Perplexity علاوه بر مدل‌های خود امکان استفاده از مدل‌های معروفی نظیر GPT-4، Gemini و Claude را نیز برای کاربر فراهم می‌کند. استفاده از هوش‌مصنوعی مولد برای جستجو حوزه جدیدی است که فعلاً نمی‌توان درباره آینده آن با قطعیت اظهار نظر کرد. تهیه و راه‌اندازی مدل‌های بزرگ زبانی بسیار پرهزینه بوده و امکان دارد در آینده نه چندان دور چنین محصولی صرفه اقتصادی نداشته باشد. موتورجستجو مشابه دیگری به نام you.com نیز در حال فعالیت است.

#perplexity_ai

@dumannewsletter
سودای ایلان ماسک برای سیطره بر تسلا

ایلان ماسک در پلتفرم X در پاسخ به یکی از کاربران اعلام کرد برای پیشتازی و رهبری تسلا در هوش‌مصنوعی و رباتیک نیاز دارد مالک ۲۵ درصد از سهام تسلا باشد تا اکثریت آرای هیئت مدیره را در اختیار بگیرد. در حال حاضر ایلان ماسک مالک حدود ۱۳ درصد از تسلاست. ماسک بخشی از سهام خود را در سال ۲۰۲۲ به خاطر خرید توئیتر فروخت. قابل ذکر است که با تغییر وزن آرای اعضای هیئت مدیره نیز قبلاً موافقت نشده است. ماسک همچنین اعلام کرده در صورت فراهم نشدن شرایط برخی از ایده‌های خود در حوزه هوش‌مصنوعی را با سایر شرکت‌ها پیش خواهد برد. در سال‌های اخیر تسلا با تمرکز روی هوش‌مصنوعی خود را به عنوان یکی از کمپانی‌های پیشرو در این عرصه معرفی کرده است. پس از معرفی xAI در سال گذشته و ورود ایلان ماسک به رقابت AGI، انتظار می‌رود از توانایی‌های تسلا و X برای پیش‌بردن اهداف xAI بیشتر استفاده شود.

در رابطه با این موضوع این مطالب پیشنهاد می‌شود:

👈 ایلان ماسک به دنبال شناخت جهان هستی!
👈 پیش‌بینی ایلان ماسک برای عرضه تسلای کاملاً خودران!


#tesla
#elon_musk

@dumannewsletter
افت قابل توجه تعداد سوالات پلتفرم Stackoverflow در سال‌های اخیر.
یکی از دلایل این کاهش معرفی سرویس‌هایی نظیر Copilot و ChatGPT بوده است.

مطالعه این مقاله پیشنهاد می‌شود:

👈 تلاش Stackoverflow برای بقا در تلاطم هوش‌مصنوعی

#stackoverflow

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
ورود مارک زاکربرگ به رقابت AGI | هوش‌مصنوعی اپن‌سورس!

مارک زاکربرگ موسس Facebook و مدیرعامل متا در یک پیام ویدئویی اهداف و تمرکز کمپانی متا در سال‌های آینده را به اطلاع مخاطبان رساند. متا نیز همانند شرکت‌های OpenAI Google DeepMind و Anthropic برای ساخت AGI وارد میدان رقابت می‌شود. AGI بالاترین سطح از هوش‌مصنوعی است که در جنبه‌های مختلف هوش توانایی رقابت با انسان را داشته و یا حتی بهتر از انسان عمل می‌کند. با وجود پیشرفت‌های اخیر در این حوزه، هنوز هیچ جایی یا کسی حتی به پایین‌ترین سطح از AGI نیز دست پیدا نکرده است. توسعه اپن‌سورس هوش‌مصنوعی همواره توسط مارک زاکربرگ مدیرعامل متا و یان لیکان دانشمند ارشد هوش‌مصنوعی در متا مورد تاکید قرار گرفته است. به عقیده این افراد توسعه اپن‌سورس یکی از راه‌های اصلی برای ایجاد ایمنی و منتفع کردن بشر از این تکنولوژی است. در این پیام ویدئویی نیز این موضوع مجدداً تاکید شده و حتی بعید نیست در صورت دستیابی متا به AGI اقدام به انتشار اپن‌سورس آن کند!

👈 برای مطالعه جزئیات بیشتر اینجا را بخوانید.

#meta
#agi
#mark_zuckerberg

@dumannewsletter
تشخیص سرطان پوست با استفاده از هوش‌مصنوعی

دستگاه کمپانی DermaSensor مجوز تشخیص سرطان پوست با استفاده از هوش‌مصنوعی را از FDA آمریکا کسب کرد. این دستگاه با ۹۶ درصد دقت می‌تواند سرطان‌های رایج پوست را تنها با اسکن پوست و بدون عوارض جانبی تشخیص دهد. این دستگاه از الگوریتم‌های هوش‌مصنوعی برای تشخیص الگوهای سرطان در پوست استفاده می‌کند. برای استفاده از آن باید حق اشتراک ماهانه پرداخت شود. این حق اشتراک برای پنج مریض در ماه ۱۹۹ دلار و برای استفاده نامحدود در ماه ۳۹۹ دلار است. بنا به گفته مدیرعامل این شرکت، توسعه این محصول حدود ۱۲ سال به طول کشیده و در این مدت میلیون‌ها دلار سرمایه‌گذاری روی آن انجام گرفته است. کسب این مجوز می‌تواند مسیر را برای تایید دستگاه‌ها و تجهیزاتی که از هوش‌مصنوعی در پزشکی استفاده می‌کنند هموارتر کند.
(منبع خبر)

#derma_sensor

@dumannewsletter
شماره سیزدهم خبرنامه هوش‌مصنوعی دومان منتشر شد!

برای مطالعه شماره سیزدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پست‌الکترونیک خود هستید از اینجا ثبت‌نام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.

#خبرنامه

@dumannewsletter
افزایش سرمایه استارتاپ ElevenLabs

استارتاپ ElevenLabs با جذب سرمایه ۸۰ میلیون دلاری به ارزش ۱.۱ میلیارد دلار رسید. این استارتاپ مجمو‌عه‌ای از ابزارهای مبتنی بر هوش‌مصنوعی را برای تولید صدای مصنوعی (Synthetic Voice) به کاربر ارائه می‌دهد. کاربران می‌توانند با انتخاب ویژگی‌های مختلف نظیر سن، جنسیت و لهجه صدای مورد نظر خود را ساخته و یا اینکه صدای خود را در آن شبیه‌سازی کنند. ElevenLabs تنها طی چند ماه بیش از یک میلیون کاربر را جذب کرد. این استارتاپ اخیراً سرویس ترجمه خود را با نام AI Dubbing لانچ کرد. AI Dubbing ضمن حفظ صدا و احساسات گوینده، می‌تواند مکالمات آن را به ۲۹ زبان دیگر نیز بیان کند. قرار است به زودی قابلیت ترجمه فیلم نیز در این پلتفرم فراهم شود. همچنین قرار است یک marketplace برای فروش صداهای شبیه‌سازی شده در پلتفرم ElevenLabs راه‌اندازی شود (منبع خبر).

👈 برای تست اینجا را نگاه کنید.

#eleven_labs

@dumannewsletter
قابلیت‌های جدید Google Chrome با استفاده از هوش‌مصنوعی مولد معرفی شد.

قابلیت Tab Organizer: این قابلیت تب‌های باز کاربر را به صورت خودکار گروه‌بندی می‌کند.

قابلیت Custom Theme: کاربر می‌تواند با انتخاب رنگ، استایل، موضوع و مود تم مورد نظر خود را در کروم رندر کند.

قابلیت Writing Help: قابلیت Help me write می‌تواند به کاربر در وب‌سایت‌های مختلف برای نوشتن متن پیشنهاد دهد.

این قابلیت‌ها در نسخه M121 معرفی شده‌ و در ابتدا در اختیار کاربران آمریکایی قرار خواهد گرفت. به مرور در سایر کشورها و تمامی‌ سیستم‌عامل‌ها نیز در دسترس قرار خواهند گرفت (منبع خبر).

#google
#chrome

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
تیم Google Research مدل جدیدی به نام lumiere را برای تولید ویدئو معرفی کرد. این مدل با دریافت متن و یا تصویر به عنوان ورودی، یک ویدیو ۵ ثانیه‌ای تولید می‌‌کند. نمونه‌های مشابهی اخیراً توسط #runway و #pika معرفی شده بود. همچنین این مدل می‌تواند با دریافت یک تصویر رفرنس ویدئوهای جدید را با همان استایل تولید کند. برای مطالعه جزئیات فنی اینجا را بخوانید.

#google
#lumiere

@dumannewsletter
معرفی مدل ActAnywhere توسط محققان Adobe

محققان Adobe مدل جدیدی به نام ActAnywhere را برای تولید ویدئو ارائه کردند. این مدل می‌تواند حرکت انسان نظیر دویدن را به یک تصویر پس‌زمینه اضافه کند. تصویر پس‌زمینه به نحوی تغییر داده می‌شود که تعامل انسان با محیط در آن دیده شود. به عنوان مثال در این تصویر پاشیدن آب به خاطر دویدن شخص قابل مشاهده است.
برای مطالعه جزئیات فنی اینجا را بخوانید.

#adobe
#acy_anywhere

@dumannewsletter
معرفی مدل‌های زبانی کوچک جدید از Stability AI

۱. مدل Stable Code 3B: این مدل کوچک مخصوص کدنویسی با ۱۸ زبان برنامه‌نویسی مختلف توسعه داده شده است. نسبت به نمونه‌های مشابه در بنچ‌مارک‌ها بهتر عمل کرده است (👈جزئیات بیشتر).

۲. مدل Stable LM 2 1.6B: یک مدل‌زبانی کوچک جدید که توانایی رقابت با مدل Phi2 مایکروسافت و حتی مدل‌های بزرگتری نظیر Falcon-40B-Instruct را دارد (👈 جزئیات بیشتر).

#stability_ai
#stable_lm
#stable_code

@dumannewsletter
هوش‌مصنوعی هنوز نمی‌تواند جایگزین نیروی کار باشد!

براساس مقاله جدیدی که توسط محققان دانشگاه MIT منتشر شده جایگزین شدن انسان با هوش‌مصنوعی بیش از اندازه بزرگنمایی شده و انتظار می‌رود این اتفاق به زودی رخ ندهد. دلیل اصلی این موضوع گران بودن هزینه راه‌اندازی و نگهداری سیستم‌های مبتنی بر هوش‌مصنوعی است. این مقاله به طور خاص روی ماشین‌بینایی (Computer Vision) تمرکز کرده است. طبق این مقاله، پیاده‌سازی سیستم‌های کاستوم مبتنی بر ماشین‌بینایی برای بسیاری از مشاغل نظیر نانوایی نسبت به استخدام نیروی انسانی هزینه بیشتری دارد و در نتیجه از نظر اقتصادی بهینه نیست.
برای مطالعه کامل این مقاله اینجا را بخوانید.

#mit
#work_force

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
سرویس تولید ویدئو Runway قابلیت جدید خود را با نام Multi Motion Brush معرفی کرد. با استفاده از این قابلیت کاربر می‌تواند قسمت‌های مختلف تصویر را با حرکات مختلف کنترل کند. برای جزئیات بیشتر ویدئو را تماشا کنید.

#runway

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
قابلیت‌های جدید Adobe Premiere Pro با استفاده از هوش‌مصنوعی مولد معرفی شد.

#adobe

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
نظرات لینوس توروالدز خالق لینوکس در مصاحبه اخیر خود در همایش بنیاد لینوکس در ژاپن درباره‌مدل‌های زبانی:

به عقیده لینوس توروالدز در آینده شاهد کدهایی خواهیم بود که توسط LLM نوشته شده است. حتی در حال حاضر نیز در مقیاس کوچک برنامه‌نویسان از مدل‌های بزرگ زبانی برای نوشتن کد کمک می‌گیرند. این موضوع به اندازه‌ای که در اخبار روزانه به آن پرداخته می‌شود جدید نیست، بلکه مدت‌هاست که توسعه‌دهندگان از ابزارهای مختلف برای اتوماسیون در کد نویسی استفاده می‌کنند. پیدا کردن خطاهای رایج کدنویسی یکی از کاربردهایی است که مدل‌های زبانی در آن بسیار درخشان خواهند بود. لینوس توروالدز در پاسخ به اینکه مدل‌های بزرگ زبانی به خاطر hallucination دچار اشتباه می‌شوند گفت: "من می‌بینم که هر روز باگ‌ها بدون حضور آن‌ها رخ می‌دهند، بنابراین نگران این موضوع نیستم!". hallucination یکی از اثرات جانبی مدل‌های زبانی است که باعث می‌شود پاسخ‌های غیرواقعی و اشتباه تولید کنند.

#linus_torvalds

@dumannewsletter