خبرنامه هوش مصنوعی دومان
711 subscribers
259 photos
178 videos
2 files
301 links
ابزار، نوآوری‌ها و اخبار هوش مصنوعی و رباتیک

📌 ارتباط با من:

dumannewsletter@gmail.com

📌 لینک Boost کانال:

https://t.me/dumannewsletter?boost

📌 آرشیو وبسایت (به روز نمی‌شود):

duman.pouyae.ir

#هوش_مصنوعی
#رباتیک
Download Telegram
به حرکت درآوردن تصاویر توسط DreaMoving

گروهی از محققان شرکت چینی علی‌بابا مدلی برای تولید ویدئو رقص از روی تصویر ارائه کردند. این مدل از روش Diffusion برای تولید ویدئو استفاده کرده و DreaMoving نام دارد. برای تولید ویدئو باید تصویر مرجع و دنباله حرکات به همراه یک توضیح متنی به مدل داده شود. برای مطالعه جزئیات فنی اینجا را بخوانید. اخیراً نمونه مشابهی به نام MagicAnimate نیز معرفی شده بود.

#dreamoving
#alibaba

@dumannewsletter
استفاده از هوش‌مصنوعی در صنعت فشن و مد

گروهی از محققان شرکت علی‌بابا مدل جدید هوش‌مصنوعی برای به تن کردن انواع لباس در یک تصویر ارائه کردند. این روش نیز از متد Diffusion برای تولید تصویر جدید استفاده کرده و Outfit Anyone نام دارد. این محققان در ادامه از خروجی این مدل در کنار مدل قبلی علی‌بابا به نام Animate Anyone برای به حرکت درآوردن تصویر جدید بهره برده‌اند. قابل ذکر است که علی‌بابا اخیراً مدل دیگری به نام DreaMoving را برای به حرکت درآوردن تصویر انسان معرفی کرد. برای مطالعه جزئیات فنی در مورد پروژه Outfit Anyone اینجا را بخوانید.

#outfit_anyone
#alibaba

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
حذف نویز محیط در گوشی‌های پیکسل گوگل

قابلیت حذف نویز محیط در گوشی‌های هوشمند پیکسل گوگل با همکاری بخش Google Research توسعه داده شده است. این قابلیت از یک مدل audio-to-audio برای کاهش نویز استفاده می‌کند. در حال حاضر این قابلیت کل بازه فرکانسی صدا را پوشش داده و با کمترین تاخیر صدای بهبود یافته را برای کاربر پخش می‌کند.

#google
#pixel

@dumannewsletter
استفاده از هوش‌مصنوعی مولد برای تولید داروی سرطان

دو شرکت آسترازنکا (AstraZeneca) و ابسکی (Absci) در یک همکاری مشترک به ارزش ۲۴۷ میلیون دلار با استفاده از هوش‌مصنوعی برای کشف داروی جدید سرطان اقدام می‌کنند. ابسکی در زمینه کشف دارو (Drug Discovery) فعالیت داشته و در سال‌های اخیر توانسته با استفاده از هوش‌مصنوعی مولد (GenAI) در کشف داروهای جدید به نتایج قابل توجهی دست پیدا کند. تولید داروی جدید بسیار هزینه‌بر بوده و شانس موفقیت پایینی دارد ولی با استفاده از هوش‌مصنوعی درهای جدیدی به روی این صنعت باز شده است. سال جاری ابسکی اعلام کرد با استفاده از تکنیک Zero Shot در یادگیری ماشین توانسته آنتی‌بادی De Novo را به صورت مجازی تولید کند (اینجا را مشاهده کنید). این تکنیک امکان تجزیه و تحلیل دیتایی که در پروسه آموزش مدل وجود نداشته را برای آن فراهم می‌سازد.

#absci
#zero_shot

@dumannewsletter
معرفی مدل AudioBox از متا

مدل Audiobox توسط متا برای تولید و بهبود کیفیت صوت معرفی شده است. این مدل در واقع نسل بعدی مدل Voicebox است که در ابتدای سال جاری معرفی شده بود. قابلیت‌های خارق‌العاده Audiobox را می‌توانید از اینجا تست کنید.

#meta
#audiobox

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
تولید موسیقی با MusicFX

گوگل مدل جدید خود برای تولید موسیقی را به صورت محدود در دسترس عموم قرار داده است. این مدل MusicFX نام داشته و برای ثبت‌نام در لیست انتظار آن به اینجا مراجعه کنید. این مدل با دریافت Prompt از کاربر موسیقی مورد نظر را تولید می‌کند. ویدئویی که در تصویر مشاهده می‌کنید نمونه‌ای از خروجی MusicFX است.

#google
#musicfx

@dumannewsletter
سه بعدی‌سازی تصاویر با Stable Zero123

شرکت Stability AI نسخه جدید مدل سه‌بعدی ساز خود را با نام Stable Zero123 منتشر کرد. این نسخه نسبت به مدل قبلی یعنی Zero123-XL بهبود قابل توجهی داشته است. این بهبود در تصاویر فوق نمایش داده شده است. Stable Zero123 به صورت اپن‌سورس صرفاً برای اهداف تحقیقاتی منتشر شده است. برای دسترسی به مدل و جزئیات فنی بیشتر به اینجا مراجعه کنید.

#stability_ai
#stable_zero123

@dumannewsletter
مایکروسافت مدل Phi2 را معرفی کرد.

​​​​با داغ شدن مسابقه مدل‌های بزرگ زبانی (LLM) شاهد معرفی مدل‌های کوچک زبانی (SLM) نیز هستیم. در حال حاضر LL​​​​Mها از چند ده میلیارد، تا چند میلیارد و حتی چند تریلیون پارامتر دارند. هر چقدر تعداد پارامترهای یک مدل بیشتر باشد، پروسه آموزش آن زمان‌بر و هزینه‌بر شده و در نهایت خروجی آن نیز سایز زیادی خواهد داشت. اجرای مدل‌های بزرگ زبانی نیازمند منابع پردازشی زیاد است. از این‌رو، برای فراهم کردن قابلیت‌های مدل‌های زبانی برای پلتفرم‌های مختلف شاهد توسعه و معرفی مدل‌های کوچک زبانی یا SLMها هستیم. کاهش سایز مدل زبانی و در عین حال افزایش کیفیت آن از ترندهای موجود در حوزه هوش‌مصنوعی مولد است. مدل Phi یکی از این SLMها بوده که توسط مایکروسافت منتشر شده است. نسخه Phi2 که به تازگی منتشر شده در مقایسه با نمونه‌های مشابه نتایج درخور توجهی داشته است.​​​​

👈 برای جزئیات بیشتر درباره این مدل اینجا را بخوانید.

#phi
#microsoft

@dumannewsletter
تولید موسیقی با Copilot

مایکروسافت با همکاری Suno قابلیت تولید موسیقی را به Copilot اضافه کرد. برای استفاده از این قابلیت مراحل زیر را انجام دهید:

۱. پس از نصب مرورگر Microsoft Edge وارد آدرس copilot.microsoft.com شوید.
۲. وارد حساب کاربری مایکروسافت خود شده و یا حساب جدید بسازید.
۳. در قسمت plugins از فعال بودن Suno مطمئن شوید.
۴. با نوشتن Prompt مورد نظر موسیقی خود را تحویل بگیرید.

ضمناً از اینجا مستقیم می‌توانید با Suno موسیقی موردنظر خود را بسازید.

#microsoft
#suno
#copilot

@dumannewsletter
Please open Telegram to view this post
VIEW IN TELEGRAM
شماره دوازدهم خبرنامه هوش‌مصنوعی دومان منتشر شد!

در این شماره شاهد معرفی تحقیقات و محصولات متنوعی در زمینه هوش‌مصنوعی مولد (Generative AI) هستیم. همان‌طور که انتظار می‌رود با سرمایه‌گذاری‌های کلان انجام شده ایده‌های مختلف و قابل توجهی در این حوزه در حال شکل‌گیری است. فعلاً تمرکز روی مدل‌های مبتنی بر Diffusion است. در این شماره مدل‌های جدیدی برای تولید تصویر، به حرکت درآوردن تصویر و تولید موسیقی و صوت معرفی شده است. دنیای مدل‌های زبانی نیز خیلی پر و صدا بود! بالاخره بعد از ماه‌ها انتظار رقیب ChatGPT توسط گوگل وارد میدان شد و توجه زیادی را به خود جلب کرد! مدل‌های اپن‌سورس Mistral 8X7B و Phi2 نیز معرفی شده و سایر مدل‌های مشابه را به چالش کشیدند. تلاش‌ها برای نمود فیزیکی هوش‌مصنوعی در قالب ربات‌های انسان‌نما نیز ادامه دارد. برای جزئیات بیشتر ادامه خبرنامه را مطالعه کنید.

👈 برای مطالعه شماره دوازدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پست‌الکترونیک خود هستید از اینجا ثبت‌نام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.

#خبرنامه

@dumannewsletter
نسخه ۶ سرویس Midjourney اخیراً منتشر شد. در این تصویر بهبود تصاویر تولید شده توسط این مدل هوش‌مصنوعی در حدود یک و نیم سال گذشته را مشاهده می‌کنید. Midjourney در زمینه خلق تصویر با هوش‌مصنوعی مولد با مدل‌های DALL.E، Google Imagen و Stable Diffusion رقابت می‌کند.

#midjourney

@dumannewsletter
دستاورد چشم‌گیر اپل برای اجرای مدل‌های زبانی در تلفن‌همراه

مدل‌های بزرگ زبانی برای اجرا به مموری زیادی نیاز دارند از این رو برای اجرای آن در تلفن‌های همراه هوشمند محدودیت ایجاد می‌شود. در آزمایش جدیدی که توسط مهندسان اپل انجام شده با معرفی دو روش جدید به نام‌های windowing و row-column bundling از ظرفیت Flash Memory برای حل کمبود DRAM استفاده شده است. این روش با تطبیق میزان مصرف مموری براساس محدودیت‌های سخت‌افزاری به شکل بهینه‌ای از منابع موجود استفاده می‌کند. طبق نتایج ارائه شده، این روش می‌تواند مدل‌های با سایز دو برابر DRAM را در تلفن همراه با سرعت اجرای (inference) بسیار بیشتر از روش‌های رایج لود کردن مدل در CPU یا GPU اجرا کند. ارائه این دستاورد امیدها را برای فراهم کردن قابلیت‌های خارق‌العاده مدل‌های بزرگ زبانی در تلفن‌های همراه هوشمند بسیار کرده است. به نظر می‌رسد اپل که در این رقابت تنگاتنگ Generative AI ساکت مانده، نقشه‌های بزرگی را در سر می‌پروراند. برای مطالعه جزئیات فنی بیشتر این مقاله را بخوانید.

#apple

@dumannewsletter
رقابت Intel با NVIDIA و AMD برای تولید چیپ‌های هوش‌مصنوعی

اخیراً شرکت Intel نسخه جدید چیپ مخصوص هوش‌مصنوعی مولد خود را با نام Gaudi3 معرفی کرد. این چیپ در سال ۲۰۲۴ میلادی به دست مشتریان خواهد رسید و قرار است با نمونه‌های مشابه که توسط NVIDIA و AMD ساخته شده رقابت کند. تولید چیپ‌های Gaudi توسط اینتل از سال ۲۰۱۹ آغاز شده است. اینتل علاوه بر معرفی این چیپ، به پردازنده‌های مخصوص کامپیوتر شخصی (Core Ultra) و سرور (Xeon) نیز قسمتی به نام NPU اضافه کرده تا سرعت اجرای مدل‌های هوش‌مصنوعی در این پردازنده‌ها افزایش پیدا کند. ترند شدن هوش مصنوعی در سال‌های اخیر منجر به رشد تقاضا برای چیپ‌های هوش‌مصنوعی شده است. به همین دلیل ارزش شرکت NVIDIA در این برهه زمانی چند برابر شده است. شرکت‌های Intel و AMD نیز در تلاش هستند از این فرصت استفاده کنند.

همچنین برای آشنایی بیشتر با صنعت تراشه این مقالات را بخوانید:
👈 جنگ تراشه
👈 جولان NVIDIA در موج هوش‌مصنوعی

#intel
#gaudi

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
ربات انسان‌نمای Figure قهوه درست می‌کند! ☕️

شرکت رباتیک Figure دقت و ظرافت ربات انسان‌نمای خود به نام Figure 01 را با تهیه یک لیوان قهوه در معرض نمایش گذاشت. ربات Figure 01 با ۱۰ ساعت ویدئو تهیه قهوه توسط انسان آموزش داده شده است.

#robotics
#figure

@dumannewsletter
انتشار فریم‌ورک MLX توسط اپل

تیم یادگیری ماشین اپل فریم‌ورک MLX را برای توسعه و استقرار ساده‌تر مدل‌های هوش‌مصنوعی در پردازنده‌های سری M اپل موسوم به Apple Silicon منتشر کرد. این فریم‌ورک برای پردازش‌های برداری در یادگیری ماشین با الهام از فریم‌ورک‌‌های مشابه نظیر Numpy و PyTorch طراحی شده است. برای جزئیات فنی بیشتر ریپوزیتوری گیت‌هاب این پروژه را از اینجا مشاهده کنید.

#apple
#mlx

@dumannewsletter
گزارش رویداد CES 2024 | معرفی محصولات جدید مبتنی بر هوش‌مصنوعی

نمایشگاه CES یکی از بزرگترین رویدادهای تکنولوژی در دنیاست که هر ساله با حضور کمپانی‌های تکنولوژی و علاقه‌مندان آن برگزار می‌شود. رویداد امسال CES 2024 در لاس‌وگاس آمریکا در حال برگزاری است (۹ الی ۱۲ ژانویه). امسال نیز مانند سال‌های گذشته نوآوری‌ها و محصولات جدید تکنولوژی معرفی شده است. همان‌طور که انتظار می‌رود، نقش هوش‌مصنوعی در این رویداد نیز پررنگ بوده و محصولات جدیدی مبتنی بر آن معرفی شده است. در این مقاله تعدادی از این محصولات معرفی شده است.
( تا پایان رویداد به روز می شود)

#ces2024
#ces

@dumannewsletter