خبرنامه هوش مصنوعی دومان

0:31

استفاده از هوش‌مصنوعی در صنعت فشن و مد

گروهی از محققان شرکت علی‌بابا مدل جدید هوش‌مصنوعی برای به تن کردن انواع لباس در یک تصویر ارائه کردند. این روش نیز از متد Diffusion برای تولید تصویر جدید استفاده کرده و Outfit Anyone نام دارد. این محققان در ادامه از خروجی این مدل در کنار مدل قبلی علی‌بابا به نام Animate Anyone برای به حرکت درآوردن تصویر جدید بهره برده‌اند. قابل ذکر است که علی‌بابا اخیراً مدل دیگری به نام DreaMoving را برای به حرکت درآوردن تصویر انسان معرفی کرد. برای مطالعه جزئیات فنی در مورد پروژه Outfit Anyone اینجا را بخوانید.

#outfit_anyone
#alibaba

@dumannewsletter

455 views07:43

0:14

حذف نویز محیط در گوشی‌های پیکسل گوگل

قابلیت حذف نویز محیط در گوشی‌های هوشمند پیکسل گوگل با همکاری بخش Google Research توسعه داده شده است. این قابلیت از یک مدل audio-to-audio برای کاهش نویز استفاده می‌کند. در حال حاضر این قابلیت کل بازه فرکانسی صدا را پوشش داده و با کمترین تاخیر صدای بهبود یافته را برای کاربر پخش می‌کند.

#google
#pixel

@dumannewsletter

531 views07:58

استفاده از هوش‌مصنوعی مولد برای تولید داروی سرطان

دو شرکت آسترازنکا (AstraZeneca) و ابسکی (Absci) در یک همکاری مشترک به ارزش ۲۴۷ میلیون دلار با استفاده از هوش‌مصنوعی برای کشف داروی جدید سرطان اقدام می‌کنند. ابسکی در زمینه کشف دارو (Drug Discovery) فعالیت داشته و در سال‌های اخیر توانسته با استفاده از هوش‌مصنوعی مولد (GenAI) در کشف داروهای جدید به نتایج قابل توجهی دست پیدا کند. تولید داروی جدید بسیار هزینه‌بر بوده و شانس موفقیت پایینی دارد ولی با استفاده از هوش‌مصنوعی درهای جدیدی به روی این صنعت باز شده است. سال جاری ابسکی اعلام کرد با استفاده از تکنیک Zero Shot در یادگیری ماشین توانسته آنتی‌بادی De Novo را به صورت مجازی تولید کند (اینجا را مشاهده کنید). این تکنیک امکان تجزیه و تحلیل دیتایی که در پروسه آموزش مدل وجود نداشته را برای آن فراهم می‌سازد.

#absci
#zero_shot

@dumannewsletter

505 views12:53

معرفی مدل AudioBox از متا

مدل Audiobox توسط متا برای تولید و بهبود کیفیت صوت معرفی شده است. این مدل در واقع نسل بعدی مدل Voicebox است که در ابتدای سال جاری معرفی شده بود. قابلیت‌های خارق‌العاده Audiobox را می‌توانید از اینجا تست کنید.

#meta
#audiobox

@dumannewsletter

447 views21:52

0:30

تولید موسیقی با MusicFX

گوگل مدل جدید خود برای تولید موسیقی را به صورت محدود در دسترس عموم قرار داده است. این مدل MusicFX نام داشته و برای ثبت‌نام در لیست انتظار آن به اینجا مراجعه کنید. این مدل با دریافت Prompt از کاربر موسیقی مورد نظر را تولید می‌کند. ویدئویی که در تصویر مشاهده می‌کنید نمونه‌ای از خروجی MusicFX است.

#google
#musicfx

@dumannewsletter

484 views22:03

0:04

سه بعدی‌سازی تصاویر با Stable Zero123

شرکت Stability AI نسخه جدید مدل سه‌بعدی ساز خود را با نام Stable Zero123 منتشر کرد. این نسخه نسبت به مدل قبلی یعنی Zero123-XL بهبود قابل توجهی داشته است. این بهبود در تصاویر فوق نمایش داده شده است. Stable Zero123 به صورت اپن‌سورس صرفاً برای اهداف تحقیقاتی منتشر شده است. برای دسترسی به مدل و جزئیات فنی بیشتر به اینجا مراجعه کنید.

#stability_ai
#stable_zero123

@dumannewsletter

587 views22:16

مایکروسافت مدل Phi2 را معرفی کرد.

با داغ شدن مسابقه مدل‌های بزرگ زبانی (LLM) شاهد معرفی مدل‌های کوچک زبانی (SLM) نیز هستیم. در حال حاضر LLMها از چند ده میلیارد، تا چند میلیارد و حتی چند تریلیون پارامتر دارند. هر چقدر تعداد پارامترهای یک مدل بیشتر باشد، پروسه آموزش آن زمان‌بر و هزینه‌بر شده و در نهایت خروجی آن نیز سایز زیادی خواهد داشت. اجرای مدل‌های بزرگ زبانی نیازمند منابع پردازشی زیاد است. از این‌رو، برای فراهم کردن قابلیت‌های مدل‌های زبانی برای پلتفرم‌های مختلف شاهد توسعه و معرفی مدل‌های کوچک زبانی یا SLMها هستیم. کاهش سایز مدل زبانی و در عین حال افزایش کیفیت آن از ترندهای موجود در حوزه هوش‌مصنوعی مولد است. مدل Phi یکی از این SLMها بوده که توسط مایکروسافت منتشر شده است. نسخه Phi2 که به تازگی منتشر شده در مقایسه با نمونه‌های مشابه نتایج درخور توجهی داشته است.

👈 برای جزئیات بیشتر درباره این مدل اینجا را بخوانید.

#phi
#microsoft

@dumannewsletter

596 views16:59

0:09

0:31

تولید موسیقی با Copilot

مایکروسافت با همکاری Suno قابلیت تولید موسیقی را به Copilot اضافه کرد. برای استفاده از این قابلیت مراحل زیر را انجام دهید:

۱. پس از نصب مرورگر Microsoft Edge وارد آدرس copilot.microsoft.com شوید.
۲. وارد حساب کاربری مایکروسافت خود شده و یا حساب جدید بسازید.
۳. در قسمت plugins از فعال بودن Suno مطمئن شوید.
۴. با نوشتن Prompt مورد نظر موسیقی خود را تحویل بگیرید.

ضمناً از اینجا مستقیم می‌توانید با Suno موسیقی موردنظر خود را بسازید.

#microsoft
#suno
#copilot

@dumannewsletter

518 views14:35

Please open Telegram to view this post

VIEW IN TELEGRAM

577 viewsedited 15:27

شماره دوازدهم خبرنامه هوش‌مصنوعی دومان منتشر شد!

در این شماره شاهد معرفی تحقیقات و محصولات متنوعی در زمینه هوش‌مصنوعی مولد (Generative AI) هستیم. همان‌طور که انتظار می‌رود با سرمایه‌گذاری‌های کلان انجام شده ایده‌های مختلف و قابل توجهی در این حوزه در حال شکل‌گیری است. فعلاً تمرکز روی مدل‌های مبتنی بر Diffusion است. در این شماره مدل‌های جدیدی برای تولید تصویر، به حرکت درآوردن تصویر و تولید موسیقی و صوت معرفی شده است. دنیای مدل‌های زبانی نیز خیلی پر و صدا بود! بالاخره بعد از ماه‌ها انتظار رقیب ChatGPT توسط گوگل وارد میدان شد و توجه زیادی را به خود جلب کرد! مدل‌های اپن‌سورس Mistral 8X7B و Phi2 نیز معرفی شده و سایر مدل‌های مشابه را به چالش کشیدند. تلاش‌ها برای نمود فیزیکی هوش‌مصنوعی در قالب ربات‌های انسان‌نما نیز ادامه دارد. برای جزئیات بیشتر ادامه خبرنامه را مطالعه کنید.

👈 برای مطالعه شماره دوازدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پست‌الکترونیک خود هستید از اینجا ثبت‌نام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.

#خبرنامه

@dumannewsletter

616 views09:52

نسخه ۶ سرویس Midjourney اخیراً منتشر شد. در این تصویر بهبود تصاویر تولید شده توسط این مدل هوش‌مصنوعی در حدود یک و نیم سال گذشته را مشاهده می‌کنید. Midjourney در زمینه خلق تصویر با هوش‌مصنوعی مولد با مدل‌های DALL.E، Google Imagen و Stable Diffusion رقابت می‌کند.

#midjourney

@dumannewsletter

683 views15:00

دستاورد چشم‌گیر اپل برای اجرای مدل‌های زبانی در تلفن‌همراه

مدل‌های بزرگ زبانی برای اجرا به مموری زیادی نیاز دارند از این رو برای اجرای آن در تلفن‌های همراه هوشمند محدودیت ایجاد می‌شود. در آزمایش جدیدی که توسط مهندسان اپل انجام شده با معرفی دو روش جدید به نام‌های windowing و row-column bundling از ظرفیت Flash Memory برای حل کمبود DRAM استفاده شده است. این روش با تطبیق میزان مصرف مموری براساس محدودیت‌های سخت‌افزاری به شکل بهینه‌ای از منابع موجود استفاده می‌کند. طبق نتایج ارائه شده، این روش می‌تواند مدل‌های با سایز دو برابر DRAM را در تلفن همراه با سرعت اجرای (inference) بسیار بیشتر از روش‌های رایج لود کردن مدل در CPU یا GPU اجرا کند. ارائه این دستاورد امیدها را برای فراهم کردن قابلیت‌های خارق‌العاده مدل‌های بزرگ زبانی در تلفن‌های همراه هوشمند بسیار کرده است. به نظر می‌رسد اپل که در این رقابت تنگاتنگ Generative AI ساکت مانده، نقشه‌های بزرگی را در سر می‌پروراند. برای مطالعه جزئیات فنی بیشتر این مقاله را بخوانید.

#apple

@dumannewsletter

792 views11:29

رقابت Intel با NVIDIA و AMD برای تولید چیپ‌های هوش‌مصنوعی

اخیراً شرکت Intel نسخه جدید چیپ مخصوص هوش‌مصنوعی مولد خود را با نام Gaudi3 معرفی کرد. این چیپ در سال ۲۰۲۴ میلادی به دست مشتریان خواهد رسید و قرار است با نمونه‌های مشابه که توسط NVIDIA و AMD ساخته شده رقابت کند. تولید چیپ‌های Gaudi توسط اینتل از سال ۲۰۱۹ آغاز شده است. اینتل علاوه بر معرفی این چیپ، به پردازنده‌های مخصوص کامپیوتر شخصی (Core Ultra) و سرور (Xeon) نیز قسمتی به نام NPU اضافه کرده تا سرعت اجرای مدل‌های هوش‌مصنوعی در این پردازنده‌ها افزایش پیدا کند. ترند شدن هوش مصنوعی در سال‌های اخیر منجر به رشد تقاضا برای چیپ‌های هوش‌مصنوعی شده است. به همین دلیل ارزش شرکت NVIDIA در این برهه زمانی چند برابر شده است. شرکت‌های Intel و AMD نیز در تلاش هستند از این فرصت استفاده کنند.

همچنین برای آشنایی بیشتر با صنعت تراشه این مقالات را بخوانید:
👈 جنگ تراشه
👈 جولان NVIDIA در موج هوش‌مصنوعی

#intel
#gaudi

@dumannewsletter

739 viewsedited 18:42

1:22

ربات انسان‌نمای Figure قهوه درست می‌کند! ☕️

شرکت رباتیک Figure دقت و ظرافت ربات انسان‌نمای خود به نام Figure 01 را با تهیه یک لیوان قهوه در معرض نمایش گذاشت. ربات Figure 01 با ۱۰ ساعت ویدئو تهیه قهوه توسط انسان آموزش داده شده است.

#robotics
#figure

@dumannewsletter

500 viewsedited 16:20

انتشار فریم‌ورک MLX توسط اپل

تیم یادگیری ماشین اپل فریم‌ورک MLX را برای توسعه و استقرار ساده‌تر مدل‌های هوش‌مصنوعی در پردازنده‌های سری M اپل موسوم به Apple Silicon منتشر کرد. این فریم‌ورک برای پردازش‌های برداری در یادگیری ماشین با الهام از فریم‌ورک‌‌های مشابه نظیر Numpy و PyTorch طراحی شده است. برای جزئیات فنی بیشتر ریپوزیتوری گیت‌هاب این پروژه را از اینجا مشاهده کنید.

#apple
#mlx

@dumannewsletter

484 views16:23