خبرنامه هوش مصنوعی دومان

0:05

0:05

به حرکت درآوردن تصاویر توسط DreaMoving

گروهی از محققان شرکت چینی علی‌بابا مدلی برای تولید ویدئو رقص از روی تصویر ارائه کردند. این مدل از روش Diffusion برای تولید ویدئو استفاده کرده و DreaMoving نام دارد. برای تولید ویدئو باید تصویر مرجع و دنباله حرکات به همراه یک توضیح متنی به مدل داده شود. برای مطالعه جزئیات فنی اینجا را بخوانید. اخیراً نمونه مشابهی به نام MagicAnimate نیز معرفی شده بود.

#dreamoving
#alibaba

@dumannewsletter

402 views11:14

0:11

0:31

استفاده از هوش‌مصنوعی در صنعت فشن و مد

گروهی از محققان شرکت علی‌بابا مدل جدید هوش‌مصنوعی برای به تن کردن انواع لباس در یک تصویر ارائه کردند. این روش نیز از متد Diffusion برای تولید تصویر جدید استفاده کرده و Outfit Anyone نام دارد. این محققان در ادامه از خروجی این مدل در کنار مدل قبلی علی‌بابا به نام Animate Anyone برای به حرکت درآوردن تصویر جدید بهره برده‌اند. قابل ذکر است که علی‌بابا اخیراً مدل دیگری به نام DreaMoving را برای به حرکت درآوردن تصویر انسان معرفی کرد. برای مطالعه جزئیات فنی در مورد پروژه Outfit Anyone اینجا را بخوانید.

#outfit_anyone
#alibaba

@dumannewsletter

456 views07:43

0:14

حذف نویز محیط در گوشی‌های پیکسل گوگل

قابلیت حذف نویز محیط در گوشی‌های هوشمند پیکسل گوگل با همکاری بخش Google Research توسعه داده شده است. این قابلیت از یک مدل audio-to-audio برای کاهش نویز استفاده می‌کند. در حال حاضر این قابلیت کل بازه فرکانسی صدا را پوشش داده و با کمترین تاخیر صدای بهبود یافته را برای کاربر پخش می‌کند.

#google
#pixel

@dumannewsletter

532 views07:58

استفاده از هوش‌مصنوعی مولد برای تولید داروی سرطان

دو شرکت آسترازنکا (AstraZeneca) و ابسکی (Absci) در یک همکاری مشترک به ارزش ۲۴۷ میلیون دلار با استفاده از هوش‌مصنوعی برای کشف داروی جدید سرطان اقدام می‌کنند. ابسکی در زمینه کشف دارو (Drug Discovery) فعالیت داشته و در سال‌های اخیر توانسته با استفاده از هوش‌مصنوعی مولد (GenAI) در کشف داروهای جدید به نتایج قابل توجهی دست پیدا کند. تولید داروی جدید بسیار هزینه‌بر بوده و شانس موفقیت پایینی دارد ولی با استفاده از هوش‌مصنوعی درهای جدیدی به روی این صنعت باز شده است. سال جاری ابسکی اعلام کرد با استفاده از تکنیک Zero Shot در یادگیری ماشین توانسته آنتی‌بادی De Novo را به صورت مجازی تولید کند (اینجا را مشاهده کنید). این تکنیک امکان تجزیه و تحلیل دیتایی که در پروسه آموزش مدل وجود نداشته را برای آن فراهم می‌سازد.

#absci
#zero_shot

@dumannewsletter

505 views12:53

معرفی مدل AudioBox از متا

مدل Audiobox توسط متا برای تولید و بهبود کیفیت صوت معرفی شده است. این مدل در واقع نسل بعدی مدل Voicebox است که در ابتدای سال جاری معرفی شده بود. قابلیت‌های خارق‌العاده Audiobox را می‌توانید از اینجا تست کنید.

#meta
#audiobox

@dumannewsletter

448 views21:52

0:30

تولید موسیقی با MusicFX

گوگل مدل جدید خود برای تولید موسیقی را به صورت محدود در دسترس عموم قرار داده است. این مدل MusicFX نام داشته و برای ثبت‌نام در لیست انتظار آن به اینجا مراجعه کنید. این مدل با دریافت Prompt از کاربر موسیقی مورد نظر را تولید می‌کند. ویدئویی که در تصویر مشاهده می‌کنید نمونه‌ای از خروجی MusicFX است.

#google
#musicfx

@dumannewsletter

485 views22:03

0:04

سه بعدی‌سازی تصاویر با Stable Zero123

شرکت Stability AI نسخه جدید مدل سه‌بعدی ساز خود را با نام Stable Zero123 منتشر کرد. این نسخه نسبت به مدل قبلی یعنی Zero123-XL بهبود قابل توجهی داشته است. این بهبود در تصاویر فوق نمایش داده شده است. Stable Zero123 به صورت اپن‌سورس صرفاً برای اهداف تحقیقاتی منتشر شده است. برای دسترسی به مدل و جزئیات فنی بیشتر به اینجا مراجعه کنید.

#stability_ai
#stable_zero123

@dumannewsletter

588 views22:16

مایکروسافت مدل Phi2 را معرفی کرد.

با داغ شدن مسابقه مدل‌های بزرگ زبانی (LLM) شاهد معرفی مدل‌های کوچک زبانی (SLM) نیز هستیم. در حال حاضر LLMها از چند ده میلیارد، تا چند میلیارد و حتی چند تریلیون پارامتر دارند. هر چقدر تعداد پارامترهای یک مدل بیشتر باشد، پروسه آموزش آن زمان‌بر و هزینه‌بر شده و در نهایت خروجی آن نیز سایز زیادی خواهد داشت. اجرای مدل‌های بزرگ زبانی نیازمند منابع پردازشی زیاد است. از این‌رو، برای فراهم کردن قابلیت‌های مدل‌های زبانی برای پلتفرم‌های مختلف شاهد توسعه و معرفی مدل‌های کوچک زبانی یا SLMها هستیم. کاهش سایز مدل زبانی و در عین حال افزایش کیفیت آن از ترندهای موجود در حوزه هوش‌مصنوعی مولد است. مدل Phi یکی از این SLMها بوده که توسط مایکروسافت منتشر شده است. نسخه Phi2 که به تازگی منتشر شده در مقایسه با نمونه‌های مشابه نتایج درخور توجهی داشته است.

👈 برای جزئیات بیشتر درباره این مدل اینجا را بخوانید.

#phi
#microsoft

@dumannewsletter

596 views16:59

0:09

0:31

تولید موسیقی با Copilot

مایکروسافت با همکاری Suno قابلیت تولید موسیقی را به Copilot اضافه کرد. برای استفاده از این قابلیت مراحل زیر را انجام دهید:

۱. پس از نصب مرورگر Microsoft Edge وارد آدرس copilot.microsoft.com شوید.
۲. وارد حساب کاربری مایکروسافت خود شده و یا حساب جدید بسازید.
۳. در قسمت plugins از فعال بودن Suno مطمئن شوید.
۴. با نوشتن Prompt مورد نظر موسیقی خود را تحویل بگیرید.

ضمناً از اینجا مستقیم می‌توانید با Suno موسیقی موردنظر خود را بسازید.

#microsoft
#suno
#copilot

@dumannewsletter

518 views14:35

Please open Telegram to view this post

VIEW IN TELEGRAM

578 viewsedited 15:27

شماره دوازدهم خبرنامه هوش‌مصنوعی دومان منتشر شد!

در این شماره شاهد معرفی تحقیقات و محصولات متنوعی در زمینه هوش‌مصنوعی مولد (Generative AI) هستیم. همان‌طور که انتظار می‌رود با سرمایه‌گذاری‌های کلان انجام شده ایده‌های مختلف و قابل توجهی در این حوزه در حال شکل‌گیری است. فعلاً تمرکز روی مدل‌های مبتنی بر Diffusion است. در این شماره مدل‌های جدیدی برای تولید تصویر، به حرکت درآوردن تصویر و تولید موسیقی و صوت معرفی شده است. دنیای مدل‌های زبانی نیز خیلی پر و صدا بود! بالاخره بعد از ماه‌ها انتظار رقیب ChatGPT توسط گوگل وارد میدان شد و توجه زیادی را به خود جلب کرد! مدل‌های اپن‌سورس Mistral 8X7B و Phi2 نیز معرفی شده و سایر مدل‌های مشابه را به چالش کشیدند. تلاش‌ها برای نمود فیزیکی هوش‌مصنوعی در قالب ربات‌های انسان‌نما نیز ادامه دارد. برای جزئیات بیشتر ادامه خبرنامه را مطالعه کنید.

👈 برای مطالعه شماره دوازدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پست‌الکترونیک خود هستید از اینجا ثبت‌نام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.

#خبرنامه

@dumannewsletter

617 views09:52

نسخه ۶ سرویس Midjourney اخیراً منتشر شد. در این تصویر بهبود تصاویر تولید شده توسط این مدل هوش‌مصنوعی در حدود یک و نیم سال گذشته را مشاهده می‌کنید. Midjourney در زمینه خلق تصویر با هوش‌مصنوعی مولد با مدل‌های DALL.E، Google Imagen و Stable Diffusion رقابت می‌کند.

#midjourney

@dumannewsletter

684 views15:00