خبرنامه هوش مصنوعی دومان
711 subscribers
265 photos
180 videos
2 files
307 links
ابزار، نوآوری‌ها و اخبار هوش مصنوعی و رباتیک

📌 ارتباط با من:

dumannewsletter@gmail.com

📌 لینک Boost کانال:

https://t.me/dumannewsletter?boost

📌 آرشیو وبسایت (به روز نمی‌شود):

duman.pouyae.ir

#هوش_مصنوعی
#رباتیک
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
تسلا از نسخه جدید ربات اپتیموس رونمایی کرد.

نسخه Gen2 ربات انسان‌نمای تسلا معرفی شد. این نسخه ۱۰ کیلوگرم وزن کمتر نسبت به نسخه قبلی دارد. سرعت راه رفتن آن نیز ۳۰درصد افزایش داشته است. همچنین با تغییراتی که اعمال شده، تعادل و کنترل بیشتری روی اجزای مختلف خود دارد.

#tesla
#optimus
#robotics

@dumannewsletter
نسخه ۲ مدل Imagen توسط گوگل DeepMind منتشر شد.

گوگل DeepMind از نسخه ۲ مدل Imagen رونمایی کرد. این مدل مشابه DALL.E برای تولید عکس از متن استفاده می‌شود. Imagen 2 از تکنیک Diffusion برای تولید تصویر استفاده می‌کند. در حال حاضر این مدل از طریق سرویس Vertex AI در پلتفرم ابری گوگل در دسترس کاربران قرار گرفته است.

#deepmind
#google
#imagen

@dumannewsletter
به حرکت درآوردن تصاویر توسط DreaMoving

گروهی از محققان شرکت چینی علی‌بابا مدلی برای تولید ویدئو رقص از روی تصویر ارائه کردند. این مدل از روش Diffusion برای تولید ویدئو استفاده کرده و DreaMoving نام دارد. برای تولید ویدئو باید تصویر مرجع و دنباله حرکات به همراه یک توضیح متنی به مدل داده شود. برای مطالعه جزئیات فنی اینجا را بخوانید. اخیراً نمونه مشابهی به نام MagicAnimate نیز معرفی شده بود.

#dreamoving
#alibaba

@dumannewsletter
استفاده از هوش‌مصنوعی در صنعت فشن و مد

گروهی از محققان شرکت علی‌بابا مدل جدید هوش‌مصنوعی برای به تن کردن انواع لباس در یک تصویر ارائه کردند. این روش نیز از متد Diffusion برای تولید تصویر جدید استفاده کرده و Outfit Anyone نام دارد. این محققان در ادامه از خروجی این مدل در کنار مدل قبلی علی‌بابا به نام Animate Anyone برای به حرکت درآوردن تصویر جدید بهره برده‌اند. قابل ذکر است که علی‌بابا اخیراً مدل دیگری به نام DreaMoving را برای به حرکت درآوردن تصویر انسان معرفی کرد. برای مطالعه جزئیات فنی در مورد پروژه Outfit Anyone اینجا را بخوانید.

#outfit_anyone
#alibaba

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
حذف نویز محیط در گوشی‌های پیکسل گوگل

قابلیت حذف نویز محیط در گوشی‌های هوشمند پیکسل گوگل با همکاری بخش Google Research توسعه داده شده است. این قابلیت از یک مدل audio-to-audio برای کاهش نویز استفاده می‌کند. در حال حاضر این قابلیت کل بازه فرکانسی صدا را پوشش داده و با کمترین تاخیر صدای بهبود یافته را برای کاربر پخش می‌کند.

#google
#pixel

@dumannewsletter
استفاده از هوش‌مصنوعی مولد برای تولید داروی سرطان

دو شرکت آسترازنکا (AstraZeneca) و ابسکی (Absci) در یک همکاری مشترک به ارزش ۲۴۷ میلیون دلار با استفاده از هوش‌مصنوعی برای کشف داروی جدید سرطان اقدام می‌کنند. ابسکی در زمینه کشف دارو (Drug Discovery) فعالیت داشته و در سال‌های اخیر توانسته با استفاده از هوش‌مصنوعی مولد (GenAI) در کشف داروهای جدید به نتایج قابل توجهی دست پیدا کند. تولید داروی جدید بسیار هزینه‌بر بوده و شانس موفقیت پایینی دارد ولی با استفاده از هوش‌مصنوعی درهای جدیدی به روی این صنعت باز شده است. سال جاری ابسکی اعلام کرد با استفاده از تکنیک Zero Shot در یادگیری ماشین توانسته آنتی‌بادی De Novo را به صورت مجازی تولید کند (اینجا را مشاهده کنید). این تکنیک امکان تجزیه و تحلیل دیتایی که در پروسه آموزش مدل وجود نداشته را برای آن فراهم می‌سازد.

#absci
#zero_shot

@dumannewsletter
معرفی مدل AudioBox از متا

مدل Audiobox توسط متا برای تولید و بهبود کیفیت صوت معرفی شده است. این مدل در واقع نسل بعدی مدل Voicebox است که در ابتدای سال جاری معرفی شده بود. قابلیت‌های خارق‌العاده Audiobox را می‌توانید از اینجا تست کنید.

#meta
#audiobox

@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
تولید موسیقی با MusicFX

گوگل مدل جدید خود برای تولید موسیقی را به صورت محدود در دسترس عموم قرار داده است. این مدل MusicFX نام داشته و برای ثبت‌نام در لیست انتظار آن به اینجا مراجعه کنید. این مدل با دریافت Prompt از کاربر موسیقی مورد نظر را تولید می‌کند. ویدئویی که در تصویر مشاهده می‌کنید نمونه‌ای از خروجی MusicFX است.

#google
#musicfx

@dumannewsletter
سه بعدی‌سازی تصاویر با Stable Zero123

شرکت Stability AI نسخه جدید مدل سه‌بعدی ساز خود را با نام Stable Zero123 منتشر کرد. این نسخه نسبت به مدل قبلی یعنی Zero123-XL بهبود قابل توجهی داشته است. این بهبود در تصاویر فوق نمایش داده شده است. Stable Zero123 به صورت اپن‌سورس صرفاً برای اهداف تحقیقاتی منتشر شده است. برای دسترسی به مدل و جزئیات فنی بیشتر به اینجا مراجعه کنید.

#stability_ai
#stable_zero123

@dumannewsletter
مایکروسافت مدل Phi2 را معرفی کرد.

​​​​با داغ شدن مسابقه مدل‌های بزرگ زبانی (LLM) شاهد معرفی مدل‌های کوچک زبانی (SLM) نیز هستیم. در حال حاضر LL​​​​Mها از چند ده میلیارد، تا چند میلیارد و حتی چند تریلیون پارامتر دارند. هر چقدر تعداد پارامترهای یک مدل بیشتر باشد، پروسه آموزش آن زمان‌بر و هزینه‌بر شده و در نهایت خروجی آن نیز سایز زیادی خواهد داشت. اجرای مدل‌های بزرگ زبانی نیازمند منابع پردازشی زیاد است. از این‌رو، برای فراهم کردن قابلیت‌های مدل‌های زبانی برای پلتفرم‌های مختلف شاهد توسعه و معرفی مدل‌های کوچک زبانی یا SLMها هستیم. کاهش سایز مدل زبانی و در عین حال افزایش کیفیت آن از ترندهای موجود در حوزه هوش‌مصنوعی مولد است. مدل Phi یکی از این SLMها بوده که توسط مایکروسافت منتشر شده است. نسخه Phi2 که به تازگی منتشر شده در مقایسه با نمونه‌های مشابه نتایج درخور توجهی داشته است.​​​​

👈 برای جزئیات بیشتر درباره این مدل اینجا را بخوانید.

#phi
#microsoft

@dumannewsletter
تولید موسیقی با Copilot

مایکروسافت با همکاری Suno قابلیت تولید موسیقی را به Copilot اضافه کرد. برای استفاده از این قابلیت مراحل زیر را انجام دهید:

۱. پس از نصب مرورگر Microsoft Edge وارد آدرس copilot.microsoft.com شوید.
۲. وارد حساب کاربری مایکروسافت خود شده و یا حساب جدید بسازید.
۳. در قسمت plugins از فعال بودن Suno مطمئن شوید.
۴. با نوشتن Prompt مورد نظر موسیقی خود را تحویل بگیرید.

ضمناً از اینجا مستقیم می‌توانید با Suno موسیقی موردنظر خود را بسازید.

#microsoft
#suno
#copilot

@dumannewsletter
Please open Telegram to view this post
VIEW IN TELEGRAM
شماره دوازدهم خبرنامه هوش‌مصنوعی دومان منتشر شد!

در این شماره شاهد معرفی تحقیقات و محصولات متنوعی در زمینه هوش‌مصنوعی مولد (Generative AI) هستیم. همان‌طور که انتظار می‌رود با سرمایه‌گذاری‌های کلان انجام شده ایده‌های مختلف و قابل توجهی در این حوزه در حال شکل‌گیری است. فعلاً تمرکز روی مدل‌های مبتنی بر Diffusion است. در این شماره مدل‌های جدیدی برای تولید تصویر، به حرکت درآوردن تصویر و تولید موسیقی و صوت معرفی شده است. دنیای مدل‌های زبانی نیز خیلی پر و صدا بود! بالاخره بعد از ماه‌ها انتظار رقیب ChatGPT توسط گوگل وارد میدان شد و توجه زیادی را به خود جلب کرد! مدل‌های اپن‌سورس Mistral 8X7B و Phi2 نیز معرفی شده و سایر مدل‌های مشابه را به چالش کشیدند. تلاش‌ها برای نمود فیزیکی هوش‌مصنوعی در قالب ربات‌های انسان‌نما نیز ادامه دارد. برای جزئیات بیشتر ادامه خبرنامه را مطالعه کنید.

👈 برای مطالعه شماره دوازدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پست‌الکترونیک خود هستید از اینجا ثبت‌نام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.

#خبرنامه

@dumannewsletter
نسخه ۶ سرویس Midjourney اخیراً منتشر شد. در این تصویر بهبود تصاویر تولید شده توسط این مدل هوش‌مصنوعی در حدود یک و نیم سال گذشته را مشاهده می‌کنید. Midjourney در زمینه خلق تصویر با هوش‌مصنوعی مولد با مدل‌های DALL.E، Google Imagen و Stable Diffusion رقابت می‌کند.

#midjourney

@dumannewsletter
دستاورد چشم‌گیر اپل برای اجرای مدل‌های زبانی در تلفن‌همراه

مدل‌های بزرگ زبانی برای اجرا به مموری زیادی نیاز دارند از این رو برای اجرای آن در تلفن‌های همراه هوشمند محدودیت ایجاد می‌شود. در آزمایش جدیدی که توسط مهندسان اپل انجام شده با معرفی دو روش جدید به نام‌های windowing و row-column bundling از ظرفیت Flash Memory برای حل کمبود DRAM استفاده شده است. این روش با تطبیق میزان مصرف مموری براساس محدودیت‌های سخت‌افزاری به شکل بهینه‌ای از منابع موجود استفاده می‌کند. طبق نتایج ارائه شده، این روش می‌تواند مدل‌های با سایز دو برابر DRAM را در تلفن همراه با سرعت اجرای (inference) بسیار بیشتر از روش‌های رایج لود کردن مدل در CPU یا GPU اجرا کند. ارائه این دستاورد امیدها را برای فراهم کردن قابلیت‌های خارق‌العاده مدل‌های بزرگ زبانی در تلفن‌های همراه هوشمند بسیار کرده است. به نظر می‌رسد اپل که در این رقابت تنگاتنگ Generative AI ساکت مانده، نقشه‌های بزرگی را در سر می‌پروراند. برای مطالعه جزئیات فنی بیشتر این مقاله را بخوانید.

#apple

@dumannewsletter