This media is not supported in your browser
VIEW IN TELEGRAM
تسلا از نسخه جدید ربات اپتیموس رونمایی کرد.
نسخه Gen2 ربات انساننمای تسلا معرفی شد. این نسخه ۱۰ کیلوگرم وزن کمتر نسبت به نسخه قبلی دارد. سرعت راه رفتن آن نیز ۳۰درصد افزایش داشته است. همچنین با تغییراتی که اعمال شده، تعادل و کنترل بیشتری روی اجزای مختلف خود دارد.
#tesla
#optimus
#robotics
@dumannewsletter
نسخه Gen2 ربات انساننمای تسلا معرفی شد. این نسخه ۱۰ کیلوگرم وزن کمتر نسبت به نسخه قبلی دارد. سرعت راه رفتن آن نیز ۳۰درصد افزایش داشته است. همچنین با تغییراتی که اعمال شده، تعادل و کنترل بیشتری روی اجزای مختلف خود دارد.
#tesla
#optimus
#robotics
@dumannewsletter
نسخه ۲ مدل Imagen توسط گوگل DeepMind منتشر شد.
گوگل DeepMind از نسخه ۲ مدل Imagen رونمایی کرد. این مدل مشابه DALL.E برای تولید عکس از متن استفاده میشود. Imagen 2 از تکنیک Diffusion برای تولید تصویر استفاده میکند. در حال حاضر این مدل از طریق سرویس Vertex AI در پلتفرم ابری گوگل در دسترس کاربران قرار گرفته است.
#deepmind
#google
#imagen
@dumannewsletter
گوگل DeepMind از نسخه ۲ مدل Imagen رونمایی کرد. این مدل مشابه DALL.E برای تولید عکس از متن استفاده میشود. Imagen 2 از تکنیک Diffusion برای تولید تصویر استفاده میکند. در حال حاضر این مدل از طریق سرویس Vertex AI در پلتفرم ابری گوگل در دسترس کاربران قرار گرفته است.
#deepmind
#imagen
@dumannewsletter
به حرکت درآوردن تصاویر توسط DreaMoving
گروهی از محققان شرکت چینی علیبابا مدلی برای تولید ویدئو رقص از روی تصویر ارائه کردند. این مدل از روش Diffusion برای تولید ویدئو استفاده کرده و DreaMoving نام دارد. برای تولید ویدئو باید تصویر مرجع و دنباله حرکات به همراه یک توضیح متنی به مدل داده شود. برای مطالعه جزئیات فنی اینجا را بخوانید. اخیراً نمونه مشابهی به نام MagicAnimate نیز معرفی شده بود.
#dreamoving
#alibaba
@dumannewsletter
گروهی از محققان شرکت چینی علیبابا مدلی برای تولید ویدئو رقص از روی تصویر ارائه کردند. این مدل از روش Diffusion برای تولید ویدئو استفاده کرده و DreaMoving نام دارد. برای تولید ویدئو باید تصویر مرجع و دنباله حرکات به همراه یک توضیح متنی به مدل داده شود. برای مطالعه جزئیات فنی اینجا را بخوانید. اخیراً نمونه مشابهی به نام MagicAnimate نیز معرفی شده بود.
#dreamoving
#alibaba
@dumannewsletter
استفاده از هوشمصنوعی در صنعت فشن و مد
گروهی از محققان شرکت علیبابا مدل جدید هوشمصنوعی برای به تن کردن انواع لباس در یک تصویر ارائه کردند. این روش نیز از متد Diffusion برای تولید تصویر جدید استفاده کرده و Outfit Anyone نام دارد. این محققان در ادامه از خروجی این مدل در کنار مدل قبلی علیبابا به نام Animate Anyone برای به حرکت درآوردن تصویر جدید بهره بردهاند. قابل ذکر است که علیبابا اخیراً مدل دیگری به نام DreaMoving را برای به حرکت درآوردن تصویر انسان معرفی کرد. برای مطالعه جزئیات فنی در مورد پروژه Outfit Anyone اینجا را بخوانید.
#outfit_anyone
#alibaba
@dumannewsletter
گروهی از محققان شرکت علیبابا مدل جدید هوشمصنوعی برای به تن کردن انواع لباس در یک تصویر ارائه کردند. این روش نیز از متد Diffusion برای تولید تصویر جدید استفاده کرده و Outfit Anyone نام دارد. این محققان در ادامه از خروجی این مدل در کنار مدل قبلی علیبابا به نام Animate Anyone برای به حرکت درآوردن تصویر جدید بهره بردهاند. قابل ذکر است که علیبابا اخیراً مدل دیگری به نام DreaMoving را برای به حرکت درآوردن تصویر انسان معرفی کرد. برای مطالعه جزئیات فنی در مورد پروژه Outfit Anyone اینجا را بخوانید.
#outfit_anyone
#alibaba
@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
حذف نویز محیط در گوشیهای پیکسل گوگل
قابلیت حذف نویز محیط در گوشیهای هوشمند پیکسل گوگل با همکاری بخش Google Research توسعه داده شده است. این قابلیت از یک مدل audio-to-audio برای کاهش نویز استفاده میکند. در حال حاضر این قابلیت کل بازه فرکانسی صدا را پوشش داده و با کمترین تاخیر صدای بهبود یافته را برای کاربر پخش میکند.
#google
#pixel
@dumannewsletter
قابلیت حذف نویز محیط در گوشیهای هوشمند پیکسل گوگل با همکاری بخش Google Research توسعه داده شده است. این قابلیت از یک مدل audio-to-audio برای کاهش نویز استفاده میکند. در حال حاضر این قابلیت کل بازه فرکانسی صدا را پوشش داده و با کمترین تاخیر صدای بهبود یافته را برای کاربر پخش میکند.
#pixel
@dumannewsletter
استفاده از هوشمصنوعی مولد برای تولید داروی سرطان
دو شرکت آسترازنکا (AstraZeneca) و ابسکی (Absci) در یک همکاری مشترک به ارزش ۲۴۷ میلیون دلار با استفاده از هوشمصنوعی برای کشف داروی جدید سرطان اقدام میکنند. ابسکی در زمینه کشف دارو (Drug Discovery) فعالیت داشته و در سالهای اخیر توانسته با استفاده از هوشمصنوعی مولد (GenAI) در کشف داروهای جدید به نتایج قابل توجهی دست پیدا کند. تولید داروی جدید بسیار هزینهبر بوده و شانس موفقیت پایینی دارد ولی با استفاده از هوشمصنوعی درهای جدیدی به روی این صنعت باز شده است. سال جاری ابسکی اعلام کرد با استفاده از تکنیک Zero Shot در یادگیری ماشین توانسته آنتیبادی De Novo را به صورت مجازی تولید کند (اینجا را مشاهده کنید). این تکنیک امکان تجزیه و تحلیل دیتایی که در پروسه آموزش مدل وجود نداشته را برای آن فراهم میسازد.
#absci
#zero_shot
@dumannewsletter
دو شرکت آسترازنکا (AstraZeneca) و ابسکی (Absci) در یک همکاری مشترک به ارزش ۲۴۷ میلیون دلار با استفاده از هوشمصنوعی برای کشف داروی جدید سرطان اقدام میکنند. ابسکی در زمینه کشف دارو (Drug Discovery) فعالیت داشته و در سالهای اخیر توانسته با استفاده از هوشمصنوعی مولد (GenAI) در کشف داروهای جدید به نتایج قابل توجهی دست پیدا کند. تولید داروی جدید بسیار هزینهبر بوده و شانس موفقیت پایینی دارد ولی با استفاده از هوشمصنوعی درهای جدیدی به روی این صنعت باز شده است. سال جاری ابسکی اعلام کرد با استفاده از تکنیک Zero Shot در یادگیری ماشین توانسته آنتیبادی De Novo را به صورت مجازی تولید کند (اینجا را مشاهده کنید). این تکنیک امکان تجزیه و تحلیل دیتایی که در پروسه آموزش مدل وجود نداشته را برای آن فراهم میسازد.
#absci
#zero_shot
@dumannewsletter
معرفی مدل AudioBox از متا
مدل Audiobox توسط متا برای تولید و بهبود کیفیت صوت معرفی شده است. این مدل در واقع نسل بعدی مدل Voicebox است که در ابتدای سال جاری معرفی شده بود. قابلیتهای خارقالعاده Audiobox را میتوانید از اینجا تست کنید.
#meta
#audiobox
@dumannewsletter
مدل Audiobox توسط متا برای تولید و بهبود کیفیت صوت معرفی شده است. این مدل در واقع نسل بعدی مدل Voicebox است که در ابتدای سال جاری معرفی شده بود. قابلیتهای خارقالعاده Audiobox را میتوانید از اینجا تست کنید.
#meta
#audiobox
@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
تولید موسیقی با MusicFX
گوگل مدل جدید خود برای تولید موسیقی را به صورت محدود در دسترس عموم قرار داده است. این مدل MusicFX نام داشته و برای ثبتنام در لیست انتظار آن به اینجا مراجعه کنید. این مدل با دریافت Prompt از کاربر موسیقی مورد نظر را تولید میکند. ویدئویی که در تصویر مشاهده میکنید نمونهای از خروجی MusicFX است.
#google
#musicfx
@dumannewsletter
گوگل مدل جدید خود برای تولید موسیقی را به صورت محدود در دسترس عموم قرار داده است. این مدل MusicFX نام داشته و برای ثبتنام در لیست انتظار آن به اینجا مراجعه کنید. این مدل با دریافت Prompt از کاربر موسیقی مورد نظر را تولید میکند. ویدئویی که در تصویر مشاهده میکنید نمونهای از خروجی MusicFX است.
#musicfx
@dumannewsletter
سه بعدیسازی تصاویر با Stable Zero123
شرکت Stability AI نسخه جدید مدل سهبعدی ساز خود را با نام Stable Zero123 منتشر کرد. این نسخه نسبت به مدل قبلی یعنی Zero123-XL بهبود قابل توجهی داشته است. این بهبود در تصاویر فوق نمایش داده شده است. Stable Zero123 به صورت اپنسورس صرفاً برای اهداف تحقیقاتی منتشر شده است. برای دسترسی به مدل و جزئیات فنی بیشتر به اینجا مراجعه کنید.
#stability_ai
#stable_zero123
@dumannewsletter
شرکت Stability AI نسخه جدید مدل سهبعدی ساز خود را با نام Stable Zero123 منتشر کرد. این نسخه نسبت به مدل قبلی یعنی Zero123-XL بهبود قابل توجهی داشته است. این بهبود در تصاویر فوق نمایش داده شده است. Stable Zero123 به صورت اپنسورس صرفاً برای اهداف تحقیقاتی منتشر شده است. برای دسترسی به مدل و جزئیات فنی بیشتر به اینجا مراجعه کنید.
#stability_ai
#stable_zero123
@dumannewsletter
مایکروسافت مدل Phi2 را معرفی کرد.
با داغ شدن مسابقه مدلهای بزرگ زبانی (LLM) شاهد معرفی مدلهای کوچک زبانی (SLM) نیز هستیم. در حال حاضر LLMها از چند ده میلیارد، تا چند میلیارد و حتی چند تریلیون پارامتر دارند. هر چقدر تعداد پارامترهای یک مدل بیشتر باشد، پروسه آموزش آن زمانبر و هزینهبر شده و در نهایت خروجی آن نیز سایز زیادی خواهد داشت. اجرای مدلهای بزرگ زبانی نیازمند منابع پردازشی زیاد است. از اینرو، برای فراهم کردن قابلیتهای مدلهای زبانی برای پلتفرمهای مختلف شاهد توسعه و معرفی مدلهای کوچک زبانی یا SLMها هستیم. کاهش سایز مدل زبانی و در عین حال افزایش کیفیت آن از ترندهای موجود در حوزه هوشمصنوعی مولد است. مدل Phi یکی از این SLMها بوده که توسط مایکروسافت منتشر شده است. نسخه Phi2 که به تازگی منتشر شده در مقایسه با نمونههای مشابه نتایج درخور توجهی داشته است.
👈 برای جزئیات بیشتر درباره این مدل اینجا را بخوانید.
#phi
#microsoft
@dumannewsletter
با داغ شدن مسابقه مدلهای بزرگ زبانی (LLM) شاهد معرفی مدلهای کوچک زبانی (SLM) نیز هستیم. در حال حاضر LLMها از چند ده میلیارد، تا چند میلیارد و حتی چند تریلیون پارامتر دارند. هر چقدر تعداد پارامترهای یک مدل بیشتر باشد، پروسه آموزش آن زمانبر و هزینهبر شده و در نهایت خروجی آن نیز سایز زیادی خواهد داشت. اجرای مدلهای بزرگ زبانی نیازمند منابع پردازشی زیاد است. از اینرو، برای فراهم کردن قابلیتهای مدلهای زبانی برای پلتفرمهای مختلف شاهد توسعه و معرفی مدلهای کوچک زبانی یا SLMها هستیم. کاهش سایز مدل زبانی و در عین حال افزایش کیفیت آن از ترندهای موجود در حوزه هوشمصنوعی مولد است. مدل Phi یکی از این SLMها بوده که توسط مایکروسافت منتشر شده است. نسخه Phi2 که به تازگی منتشر شده در مقایسه با نمونههای مشابه نتایج درخور توجهی داشته است.
👈 برای جزئیات بیشتر درباره این مدل اینجا را بخوانید.
#phi
#microsoft
@dumannewsletter
تولید موسیقی با Copilot
مایکروسافت با همکاری Suno قابلیت تولید موسیقی را به Copilot اضافه کرد. برای استفاده از این قابلیت مراحل زیر را انجام دهید:
۱. پس از نصب مرورگر Microsoft Edge وارد آدرس copilot.microsoft.com شوید.
۲. وارد حساب کاربری مایکروسافت خود شده و یا حساب جدید بسازید.
۳. در قسمت plugins از فعال بودن Suno مطمئن شوید.
۴. با نوشتن Prompt مورد نظر موسیقی خود را تحویل بگیرید.
ضمناً از اینجا مستقیم میتوانید با Suno موسیقی موردنظر خود را بسازید.
#microsoft
#suno
#copilot
@dumannewsletter
مایکروسافت با همکاری Suno قابلیت تولید موسیقی را به Copilot اضافه کرد. برای استفاده از این قابلیت مراحل زیر را انجام دهید:
۱. پس از نصب مرورگر Microsoft Edge وارد آدرس copilot.microsoft.com شوید.
۲. وارد حساب کاربری مایکروسافت خود شده و یا حساب جدید بسازید.
۳. در قسمت plugins از فعال بودن Suno مطمئن شوید.
۴. با نوشتن Prompt مورد نظر موسیقی خود را تحویل بگیرید.
ضمناً از اینجا مستقیم میتوانید با Suno موسیقی موردنظر خود را بسازید.
#microsoft
#suno
#copilot
@dumannewsletter
شماره دوازدهم خبرنامه هوشمصنوعی دومان منتشر شد!
در این شماره شاهد معرفی تحقیقات و محصولات متنوعی در زمینه هوشمصنوعی مولد (Generative AI) هستیم. همانطور که انتظار میرود با سرمایهگذاریهای کلان انجام شده ایدههای مختلف و قابل توجهی در این حوزه در حال شکلگیری است. فعلاً تمرکز روی مدلهای مبتنی بر Diffusion است. در این شماره مدلهای جدیدی برای تولید تصویر، به حرکت درآوردن تصویر و تولید موسیقی و صوت معرفی شده است. دنیای مدلهای زبانی نیز خیلی پر و صدا بود! بالاخره بعد از ماهها انتظار رقیب ChatGPT توسط گوگل وارد میدان شد و توجه زیادی را به خود جلب کرد! مدلهای اپنسورس Mistral 8X7B و Phi2 نیز معرفی شده و سایر مدلهای مشابه را به چالش کشیدند. تلاشها برای نمود فیزیکی هوشمصنوعی در قالب رباتهای انساننما نیز ادامه دارد. برای جزئیات بیشتر ادامه خبرنامه را مطالعه کنید.
👈 برای مطالعه شماره دوازدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پستالکترونیک خود هستید از اینجا ثبتنام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.
#خبرنامه
@dumannewsletter
در این شماره شاهد معرفی تحقیقات و محصولات متنوعی در زمینه هوشمصنوعی مولد (Generative AI) هستیم. همانطور که انتظار میرود با سرمایهگذاریهای کلان انجام شده ایدههای مختلف و قابل توجهی در این حوزه در حال شکلگیری است. فعلاً تمرکز روی مدلهای مبتنی بر Diffusion است. در این شماره مدلهای جدیدی برای تولید تصویر، به حرکت درآوردن تصویر و تولید موسیقی و صوت معرفی شده است. دنیای مدلهای زبانی نیز خیلی پر و صدا بود! بالاخره بعد از ماهها انتظار رقیب ChatGPT توسط گوگل وارد میدان شد و توجه زیادی را به خود جلب کرد! مدلهای اپنسورس Mistral 8X7B و Phi2 نیز معرفی شده و سایر مدلهای مشابه را به چالش کشیدند. تلاشها برای نمود فیزیکی هوشمصنوعی در قالب رباتهای انساننما نیز ادامه دارد. برای جزئیات بیشتر ادامه خبرنامه را مطالعه کنید.
👈 برای مطالعه شماره دوازدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پستالکترونیک خود هستید از اینجا ثبتنام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.
#خبرنامه
@dumannewsletter
نسخه ۶ سرویس Midjourney اخیراً منتشر شد. در این تصویر بهبود تصاویر تولید شده توسط این مدل هوشمصنوعی در حدود یک و نیم سال گذشته را مشاهده میکنید. Midjourney در زمینه خلق تصویر با هوشمصنوعی مولد با مدلهای DALL.E، Google Imagen و Stable Diffusion رقابت میکند.
#midjourney
@dumannewsletter
#midjourney
@dumannewsletter
دستاورد چشمگیر اپل برای اجرای مدلهای زبانی در تلفنهمراه
مدلهای بزرگ زبانی برای اجرا به مموری زیادی نیاز دارند از این رو برای اجرای آن در تلفنهای همراه هوشمند محدودیت ایجاد میشود. در آزمایش جدیدی که توسط مهندسان اپل انجام شده با معرفی دو روش جدید به نامهای windowing و row-column bundling از ظرفیت Flash Memory برای حل کمبود DRAM استفاده شده است. این روش با تطبیق میزان مصرف مموری براساس محدودیتهای سختافزاری به شکل بهینهای از منابع موجود استفاده میکند. طبق نتایج ارائه شده، این روش میتواند مدلهای با سایز دو برابر DRAM را در تلفن همراه با سرعت اجرای (inference) بسیار بیشتر از روشهای رایج لود کردن مدل در CPU یا GPU اجرا کند. ارائه این دستاورد امیدها را برای فراهم کردن قابلیتهای خارقالعاده مدلهای بزرگ زبانی در تلفنهای همراه هوشمند بسیار کرده است. به نظر میرسد اپل که در این رقابت تنگاتنگ Generative AI ساکت مانده، نقشههای بزرگی را در سر میپروراند. برای مطالعه جزئیات فنی بیشتر این مقاله را بخوانید.
#apple
@dumannewsletter
مدلهای بزرگ زبانی برای اجرا به مموری زیادی نیاز دارند از این رو برای اجرای آن در تلفنهای همراه هوشمند محدودیت ایجاد میشود. در آزمایش جدیدی که توسط مهندسان اپل انجام شده با معرفی دو روش جدید به نامهای windowing و row-column bundling از ظرفیت Flash Memory برای حل کمبود DRAM استفاده شده است. این روش با تطبیق میزان مصرف مموری براساس محدودیتهای سختافزاری به شکل بهینهای از منابع موجود استفاده میکند. طبق نتایج ارائه شده، این روش میتواند مدلهای با سایز دو برابر DRAM را در تلفن همراه با سرعت اجرای (inference) بسیار بیشتر از روشهای رایج لود کردن مدل در CPU یا GPU اجرا کند. ارائه این دستاورد امیدها را برای فراهم کردن قابلیتهای خارقالعاده مدلهای بزرگ زبانی در تلفنهای همراه هوشمند بسیار کرده است. به نظر میرسد اپل که در این رقابت تنگاتنگ Generative AI ساکت مانده، نقشههای بزرگی را در سر میپروراند. برای مطالعه جزئیات فنی بیشتر این مقاله را بخوانید.
#apple
@dumannewsletter