This media is not supported in your browser
VIEW IN TELEGRAM
دموی نتایج فریمورک Universal Manipulation Interface برای آموزش ربات براساس مشاهده رفتارهای انسان (مطالعه جزئیات فنی)
#robotics
#umi
@dumannewsletter
#robotics
#umi
@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
دموی آخرین وضعیت ربات انساننمای Figure
برت ادکاک (Brett Adcock) در یک ویدئوی جدید آخرین تواناییهای ربات Figure 01 را به نمایش گذاشت. اخیراً ارزش این استارتاپ با جذب ۶۷۵ میلیون دلار سرمایه از سمت جف بزوس، NVIDIA، مایکروسافت و OpenAI به ۲ میلیارد دلار رسید. اینتل و سامسونگ از دیگر سرمایهگذاران خرد Figure هستند. در حال حاضر از رباتهای Figure در بخشی از کارخانه BMW در خاک آمریکا به جای انسان استفاده میشود.
#figure
#robotics
@dumannewsletter
برت ادکاک (Brett Adcock) در یک ویدئوی جدید آخرین تواناییهای ربات Figure 01 را به نمایش گذاشت. اخیراً ارزش این استارتاپ با جذب ۶۷۵ میلیون دلار سرمایه از سمت جف بزوس، NVIDIA، مایکروسافت و OpenAI به ۲ میلیارد دلار رسید. اینتل و سامسونگ از دیگر سرمایهگذاران خرد Figure هستند. در حال حاضر از رباتهای Figure در بخشی از کارخانه BMW در خاک آمریکا به جای انسان استفاده میشود.
#figure
#robotics
@dumannewsletter
شرکت Qualcomm مجموعهای شامل بیش از ۷۰ مدل معروف هوشمصنوعی را برای پلتفرمهای خود به خصوص snapdragon بهینهسازی کرده و به صورت عمومی در HuggingFace منتشر کرده است. برای دسترسی به این مدلها اینجا را مشاهده کنید.
#qualcomm
@dumannewsletter
#qualcomm
@dumannewsletter
دوره Prompt نویسی برای مدل Llama با همکاری Meta AI در پلتفرم آموزشی DeepLearning.AI به صورت رایگان منتشر شد. این دوره حدود یک ساعت بوده و از اینجا میتوانید به آن دسترسی داشته باشید.
#llama
@dumannewsletter
#llama
@dumannewsletter
Media is too big
VIEW IN TELEGRAM
شرکت Adobe ابزار جدید خود برای تولید موسیقی را دمو کرد. با استفاده از این ابزار میتوان prompt ورودی را به موسیقی تبدیل کرد. همچنین کاربر میتواند علاوه بر ژانر، شدت و طول خروجی را کنترل کرده و یا به آن loop اضافه کند. هنوز این ابزار در دسترس عموم قرار نگرفته است. Adobe مجموعه ابزارهای مبتنی بر هوشمصنوعی مولد را تحت عنوان Firefly در ماههای اخیر منتشر کرده است (منبع).
👈 مشاهده ابزارهای Firefly
👈 معرفی ابزارهای تولید موسیقی با هوشمصنوعی
#adobe
#firefly
@dumannewsletter
👈 مشاهده ابزارهای Firefly
👈 معرفی ابزارهای تولید موسیقی با هوشمصنوعی
#adobe
#firefly
@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
دموی نسخه ۳ رباتانسان نمای Unitree H1
شرکت چینی Unitree Robotics در ویدئوی جدید قدرت و انعطاف ربات انساننمای خود را به نمایش گذاشت. طبق ادعای این کمپانی رکورد سرعت ربات انساننما توسط H1 شکسته شده است. رکورد قبلی ۲.۵ متر بر ثانیه بوده ولی این ربات میتواند با سرعت ۳.۳ متر بر ثانیه راه برود.
#unitree
#robotics
@dumannewsletter
شرکت چینی Unitree Robotics در ویدئوی جدید قدرت و انعطاف ربات انساننمای خود را به نمایش گذاشت. طبق ادعای این کمپانی رکورد سرعت ربات انساننما توسط H1 شکسته شده است. رکورد قبلی ۲.۵ متر بر ثانیه بوده ولی این ربات میتواند با سرعت ۳.۳ متر بر ثانیه راه برود.
#unitree
#robotics
@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
مدل جدید گوگل برای تولید بازی!
گوگل مدل جدیدی به نام Genie را برای تولید بازی ویدئویی تعاملی معرفی کرد. این مدل میتواند محیط جدیدی را خلق کرده که کاربر میتواند کاراکتر اصلی آن را حرکت داده و کنترل کند. این مدل، یک مدل پایه (Foundation Model) بوده که با ویدئوهای بدون لیبل آموزش داده شده است. در حال حاضر Genie به صورت عمومی در دسترس قرار نگرفته است. برای مطالعه جزئیات فنی اینجا را بخوانید.
#genie
#google
@dumannewsletter
گوگل مدل جدیدی به نام Genie را برای تولید بازی ویدئویی تعاملی معرفی کرد. این مدل میتواند محیط جدیدی را خلق کرده که کاربر میتواند کاراکتر اصلی آن را حرکت داده و کنترل کند. این مدل، یک مدل پایه (Foundation Model) بوده که با ویدئوهای بدون لیبل آموزش داده شده است. در حال حاضر Genie به صورت عمومی در دسترس قرار نگرفته است. برای مطالعه جزئیات فنی اینجا را بخوانید.
#genie
@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
نسخه 1.0 سرویس تبدیل متن به ویدئو Ideogram معرفی شد.
👈 مطالعه جزئیات
👈 تست رایگان سرویس
#ideogram
@dumannewsletter
👈 مطالعه جزئیات
👈 تست رایگان سرویس
#ideogram
@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
نسخه 2.5 سرویس تبدیل متن به ویدئو Playgound معرفی شد. برای تست آن به اینجا مراجعه کنید.
#playground
@dumannewsletter
#playground
@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
شرکت علیبابا مدلی به نام Emote Portrait Alive (EMO) را برای تولید ویدئو از روی صوت معرفی کرد! این مدل تصویر ورودی را براساس صوت متحرک میکند! جزئیات حرکت لبها و چشمها و حالت چهره نیز با صوت هماهنگ میشود! برای مطالعه جزئیات فنی به اینجا مراجعه کنید.
#alibaba
#emo
@dumannewsletter
#alibaba
#emo
@dumannewsletter
This media is not supported in your browser
VIEW IN TELEGRAM
سرویس تولید ویدئوی Pika قابلیت Lip Sync را به سرویس خود اضافه کرد. این قابلیت جزئیات حرکت لبهای کاراکتر را براساس متن هماهنگ میکند. برای استفاده از این قابلیت باید سرویس پریمیوم را خریداری کنید. همچنین میتوانید با استفاده از سرویس ElvenLabs برای ویدئوی خود صدای دلخواه تولید کنید!
pika.art 👈
#pika
#lip_sync
@dumannewsletter
pika.art 👈
#pika
#lip_sync
@dumannewsletter
با استفاده از این سرویس میتوانید عکس خودتان را به همراه prompt به استیکرهای کارتونی تبدیل کنید:
fofr/face-to-sticker 👈
#fofr
@dumannewsletter
fofr/face-to-sticker 👈
#fofr
@dumannewsletter
مدل زبانی یک بیتی مایکروسافت!
مایکروسافت در یک مقاله تحقیقاتی با عنوان The Era of 1-bit LLMs مدل جدیدی را به نام BitNet b1.58 معرفی کرد. در این مدل هر پارامتر یک مقدار سهتایی (Ternary) است. به عبارت دیگر هر پارامتر این مدل یکی از مقادیر +۱، -۱ و یا ۰ است. این مدل در مقایسه با نسخه ۱۶بیتی Llama چهار برابر کوچکتر و ۷۰ برابر انرژی کمتر مصرف کرده در حالیکه عملکرد یکسانی با آن دارد. برای مطالعه جزئیات فنی اینجا را بخوانید. تلاش برای ساختن مدلهای کوچکتر و بهینهتر مسیر را برای استفاده از قابلیتهای مدلهای زبانی در تلفنهای هوشمند هموارتر میکند.
#microsoft
@dumannewsletter
مایکروسافت در یک مقاله تحقیقاتی با عنوان The Era of 1-bit LLMs مدل جدیدی را به نام BitNet b1.58 معرفی کرد. در این مدل هر پارامتر یک مقدار سهتایی (Ternary) است. به عبارت دیگر هر پارامتر این مدل یکی از مقادیر +۱، -۱ و یا ۰ است. این مدل در مقایسه با نسخه ۱۶بیتی Llama چهار برابر کوچکتر و ۷۰ برابر انرژی کمتر مصرف کرده در حالیکه عملکرد یکسانی با آن دارد. برای مطالعه جزئیات فنی اینجا را بخوانید. تلاش برای ساختن مدلهای کوچکتر و بهینهتر مسیر را برای استفاده از قابلیتهای مدلهای زبانی در تلفنهای هوشمند هموارتر میکند.
#microsoft
@dumannewsletter
شکایت ماسک از سم آلتمن!
ایلان ماسک از سم آلتمن مدیرعامل OpenAI به خاطر تخطی از اهداف اولیه OpenAI در بدو تاسیس شکایت کرد! OpenAI در سال ۲۰۱۵ به عنوان سازمان غیرانتفاعی (Non-Profit) با هدف توسعه سیستمهای هوشمصنوعی اپن سورس و منتفع ساختن بشر از قابلیتهای این تکنولوژی با همراهی تعدادی از متخصصان و افراد سرشناس از جمله ایلان ماسک و سم آلتمن تاسیس شد. در بدو تاسیس این کمپانی ایلان ماسک یکی از حمایتکنندگان اصلی OpenAI بود. اما در سال ۲۰۱۸ به خاطر تضاد منافع با تسلا از موقعیت خود استعفا داد و از OpenAI جدا شد. در سال ۲۰۱۹ این کمپانی تغییر رویه داده و از سازمان غیرانتفاعی به انتفاعی تبدیل شد. در همین سال با جذب سرمایه هنگفت از سمت مایکروسافت فصل جدیدی را آغاز کرد که در حال حاضر نتیجه آن را با معرفی محصولاتی نظیر ChatGPT، DALL E و Sora مشاهده میکنیم. در سالهای اخیر همواره OpenAI به خاطر سیاستهای بسته خود مورد انتقاد قرار گرفته است.
#openai
#sam_altman
#elon_musk
@dumannewsletter
ایلان ماسک از سم آلتمن مدیرعامل OpenAI به خاطر تخطی از اهداف اولیه OpenAI در بدو تاسیس شکایت کرد! OpenAI در سال ۲۰۱۵ به عنوان سازمان غیرانتفاعی (Non-Profit) با هدف توسعه سیستمهای هوشمصنوعی اپن سورس و منتفع ساختن بشر از قابلیتهای این تکنولوژی با همراهی تعدادی از متخصصان و افراد سرشناس از جمله ایلان ماسک و سم آلتمن تاسیس شد. در بدو تاسیس این کمپانی ایلان ماسک یکی از حمایتکنندگان اصلی OpenAI بود. اما در سال ۲۰۱۸ به خاطر تضاد منافع با تسلا از موقعیت خود استعفا داد و از OpenAI جدا شد. در سال ۲۰۱۹ این کمپانی تغییر رویه داده و از سازمان غیرانتفاعی به انتفاعی تبدیل شد. در همین سال با جذب سرمایه هنگفت از سمت مایکروسافت فصل جدیدی را آغاز کرد که در حال حاضر نتیجه آن را با معرفی محصولاتی نظیر ChatGPT، DALL E و Sora مشاهده میکنیم. در سالهای اخیر همواره OpenAI به خاطر سیاستهای بسته خود مورد انتقاد قرار گرفته است.
#openai
#sam_altman
#elon_musk
@dumannewsletter
انتشار نسخه ۳ Claude
شرکت آنتروپیک نسخه ۳ مدل زبانی خود به نام Claude را در سه سایز مختلف به نامهای Opus، Sonnet و Haiku منتشر کرد. همانطور که مشاهده میکنید، نسخه Opus در بنچمارکهای مختلف از مدلهای GPT-4 و جمینای عملکرد بهتری داشته است. نسخه Opus برای کاربران پرمیوم و نسخه Sonnet به صورت رایگان در اینجا در دسترس قرار گرفته است.
👈 مطالعه جزئیات بیشتر
#anthropic
#claude
@dumannewsletter
شرکت آنتروپیک نسخه ۳ مدل زبانی خود به نام Claude را در سه سایز مختلف به نامهای Opus، Sonnet و Haiku منتشر کرد. همانطور که مشاهده میکنید، نسخه Opus در بنچمارکهای مختلف از مدلهای GPT-4 و جمینای عملکرد بهتری داشته است. نسخه Opus برای کاربران پرمیوم و نسخه Sonnet به صورت رایگان در اینجا در دسترس قرار گرفته است.
👈 مطالعه جزئیات بیشتر
#anthropic
#claude
@dumannewsletter
شماره شانزدهم خبرنامه هوشمصنوعی دومان منتشر شد.
در این شماره میخوانید:
👈 رقابت برای معرفی مدلهای زبانی در دو جبهه ادامه دارد: معرفی مدلهای کوچک با کارایی زیاد و معرفی مدلهای بزرگ زبانی قدرتمندتر!
👈 در دو هفته گذشته شاهد معرفی و بهروزرسانیهای زیادی در حوزه تولید تصویر از متن و حتی صوت بودیم!
👈 استارتاپی به نام Groq اولین پردازنده مخصوص مدلهای زبانی را با نام LPU معرفی کرد!
👈 استارتاپ Figure همزمان با دموی آخرین نسخه رباتانسان خود از جذب سرمایه جدید خبر داد.
👈 ایلان ماسک از سم آلتمن شکایت کرد!
برای مطالعه شماره شانزدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پستالکترونیک خود هستید از اینجا ثبتنام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.
#خبرنامه
@dumannewsletter
در این شماره میخوانید:
👈 رقابت برای معرفی مدلهای زبانی در دو جبهه ادامه دارد: معرفی مدلهای کوچک با کارایی زیاد و معرفی مدلهای بزرگ زبانی قدرتمندتر!
👈 در دو هفته گذشته شاهد معرفی و بهروزرسانیهای زیادی در حوزه تولید تصویر از متن و حتی صوت بودیم!
👈 استارتاپی به نام Groq اولین پردازنده مخصوص مدلهای زبانی را با نام LPU معرفی کرد!
👈 استارتاپ Figure همزمان با دموی آخرین نسخه رباتانسان خود از جذب سرمایه جدید خبر داد.
👈 ایلان ماسک از سم آلتمن شکایت کرد!
برای مطالعه شماره شانزدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پستالکترونیک خود هستید از اینجا ثبتنام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.
#خبرنامه
@dumannewsletter
خبرنامه هوش مصنوعی دومان
انتشار نسخه ۳ Claude شرکت آنتروپیک نسخه ۳ مدل زبانی خود به نام Claude را در سه سایز مختلف به نامهای Opus، Sonnet و Haiku منتشر کرد. همانطور که مشاهده میکنید، نسخه Opus در بنچمارکهای مختلف از مدلهای GPT-4 و جمینای عملکرد بهتری داشته است. نسخه Opus برای…
در حالیکه همه در انتظار نسخه ۵ مدل GPT هستند، علاقهمندان به این حوزه در واکنش به خبر انتشار Claude 3 با این تصاویر در توئیتر کل کل کردند!
در حال حاضر ChatGPT از مدل GPT-4 استفاده میکند.
#fun
@dumannewsletter
در حال حاضر ChatGPT از مدل GPT-4 استفاده میکند.
#fun
@dumannewsletter
افزایش IQ چتبات Pi
هدف Inflection AI از توسعه Pi معرفی چتباتی است که ضمن ایمنی و مفید بودن بتواند ارتباط همدلانه با کاربر ایجاد کرده و مقداری حس شوخطبعی از خود نشان دهد. این چتبات از مدل پایه Inflection استفاده میکند. نسخه ۲ این مدل در ماه نوامبر معرفی شده بود و اکنون نسخه ۲.۵ آن معرفی شده که قابلیتهای جدیدی از جمله امکان سرچ در اینترنت را برای چتبات Pi فراهم کرده است. در چارت نمایش داده شده دقت نسخه ۲.۵ با نسخه ۲ و همچنین مدل GPT-4 شرکت OpenAI در بنچ مارکهای مختلف مقایسه شده است. همانطور که مشخص است نسخه ۲.۵ بهبود قابل توجهی نسبت به نسخه ۲ داشته و تا حد خوبی به دقت GPT-4 نزدیک شده است. در حال حاضر Pi بیش از ۶ میلیون کاربر ماهانه داشته و هر مکالمه آن به طور متوسط ۳۳ دقیقه به طول میکشد (منبع).
👈 از اینجا با Pi صحبت کنید.
👈 نصب Pi در iOS
👈 نصب Pi در اندروید
مطالعه این مطلب نیز پیشنهاد میشود:
👈 جذب سرمایه ۱.۳ میلیارد دلاری توسط Inflection AI
#inflection_ai
#pi
@dumannewsletter
هدف Inflection AI از توسعه Pi معرفی چتباتی است که ضمن ایمنی و مفید بودن بتواند ارتباط همدلانه با کاربر ایجاد کرده و مقداری حس شوخطبعی از خود نشان دهد. این چتبات از مدل پایه Inflection استفاده میکند. نسخه ۲ این مدل در ماه نوامبر معرفی شده بود و اکنون نسخه ۲.۵ آن معرفی شده که قابلیتهای جدیدی از جمله امکان سرچ در اینترنت را برای چتبات Pi فراهم کرده است. در چارت نمایش داده شده دقت نسخه ۲.۵ با نسخه ۲ و همچنین مدل GPT-4 شرکت OpenAI در بنچ مارکهای مختلف مقایسه شده است. همانطور که مشخص است نسخه ۲.۵ بهبود قابل توجهی نسبت به نسخه ۲ داشته و تا حد خوبی به دقت GPT-4 نزدیک شده است. در حال حاضر Pi بیش از ۶ میلیون کاربر ماهانه داشته و هر مکالمه آن به طور متوسط ۳۳ دقیقه به طول میکشد (منبع).
👈 از اینجا با Pi صحبت کنید.
👈 نصب Pi در iOS
👈 نصب Pi در اندروید
مطالعه این مطلب نیز پیشنهاد میشود:
👈 جذب سرمایه ۱.۳ میلیارد دلاری توسط Inflection AI
#inflection_ai
#pi
@dumannewsletter