خبرنامه هوش مصنوعی دومان – Telegram

خبرنامه هوش مصنوعی دومان

@dumannewsletter

711 subscribers

259 photos

178 videos

2 files

301 links

⭐ ابزار، نوآوری‌ها و اخبار هوش مصنوعی و رباتیک ⭐

📌 ارتباط با من:

dumannewsletter@gmail.com

📌 لینک Boost کانال:

https://t.me/dumannewsletter?boost

📌 آرشیو وبسایت (به روز نمی‌شود):

duman.pouyae.ir

#هوش_مصنوعی
#رباتیک

Download Telegram

About

Blog

Apps

Platform

خبرنامه هوش مصنوعی دومان

711 subscribers

خبرنامه هوش مصنوعی دومان

گوگل امکان تولید تصویر انسان در جمینای را برای مدتی غیر فعال کرد.
براساس تصاویر منتشر شده در شبکه‌های اجتماعی مدل Imagen گوگل که برای تولید تصاویر در جمینای مورد استفاده قرار می‌گرفته بیش از اندازه به diversity اهمیت داده و این موضوع باعث تولید تصاویر اشتباه از انسان در کشورها، برهه‌های زمانی و موقعیت‌های مختلف شده است. یکی از چالش‌های مدل‌های هوش‌مصنوعی بایاس بودن آن به موضوعاتی نظیر جنسیت و نژاد است به‌همین جهت برای جلوگیری از این بایاس‌ها تغییراتی در مدل داده می‌شود. اما همان‌طور که در تصاویر مشخص شده، در مورد گوگل این تغییرات بیش از اندازه بوده است. طبق اعلام گوگل، بعد از اصلاح این مشکل دوباره امکان تولید تصویر انسان در جمینای در دسترس قرار خواهد گرفت.

#google
#gemini

@dumannewsletter

381 views20:25

خبرنامه هوش مصنوعی دومان

مدل‌های تولید موسیقی

با استفاده از مدل‌های زیر می‌توانید موسیقی موردنظر خود را شرح داده و خروجی تولید شده توسط آن را بشنوید.

1. MusicGen (Meta AI)
2. Stable Audio (Stability AI)
3. MusicFX (Google)
4. Suno
5. Udio
6. ElevenLabs (coming soon)

#musicgen
#stable_audio
#musicfx
#suno
#udio
#eleven_labs

@dumannewsletter

807 viewsedited 20:37

خبرنامه هوش مصنوعی دومان

سرمایه‌گذاری مایکروسافت در Mistral AI و انتشار مدل Mistral Large

مایکروسافت اعلام کرد که در استارتاپ فرانسوی Mistral AI سرمایه‌گذاری کرده و از این به بعد مدل‌های زبانی این استارتاپ در پلتفرم ابری Azure نیز در دسترس قرار می‌گیرد. تنها حدود ۱۰ ماه از راه‌اندازی استارتاپ Mistral AI می‌گذرد و در این مدت ارزش آن به حدود ۲ میلیارد دلار رسیده است. همزمان با انتشار این خبر، Mistral مدل زبانی جدید خود با نام Mistral Large (یا Au Large) را نیز معرفی کرد. برخلاف مدل‌های قبلی، این مدل اپن‌سورس نیست و تنها از طریق Azure و یا زیرساخت Mistral (به نام La Plateforme)در دسترس قرار گرفته است. طبق ادعای Mistral، مدل Mistral Large توانایی رقابت با GPT-4 را دارد و براساس بنچ‌مارک‌ معروف MMLU در جایگاه دوم پس از GPT-4 قرار می‌گیرد. این مدل جدید دارای Context Window به سایز ۳۲KB بوده و به زبان‌های انگلیسی، آلمانی، فرانسوی، ایتالیایی و اسپانیایی مسلط است. در کنار این مدل، چت‌باتی به نام Le Chat نیز منتشر شده است. برای تست این چت‌بات از اینجا ثبت‌نام کنید (منبع).

#microsoft
#mistral_ai
#le_chat

@dumannewsletter

407 viewsedited 20:12

خبرنامه هوش مصنوعی دومان

This media is not supported in your browser

VIEW IN TELEGRAM

دموی نتایج فریم‌ورک Universal Manipulation Interface برای آموزش ربات براساس مشاهده رفتارهای انسان (مطالعه جزئیات فنی)

#robotics
#umi

@dumannewsletter

366 views13:15

خبرنامه هوش مصنوعی دومان

This media is not supported in your browser

VIEW IN TELEGRAM

دموی آخرین وضعیت ربات انسان‌نمای Figure

برت ادکاک (Brett Adcock) در یک ویدئوی جدید آخرین توانایی‌های ربات Figure 01 را به نمایش گذاشت. اخیراً ارزش این استارتاپ با جذب ۶۷۵ میلیون دلار سرمایه از سمت جف بزوس، NVIDIA، مایکروسافت و OpenAI به ۲ میلیارد دلار رسید. اینتل و سامسونگ از دیگر سرمایه‌گذاران خرد Figure هستند. در حال حاضر از ربات‌های Figure در بخشی از کارخانه BMW در خاک آمریکا به جای انسان استفاده می‌شود.

#figure
#robotics

@dumannewsletter

359 views13:39

خبرنامه هوش مصنوعی دومان

شرکت Qualcomm مجموعه‌ای شامل بیش از ۷۰ مدل معروف هوش‌مصنوعی را برای پلتفرم‌های خود به خصوص snapdragon بهینه‌سازی کرده و به صورت عمومی در HuggingFace منتشر کرده است. برای دسترسی به این مدل‌ها اینجا را مشاهده کنید.

#qualcomm

@dumannewsletter

381 views09:35

خبرنامه هوش مصنوعی دومان

دوره Prompt نویسی برای مدل Llama با همکاری Meta AI در پلتفرم آموزشی DeepLearning.AI به صورت رایگان منتشر شد. این دوره حدود یک ساعت بوده و از اینجا می‌توانید به آن دسترسی داشته باشید.

#llama

@dumannewsletter

446 views09:40

خبرنامه هوش مصنوعی دومان

Media is too big

VIEW IN TELEGRAM

شرکت Adobe ابزار جدید خود برای تولید موسیقی را دمو کرد. با استفاده از این ابزار می‌توان prompt ورودی را به موسیقی تبدیل کرد. همچنین کاربر می‌تواند علاوه بر ژانر، شدت و طول خروجی را کنترل کرده و یا به آن loop اضافه کند. هنوز این ابزار در دسترس عموم قرار نگرفته است. Adobe مجموعه ابزارهای مبتنی بر هوش‌مصنوعی مولد را تحت عنوان Firefly در ماه‌های اخیر منتشر کرده است (منبع).

👈 مشاهده ابزارهای Firefly
👈 معرفی ابزارهای تولید موسیقی با هوش‌مصنوعی

#adobe
#firefly

@dumannewsletter

416 viewsedited 13:38

خبرنامه هوش مصنوعی دومان

This media is not supported in your browser

VIEW IN TELEGRAM

دموی نسخه ۳ ربات‌انسان نمای Unitree H1

شرکت چینی Unitree Robotics در ویدئوی جدید قدرت و انعطاف ربات انسان‌نمای خود را به نمایش گذاشت. طبق ادعای این کمپانی رکورد سرعت ربات‌ انسان‌نما توسط H1 شکسته شده است. رکورد قبلی ۲.۵ متر بر ثانیه بوده ولی این ربات می‌تواند با سرعت ۳.۳ متر بر ثانیه راه برود.

#unitree
#robotics

@dumannewsletter

360 viewsedited 08:37

خبرنامه هوش مصنوعی دومان

This media is not supported in your browser

VIEW IN TELEGRAM

مدل جدید گوگل برای تولید بازی!

گوگل مدل جدیدی به نام Genie را برای تولید بازی ویدئویی تعاملی معرفی کرد. این مدل می‌تواند محیط جدیدی را خلق کرده که کاربر می‌تواند کاراکتر اصلی آن را حرکت داده و کنترل کند. این مدل، یک مدل پایه (Foundation Model) بوده که با ویدئوهای بدون لیبل آموزش داده شده است. در حال حاضر Genie به صورت عمومی در دسترس قرار نگرفته است. برای مطالعه جزئیات فنی اینجا را بخوانید.

#genie
#google

@dumannewsletter

361 views19:51

خبرنامه هوش مصنوعی دومان

This media is not supported in your browser

VIEW IN TELEGRAM

نسخه 1.0 سرویس تبدیل متن به ویدئو Ideogram معرفی شد.

👈 مطالعه جزئیات
👈 تست رایگان سرویس

#ideogram

@dumannewsletter

399 views20:21

خبرنامه هوش مصنوعی دومان

This media is not supported in your browser

VIEW IN TELEGRAM

نسخه 2.5 سرویس تبدیل متن به ویدئو Playgound معرفی شد. برای تست آن به اینجا مراجعه کنید.

#playground

@dumannewsletter

354 views20:25

خبرنامه هوش مصنوعی دومان

This media is not supported in your browser

VIEW IN TELEGRAM

شرکت علی‌بابا مدلی به نام Emote Portrait Alive (EMO) را برای تولید ویدئو از روی صوت معرفی کرد! این مدل تصویر ورودی را براساس صوت متحرک می‌کند! جزئیات حرکت لب‌ها و چشم‌ها و حالت چهره نیز با صوت هماهنگ می‌شود! برای مطالعه جزئیات فنی به اینجا مراجعه کنید.

#alibaba
#emo

@dumannewsletter

398 views20:42

خبرنامه هوش مصنوعی دومان

This media is not supported in your browser

VIEW IN TELEGRAM

سرویس تولید ویدئوی Pika قابلیت Lip Sync را به سرویس خود اضافه کرد. این قابلیت جزئیات حرکت لب‌های کاراکتر را براساس متن هماهنگ می‌کند. برای استفاده از این قابلیت باید سرویس پریمیوم را خریداری کنید. همچنین می‌توانید با استفاده از سرویس ElvenLabs برای ویدئوی خود صدای دلخواه تولید کنید!

pika.art 👈

#pika
#lip_sync

@dumannewsletter

456 viewsedited 20:50

خبرنامه هوش مصنوعی دومان

با استفاده از این سرویس می‌توانید عکس خودتان را به همراه prompt به استیکرهای کارتونی تبدیل کنید:

fofr/face-to-sticker 👈

#fofr

@dumannewsletter

405 viewsedited 14:25

خبرنامه هوش مصنوعی دومان

مدل زبانی یک بیتی مایکروسافت!

مایکروسافت در یک مقاله تحقیقاتی با عنوان The Era of 1-bit LLMs مدل جدیدی را به نام BitNet b1.58 معرفی کرد. در این مدل هر پارامتر یک مقدار سه‌تایی (Ternary) است. به عبارت دیگر هر پارامتر این مدل یکی از مقادیر +۱، -۱ و یا ۰ است. این مدل در مقایسه با نسخه ۱۶بیتی Llama چهار برابر کوچک‌تر و ۷۰ برابر انرژی کمتر مصرف کرده در حالیکه عملکرد یکسانی با آن دارد. برای مطالعه جزئیات فنی اینجا را بخوانید. تلاش برای ساختن مدل‌های کوچک‌تر و بهینه‌تر مسیر را برای استفاده از قابلیت‌های مدل‌های زبانی در تلفن‌های هوشمند هموارتر می‌کند.

#microsoft

@dumannewsletter

412 views14:54

خبرنامه هوش مصنوعی دومان

شکایت ماسک از سم آلتمن!

ایلان ماسک از سم آلتمن مدیرعامل OpenAI به خاطر تخطی از اهداف اولیه OpenAI در بدو تاسیس شکایت کرد! OpenAI در سال ۲۰۱۵ به عنوان سازمان غیرانتفاعی (Non-Profit) با هدف توسعه سیستم‌های هوش‌مصنوعی اپن سورس و منتفع ساختن بشر از قابلیت‌های این تکنولوژی با همراهی تعدادی از متخصصان و افراد سرشناس از جمله ایلان ماسک و سم آلتمن تاسیس شد. در بدو تاسیس این کمپانی ایلان ماسک یکی از حمایت‌کنندگان اصلی OpenAI بود. اما در سال ۲۰۱۸ به خاطر تضاد منافع با تسلا از موقعیت خود استعفا داد و از OpenAI جدا شد. در سال ۲۰۱۹ این کمپانی تغییر رویه داده و از سازمان غیرانتفاعی به انتفاعی تبدیل شد. در همین سال با جذب سرمایه هنگفت از سمت مایکروسافت فصل جدیدی را آغاز کرد که در حال حاضر نتیجه آن را با معرفی محصولاتی نظیر ChatGPT، DALL E و Sora مشاهده می‌کنیم. در سال‌های اخیر همواره OpenAI به خاطر سیاست‌های بسته خود مورد انتقاد قرار گرفته است.

#openai
#sam_altman
#elon_musk

@dumannewsletter

346 views15:08

خبرنامه هوش مصنوعی دومان

انتشار نسخه ۳ Claude

شرکت آنتروپیک نسخه ۳ مدل زبانی خود به نام Claude را در سه سایز مختلف به نام‌های Opus، Sonnet و Haiku منتشر کرد. همانطور که مشاهده می‌کنید، نسخه Opus در بنچ‌مارک‌های مختلف از مدل‌های GPT-4 و جمینای عملکرد بهتری داشته است. نسخه Opus برای کاربران پرمیوم و نسخه Sonnet به صورت رایگان در اینجا در دسترس قرار گرفته است.

👈 مطالعه جزئیات بیشتر

#anthropic
#claude

@dumannewsletter

438 views15:29

خبرنامه هوش مصنوعی دومان

شماره شانزدهم خبرنامه هوش‌مصنوعی دومان منتشر شد.

در این شماره می‌خوانید:

👈 رقابت برای معرفی مدل‌های زبانی در دو جبهه ادامه دارد: معرفی مدل‌های کوچک با کارایی زیاد و معرفی مدل‌های بزرگ زبانی قدرتمندتر!
👈 در دو هفته گذشته شاهد معرفی و به‌روزرسانی‌های زیادی در حوزه تولید تصویر از متن و حتی صوت بودیم!
👈 استارتاپی به نام Groq اولین پردازنده مخصوص مدل‌های زبانی را با نام LPU معرفی کرد!
👈 استارتاپ Figure همزمان با دموی آخرین نسخه ربات‌انسان‌ خود از جذب سرمایه جدید خبر داد.
👈 ایلان ماسک از سم آلتمن شکایت کرد!

برای مطالعه شماره شانزدهم به این لینک مراجعه کنید. اگر مایل به دریافت این خبرنامه در پست‌الکترونیک خود هستید از اینجا ثبت‌نام کنید. این خبرنامه هر دو هفته به پست الکترونیک شما ارسال خواهد شد.

#خبرنامه

@dumannewsletter

344 viewsedited 11:37

خبرنامه هوش مصنوعی دومان

خبرنامه هوش مصنوعی دومان

انتشار نسخه ۳ Claude شرکت آنتروپیک نسخه ۳ مدل زبانی خود به نام Claude را در سه سایز مختلف به نام‌های Opus، Sonnet و Haiku منتشر کرد. همانطور که مشاهده می‌کنید، نسخه Opus در بنچ‌مارک‌های مختلف از مدل‌های GPT-4 و جمینای عملکرد بهتری داشته است. نسخه Opus برای…

در حالی‌که همه در انتظار نسخه ۵ مدل GPT هستند، علاقه‌مندان به این حوزه در واکنش به خبر انتشار Claude 3 با این تصاویر در توئیتر کل کل کردند!
در حال حاضر ChatGPT از مدل GPT-4 استفاده می‌کند.

#fun

@dumannewsletter

433 views16:18