اخبار هوش مصنوعی
3K subscribers
845 photos
548 videos
1.01K files
1.47K links
آخرین اخبار و منابع فناوری ؛ هوش مصنوعی و یادگیری ماشین

@GPT360
Download Telegram
Media is too big
VIEW IN TELEGRAM
🧬 شرکت Sharp Robotics از سنگاپور به‌صورت رسمی از ربات دست فوق‌العاده پیشرفته خود با نام SharpaWave رونمایی کرد — مدلی در اندازه واقعی (۱:۱) با ۲۲ درجه آزادی حرکت و بیش از ۱۰۰۰ حسگر لمسی در نوک هر انگشت.

این ربات می‌تواند کارهایی را انجام دهد که تا همین چند سال پیش غیرممکن به نظر می‌رسید: از شکستن تخم‌مرغ و نواختن پیانو گرفته تا کار با قیچی — همه با دقت، سرعت و قدرتی انسانی.

SharpaWave ترکیبی از قدرت مکانیکی، کنترل عصبی دقیق و درک لمسی بسیار بالا است؛ گامی بزرگ به سوی ربات‌هایی که می‌توانند با ظرافت و مهارت انسان رقابت کنند.

🧩 #ربات‌ها_در_اطراف_ما
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 این شاهکار ساخته‌ی یک آزمایشگاه نظامی نیست — بلکه اثر یک استادکار چینی علاقه‌مند است که با استفاده از پرینتر سه‌بعدی، این ربات شگفت‌انگیز همه‌جارو را ساخته و در فضای مجازی وایرال شده است.

چه چیزی آن را تا این حد چشمگیر می‌کند؟
این ربات شش‌پایی که ظاهری شبیه لاک‌پشت دارد، دارای سه حالت حرکتی متفاوت است:

• روی خشکی: به‌راحتی روی زمین‌های سنگی و ناهموار حرکت می‌کند.
• در آب: مانند یک زیردریایی کوچک شنا می‌کند.
• در هوا: مانند یک پهپاد پرواز می‌کند.

و شگفتی کار اینجاست — حتی می‌تواند موشک‌های کوچک شبیه راکت شلیک کند! 🚀

اینکه یک فرد تنها توانسته با فناوری ارزان‌قیمت چاپ سه‌بعدی چنین ماشین چندمنظوره‌ای بسازد، باعث شگفتی کارشناسان نظامی و علاقه‌مندان فناوری در سراسر جهان شده است.

این اختراع، مرز میان پروژه‌های شخصی و فناوری‌های جنگی آینده را از بین برده است.

🧩 #ربات‌ها_در_اطراف_ما
2
Media is too big
VIEW IN TELEGRAM
🧬 شرکت AGIBOT نسل جدید ربات‌های انسان‌نما به نام Genie G2 را معرفی کرد: یک ربات انسان‌نمای چرخ‌دار.

این ربات صنعتی برای انجام وظایفی مانند بارگیری و تخلیه، مانورهای دقیق و بازرسی طراحی شده است. مشخصات کلیدی آن عبارت‌اند از:

کمر و پاهای انسان‌مانند، تنه تاشو و حرکت‌پذیری همه‌جانبه

حسگرهای لمسی سه‌بعدی (3D) و دست‌های چابک با 19 درجه آزادی

قابلیت ناوبری سه‌بعدی برای حرکت ایمن در کارگاه‌ها، ایستگاه‌های کاری و سالن‌های ماشین‌آلات


ویدیوهای منتشر شده همچنین نشان می‌دهند که G2 قابلیت‌های خدماتی دارد: از جمله امنیت، استقبال از مهمانان، ارائه توضیحات و کاربردهای خانگی.

جالب اینکه AGIBOT یک سفارش چند صد میلیون یوآنی برای تامین اسکلت G2 از Shanghai Longcheer دریافت کرده و حدود 1000 واحد G2 در خطوط تولید این شرکت نصب خواهد شد.

🧩 #ربات‌ها_در_اطراف_ما
2
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 مؤسسه RAI از ربات چهارپا Spot رونمایی کرده که می‌تواند جابه‌جایی دینامیک اجسام سنگین را با کل بدن خود انجام دهد و از یک کنترل‌کننده چندسطحی با سرعت نزدیک به انسان استفاده می‌کند.

عملکرد: به طور متوسط، ربات می‌تواند یک شی واژگون را در ۵.۹ ثانیه به جای خود بازگرداند و در بهترین حالت ۳.۷ ثانیه طول کشیده است.

ظرفیت بار: می‌تواند جسمی با وزن ۱۵ کیلوگرم را مدیریت کند، با اینکه محدودیت سخت‌افزاری آن حداکثر توان بلندکردن ۱۱ کیلوگرم و توان بلندکردن پیوسته ۵ کیلوگرم است.


ساختار سیستم:

سطح پایین: از یادگیری تقویتی (PPO در IsaacLab) برای کنترل گشتاور موتورها و حفظ تعادل دینامیک هنگام تغییر تماس‌ها استفاده می‌کند.

سطح بالا: وظایف پیچیده‌تر مانند تراز کردن، کشیدن و چیدن اجسام از برنامه‌ریزی مبتنی بر نمونه‌برداری استفاده می‌کنند، در حالی که رولینگ به مهارت واکنشی آموخته‌شده نیاز دارد.


نمونه‌برداری: ۳۲ شبیه‌سازی موازی MuJoCo اجرا می‌شود تا حرکات احتمالی (به صورت اسپлайн) برای چند ثانیه آینده ارزیابی شده و مناسب‌ترین اقدام انتخاب شود.
2
🧬 گوگل Meet حالا یک فیلتر آرایش با هوش مصنوعی دارد که برای مواقعی که نمی‌خواهید قبل از جلسه واقعاً آرایش کنید، ایده‌آل است.

قابلیت‌ها:

۱۲ سبک مختلف آرایش در بخش «Appearance» و «Portrait Retouch».

تنظیم رنگ پوست، روشن کردن زیر چشم‌ها، سفید کردن پلک‌ها و سایر اصلاحات ظاهری.

فیلتر به گونه‌ای طراحی شده که با حرکات کاربر هماهنگ می‌ماند؛ مثلاً وقتی قهوه می‌نوشید، آرایش روی صورت باقی می‌ماند و روی لیوان نمی‌نشیند.


رقابت: این ویژگی گوگل Meet را با اپلیکیشن‌های دیگر مثل Microsoft Teams و Zoom که قبلاً آرایش مجازی ارائه می‌دادند، در یک سطح قرار می‌دهد.


این ابزار باعث می‌شود کاربران بدون صرف وقت برای آرایش واقعی، در جلسات ویدیویی ظاهر مرتب و طبیعی داشته باشند.
🧬 آندری کارپاتی مینی کلون ChatGPT رو اوپن‌سورس کرد — nanochat 😱

یکی از سازندگان GPT، آندری کارپاتی، پروژه nanochat رو منتشر کرد که باهاش می‌تونید چت‌بات خودتون رو از صفر بسازید و تو چند ساعت روی GPU ابری آموزش بدید.

🔹 فقط 8,000 خط کد
🔹 بدون هیچ وابستگی اضافی
🔹 خود کارپاتی میگه: «دیوانه‌کننده‌ترین کاری که تا حالا انجام دادم»

💻 گیت‌هاب: https://github.com/karpathy/nanochat
🚀 مایکروسافت MAI-Image-1 رو معرفی کرد — مدل جدید تولید تصویر که همین حالا تو Top 10 LMArena قرار گرفته!

این مدل تمرکزش روی واقع‌گرایی، تنوع و دقت هنریه، نه سبک‌های کلیشه‌ای.
🔹 فوق‌العاده تو صحنه‌های فوتورئالیستیک — نور، سایه، بازتاب و بافت‌ها خیلی طبیعی به نظر میان.
🔹 آموزش داده شده با داده‌های دستچین شده و همراهی هنرمندان و طراحان تا کیفیت و کاربردش تو پروژه‌های واقعی بالا بره.
🔹 سرعت و کیفیت عالی — می‌تونید ایده‌ها رو سریع ببینید و بعد تو ابزارهای معمولی ویرایش کنید.

💡 بزودی این مدل تو Copilot و Bing Image Creator هم در دسترس خواهد بود.
همین حالا می‌تونید MAI-Image-1 رو تو LMArena تست کنید و عملکردش رو ببینید.



#Microsoft
3
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 Unitree G1 Kungfu Kid V6.0 — حالا یک استاد واقعی کونگ‌فو است!

یک سال و نیم تمرین و بهبود باعث شد که او سریع‌تر، قوی‌تر و هوشمندتر شود.

43 درجه آزادی

انبوه حسگرها

سیستم کنترل هیبریدی که به ربات اجازه می‌دهد به‌طور مداوم یاد بگیرد و حرکاتش را تکمیل کند


به نظر می‌رسد داریم به لحظه‌ای نزدیک می‌شویم که ربات‌ها مانند انسان‌ها تمرین کنند.
سوال این است که G1 بعدی چه چیزی یاد می‌گیرد — پارکور یا چیزی حتی باحال‌تر؟



#AI #Robotics #Humanoid #Unitree #FutureTech
2
🤗 چه کسی واقعاً Open-Source AI را پیش می‌برد؟ تحلیل ۵۰ مدل پر دانلود در Hugging Face

یک تحقیق جدید نشان می‌دهد کدام سازمان‌ها و چه نوع مدل‌هایی اکوسیستم مدل‌های باز را شکل می‌دهند.

🔥 نکات کلیدی:
📦 تاپ ۵۰ مدل فقط ۳.۴٪ کل مدل‌های Hugging Face هستند، اما بیش از ۸۰٪ از ۴۵ میلیارد دانلود را جمع‌آوری می‌کنند.

بیشتر فعالیت‌ها حول یک گروه کوچک از لیدرها متمرکز است — این مدل‌ها چهره Open-Source AI را می‌سازند.


📉 اندازه مهم است (و هرچه کوچکتر، بهتر):

۹۲.۵٪ دانلودها — مدل < 1B پارامتر

۸۶.۳٪ — < 500M

۷۰٪ — < 200M

۴۰٪ — < 100M


نتیجه: در open-source، مدل‌های کوچک و سبک که مناسب استقرار محلی و Edge inference هستند، برنده‌اند.

🧠 حوزه‌های محبوب:

NLP — ۵۸.۱٪

Computer Vision — ۲۱.۲٪

Audio — ۱۵.۱٪

Multimodal — ۳.۳٪

Time Series — ۱.۷٪


سازندگان مدل‌های پر دانلود:

شرکت‌ها — ۶۳.۲٪ (گوگل پیشتاز)

دانشگاه‌ها — ۲۰.۷٪

نویسندگان مستقل — ۱۲.۱٪

NGO‌ها — ۳.۸٪

سایر آزمایشگاه‌ها — ۰.۳٪
1
📄 DeepSeek-OCR – مدل جدید برای تشخیص متن 🔍

DeepSeek یک مدل OCR قدرتمند منتشر کرده که می‌تواند تصاویر اسناد را مستقیم به Markdown یا متن تبدیل کند.

💡 ویژگی‌ها:

شناسایی متن در تصاویر و PDF

پشتیبانی از اسناد، جداول و طرح‌بندی‌های پیچیده

حالت‌های مختلف: Tiny, Small, Base, Large

بهینه‌شده برای GPU (PyTorch + CUDA 11.8)

مجوز MIT — استفاده و تغییر رایگان


📊 عملکرد:

دقت بالا و سرعت بالا با فشرده‌سازی توکن‌های بصری

در Omnidocbench بهترین دقت را با حداقل توکن‌های بصری دارد

از سایر مدل‌های OCR در کارایی و سرعت پیشی گرفته است
💡 گوگل Skills: پلتفرم رایگان برای تقویت مهارت‌های کار با AI!

سایت Google Skills یک پلتفرم آموزشی باز است که بیش از 3000 دوره، تمرین و مسیر عملی ارائه می‌دهد. موضوعات از مبانی Python و ML تا MLOps پیشرفته، Vertex AI، Gemini و طراحی پرامپت را پوشش می‌دهد.

🎯 می‌توانید یاد بگیرید:

ادغام AI تولیدی در Data Pipeline خود

آموزش استقرار و نگهداری مدل‌ها

ساخت برنامه شخصی با Gemini و Streamlit

آموزش با منتورها یا جامعه Google Cloud Innovators


📈 سطح‌ها متنوع است: از مبتدی تا تیم لید
🎓 پس از اتمام دوره‌ها، گواهی قابل اضافه کردن به رزومه و LinkedIn دریافت می‌کنید

✔️ شروع یادگیری: skills.google
✔️ فهرست دوره‌ها: catalog



#Google #AI #FreeCourse #ML #DataScience
This media is not supported in your browser
VIEW IN TELEGRAM
💻 سایت Claude Code حالا روی وب و iOS در دسترس است

شرکت Anthropic دستیار برنامه‌نویسی AI خود، Claude Code، را به پلتفرم‌های وب و iOS گسترش داده است. کاربران می‌توانند ریپازیتوری خود را متصل کنند، وظایف اختصاص دهند و اجازه دهند چت‌بات آن‌ها را به صورت خودکار انجام دهد.

🔹 مناسب برای پاسخ به سوالات پروژه، رفع باگ‌ها و مدیریت کارهای معمول توسعه
🔹 در حال حاضر برای کاربران Pro و Max فعال است و ادغام AI در جریان کاری برنامه‌نویسی را آسان‌تر می‌کند

این حرکت Claude Code را به یک دستیار فعال برای برنامه‌نویسی لحظه‌ای تبدیل می‌کند، نه فقط یک تولیدکننده کد منفعل.

AI #Coding #ClaudeCode #Anthropic #DeveloperTools
1