VIRSUN
6.11K subscribers
1.05K photos
612 videos
5 files
678 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.me/rss_ai_ir_group
Download Telegram
💠 نسل جدید دارایی‌های سه‌بعدی با ویژگی‌های فیزیکی واقعی PhysX‑3D:

داده بساز، رفتار فیزیکی شبیه‌سازی کن، مدل سه‌بعدی واقعی بساز.
---

🧠 پروژه PhysX-3D یک انقلاب در تولید آبجکت‌های سه‌بعدی است. این سیستم نه فقط شکل ظاهری، بلکه خواص فیزیکی هر شی (مثل جرم، جنس، حرکت‌پذیری و...) را نیز تولید می‌کند.

📊 آنالیز دیتاست PhysXNet + PhysXNet-XL:

📌 توزیع اجزای مدل‌ها (شکل a):
اکثر آبجکت‌ها بین 1 تا 20 جزء دارند، که نشان‌دهنده طراحی ساده و کاربردی است.

📌 ابعاد فیزیکی واقعی (شکل b):
بیشتر اشیا اندازه‌ای بین 50 تا 200 سانتی‌متر دارند؛ بسیار مناسب برای کاربردهای واقع‌گرایانه مثل متاورس، AR/VR یا ربات‌ها.

📌 نوع حرکات و مفاصل (شکل c - چپ):
بیش از ۴۰٪ اشیا دارای مفصل لغزنده (Prismatic) و ۳۷٪ بدون محدودیت حرکتی‌اند؛ یعنی تنوع بالایی در رفتار حرکتی دارند.

📌 خواص فیزیکی مواد (شکل c - میانی و راست):

* مدول یانگ (سختی ماده) بیشتر بین 2 تا 4 و 3 تا 10 است.
* نسبت پواسون غالباً 0.25 تا 0.3
* چگالی رایج بین 1 تا 2.5 g/cm³

📌 توزیع موضوعی داده‌ها (شکل d):
ابر کلمات نشان می‌دهد بیشترین آبجکت‌ها شامل:
Furniture, Table, Chair, Lamp, Lighting, Cabinet هستند.

📌 PhysXNet-XL (شکل e)
نسخه بزرگ‌تر دیتاست با تولید رویه‌ای، که بیش از ۵۳٪ آن شامل cabinet و ۲۹٪ شامل table است؛ تمرکز روی کاربردهای indoor.

---

🎯 این آمار نشون می‌ده که:

* دیتاست بسیار گسترده و تنوع‌پذیر طراحی شده.
* ویژگی‌های فیزیکی کاملاً قابل کنترل و واقعی‌اند.
* کاربرد در رباتیک، بازی‌سازی، شبیه‌سازهای صنعتی و آموزش مدل‌های فیزیک‌محور بسیار بالاست.

🖥 Github: https://github.com/ziangcao0312/PhysX-3D

📕 Paper: https://arxiv.org/pdf/2507.12465v1.pdf

🔗 Dataset: https://paperswithcode.com/dataset/shapenet

📌 برای پروژه کامل به پست قبل مراجعه کنید.
📡 بیشتر در:
@rss_ai_ir

#PhysX #3DVision #هوش_مصنوعی #Simulation #فیزیک #مدل_سه‌بعدی #AI_3D
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🦄 City-Tour → Simulation 🦄

پروژه‌ی UrbanVerse سیستمی نوآورانه است که ویدیوهای واقعی از تورهای شهری را به محیط‌های شبیه‌سازی تعاملی و مبتنی بر فیزیک تبدیل می‌کند.

🎯 هدف اصلی آن، ایجاد بستری مقیاس‌پذیر برای یادگیری ربات‌ها در فضاهای شهری واقعی است — جایی که مدل‌ها بتوانند بین دنیای شبیه‌سازی و واقعیت تعمیم‌پذیری واقعی پیدا کنند.

💡 ویژگی‌ها:

✳️تبدیل ویدیوهای شهری واقعی به شبیه‌سازی‌های فیزیکی پویا
✳️پشتیبانی از تعاملات در زمان واقعی (real-time interaction)
✳️امکان آموزش ربات‌ها در محیط‌های شهری متنوع و واقعی


📘 منابع:
👉 Paper
👉 Project Page
👉 Repo — به‌زودی منتشر می‌شود

#UrbanVerse #Simulation #Robotics #AI #MachineLearning #UrbanAI #DigitalTwin #CitySimulation
This media is not supported in your browser
VIEW IN TELEGRAM
🌍 RTFM:
مدل جدید WorldLab برای تولید دنیای تعاملی

مدل WorldLab که قبلاً چندین بار درباره‌اش صحبت شده بود، حالا دموی جدیدی از مدل RTFM (Real-Time Frame Model) منتشر کرده که حتماً باید امتحان کنید.

ویژگی‌های اصلی:

🔁 حافظه‌ی بی‌نهایت (infinite context)

🎨 اسکین‌های غیر فتو‌ریالیستی با سبک‌های متنوع

🌐 تولید یک دنیای کامل فقط از یک تصویر و یک پرامپت


🔗 دموی تعاملی:
rtfm.worldlabs.ai
(فعلاً فقط تصاویر از کتابخانه داخلی پشتیبانی می‌شود.)

📖 مقاله‌ی رسمی:
worldlabs.ai/blog/rtfm


---

💡 مسئله‌ی اصلی:
تولید «جهان‌های زنده» به کمک مدل‌های مولد به مراتب پرهزینه‌تر از LLMهاست.
اگر بخواهیم مثل مدل‌های ویدئویی فعلی کار کنیم، برای رندر یک ویدئوی 4K با نرخ ۶۰ فریم بر ثانیه باید بیش از ۱۰۰ هزار توکن در ثانیه تولید شود — تقریباً به اندازه‌ی کل رمان «فرانکشتاین»!
برای تعامل یک‌ساعته نیز نیاز به بیش از ۱۰۰ میلیون توکن حافظه داریم — از نظر اقتصادی و سخت‌افزاری غیرممکن است.


---

⚙️ نوآوری WorldLab در RTFM:
✳️این مدل فقط روی یک GPU از نوع H100 اجرا می‌شود و تجربه‌ی تعاملی روان ارائه می‌دهد.

راز کار در این است که به‌جای ذخیره‌ی تمام فریم‌ها، فقط موارد زیر نگهداری می‌شوند:

♻️زاویه‌های دوربین
♻️متادیتا
♻️چند فریم اطراف زاویه فعلی (cache هوشمند)
♻️اگر زاویه به‌طور قابل توجهی تغییر کند، مدل فریم‌ها را از نو می‌سازد — صرفه‌جویی عظیم در حافظه!


---

🎥 نتیجه:
مدل RTFM می‌تواند صحنه‌هایی با جزئیات بالا، بازتاب‌ها، سطوح براق، سایه‌ها و نورهای طبیعی تولید کند.
در ابتدای هر شات ممکن است اندکی آرتیفکت دیده شود، اما کیفیت و عمق صحنه آن‌قدر چشم‌گیر است که این جزئیات کوچک به چشم نمی‌آیند.


---

📌 جمع‌بندی:
WorldLab با RTFM نشان می‌دهد که آینده‌ی مدل‌های مولد نه فقط در تولید تصویر یا ویدئو، بلکه در خلق دنیای واقعی تعاملی در لحظه است.

@rss_ai_ir

#AI #WorldLab #RTFM #GenerativeAI #3D #Simulation #Realtime #هوش_مصنوعی #مدل_مولد #جهان_مجازی
🤖 GaussGym:
انقلابی در آموزش ربات‌ها از طریق پیکسل‌ها — سریع، فتوواقع‌گرایانه و متن‌باز

فریم‌ورک جدید GaussGym معرفی شد — اولین پلتفرم open-source که سرعت بسیار بالا را با بینایی فتوواقعی (Photorealistic Vision) در شبیه‌سازی ربات‌ها ترکیب می‌کند. 🚀

این سیستم با استفاده از 3D Gaussian Splatting به‌عنوان یک رندرکننده‌ی تعبیه‌شده در شبیه‌سازهای وکتوریزه (مانند IsaacGym)، قادر است سیاست‌های بینایی-حرکتی (Visuomotor Policies) را تنها از تصاویر RGB با سرعتی بیش از ۱۰۰٬۰۰۰ گام در ثانیه آموزش دهد — حتی روی یک کارت RTX 4090!

🔹 ساخت دنیای تمرینی از ویدیوهای iPhone، دیتاست‌های GrandTour و ARKit یا حتی ویدیوهای مولد (مثل Veo)
🔹 بازسازی خودکار صحنه‌های فیزیکی دقیق با کمک VGGT و NKSR بدون نیاز به مدل‌سازی دستی سه‌بعدی
🔹 آموزش سیاست‌های حرکت و ناوبری مستقیم از پیکسل‌ها و انتقال آن‌ها به دنیای واقعی بدون هیچ تنظیم اضافی (Zero-Shot Sim2Real) — نمونه‌ی آزمایشی شامل بالا رفتن ربات از پله‌های ۱۷ سانتی‌متری
🔹 پشتیبانی از عمق، motion blur، randomization دوربین و سایر افکت‌های واقع‌گرایانه برای بهبود انتقال

تمامی کدها، داده‌ها، مدل‌ها و دیتاست‌ها به‌صورت کاملاً متن‌باز در دسترس هستند 👇
🔗 دمو: escontrela.me/gauss_gym
📄 مقاله: arxiv.org/abs/2510.15352
💾 داده‌ها: huggingface.co/collections/escontra/gauss-gym-datasets
💻 کد: github.com/escontra/gauss_gym

مدل GaussGym مرز بین سرعت و واقع‌گرایی را در رباتیک از بین برده و مسیر آموزش ربات‌ها از تصاویر را واقعاً مقیاس‌پذیر کرده است.

@rss_ai_ir
#AI #Robotics #Simulation #GaussGym #IsaacGym #3DGS #OpenSource