VIRSUN
15.5K subscribers
399 photos
234 videos
2 files
241 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
Download Telegram
🌍 معرفی MCP-Universe: بِنچمارک جدید Salesforce برای LLMها با سرورهای MCP

🔹 شرکت Salesforce یک بِنچمارک تازه منتشر کرده که توانایی مدل‌های زبانی بزرگ (LLM) را در کار با MCP (Model Context Protocol) می‌سنجد. MCP که اواخر ۲۰۲۴ توسط Anthropic معرفی شد، پروتکلی است برای اتصال LLM به سرویس‌ها و منابع داده‌ی بیرونی (مثل ابزارها و APIها).


---

🔎 ساختار بِنچمارک

♻️شامل ۱۱ MCP سرور با ۱۳۳ ابزار در ۶ حوزه مختلف
♻️در مجموع ۲۳۱ تسک واقعی طراحی شد، که هرکدام نیازمند یک یا چند تعامل MCP هستند


📌 نمونه حوزه‌ها و زیرتسک‌ها:

🗺 ناوبری روی نقشه: مسیریابی، ایستگاه‌های بهینه، جستجوی مکان و جستجو بر اساس ID

💻 مدیریت ریپازیتوری کد: تنظیم پروژه، ترکینگ مشکلات، اتوماسیون و ادغام کد

💰 تحلیل مالی: پورتفولیو، گزارش‌دهی، استراتژی معاملاتی، دارایی‌های نهادی، تحلیل سود سهام

🎨 طراحی سه‌بعدی (Blender): ساخت آبجکت، متریال، نورپردازی، رندر و سازمان‌دهی صحنه

🌐 اتوماسیون مرورگر: رزرو بلیط، تحلیل ورزشی، ریسرچ آکادمیک، پلتفرم آنالیز و ناوبری نقشه

🔎 وب‌سرچ: شناسایی افراد، استخراج موجودیت‌ها، متریک مَچینگ، استدلال پیچیده، فکت چک



---

⚙️ روش ارزیابی

♻️بررسی صحت فرمت پاسخ
♻️مقایسه ساده با جواب درست
♻️ارزیابی داینامیک (برای پرسش‌هایی مثل «امروز هوا چطوره» که پاسخ ثابت ندارند)


❗️ بخش بزرگی از تسک‌ها بیش از ۵ تماس با MCP نیاز دارند، یعنی مدل باید توانایی کار با کانتکست‌های طولانی و زنجیره تعاملات پیچیده را داشته باشد. همچنین تسک‌های بیش‌ازحد ساده یا مستقل از MCP فیلتر شدند.


---

اهمیت این بِنچمارک در اینه که داره اولین بار مهارت واقعی LLMها در تعامل با ابزارهای بیرونی و حل مسائل دنیای واقعی رو می‌سنجه، نه فقط پرسش و پاسخ متنی.

@rss_ai_ir
#هوش_مصنوعی #LLM #MCP #AI_Benchmark #صنعت
🔥13👍1211🎉8😁6
📊 نتایج بنچمارک MCP-Universe

تست‌های تازه‌ی MCP-Universe یک برنده‌ی مشخص داشتند: GPT-5 با اختلاف زیاد در صدر قرار گرفت:

🏆 نرخ موفقیت (SR) → ۴۳.۷٪

🏆 امتیاز ارزیابان (AE) → ۶۰.۲٪

📈 در تمام حوزه‌ها پیشتاز است، به جز Browser Automation که کمی بهتر از آن Grok-4 عمل کرده.



---

🔎 جزئیات بر اساس حوزه‌ها:

تحلیل مالی (Financial Analysis) → رکورد GPT-5 با ۶۷.۵٪؛ فاصله‌ی چشمگیر از بقیه.

طراحی سه‌بعدی (3D Designing) → باز هم صدرنشین با ۵۲.۶٪.

مدیریت مخزن کد (Repository Management) → GPT-5 با ۳۰.۳٪ به‌وضوح بالاتر از رقباست.

اتوماسیون مرورگر (Browser Automation) → این‌جا شگفتی رقم خورد: Grok-4 با ۴۱.۰٪ جلوتر از GPT-5 (۳۵.۹٪).



---

🟢 در میان مدل‌های متن‌باز (Open-Source):

♻️مدل GLM-4.5 بهترین عملکرد را داشت با ۲۴.۷٪ SR و ۴۱.۲٪ AE.

♻️مدل Kimi-K2 با وجود تبلیغات زیاد درباره‌ی آموزش ویژه برای MCP، تنها به ۱۹٪ SR رسید.



---

⚠️ نکته‌ی مهم: حتی رهبر جدول یعنی GPT-5 هم نتوانست از مرز ۵۰٪ کیفیت نهایی عبور کند. این نشان می‌دهد که تعامل LLMها با سرورهای MCP هنوز راه زیادی تا بلوغ کامل دارد، و این وظایف واقعاً پیچیده و چندلایه هستند.

@rss_ai_ir
#هوش_مصنوعی #LLM #MCP #GPT5 #Benchmarks
15😁11🔥9👍8🎉8
⚡️ مدیرعاملی که ۸۰٪ کارکنانش را اخراج کرد چون سریع به AI عادت نکردند، حالا بعد از ۲ سال می‌گوید باز هم همین کار را می‌کند!

او تاکید می‌کند: «هر کسی که نتواند فوراً یاد بگیرد چطور هوش مصنوعی را در فرآیندهای کاری خود ادغام کند، دیر یا زود شغلش را از دست خواهد داد.»

📌 این نشان می‌دهد که آینده شغل‌ها نه تنها به مهارت‌های فنی، بلکه به سرعت سازگاری با فناوری‌های نوین وابسته است.

@rss_ai_ir
#هوش_مصنوعی #AI #آینده_شغل #اتوماسیون
👍117😁3🎉3🔥2
🧠 کپسول‌نت (Capsule Networks): انقلابی خاموش در بینایی ماشین

آیا CNNها بی‌نقص‌اند؟ خیر.
یکی از ضعف‌های بزرگشون، از دست دادن اطلاعات فضایی اجزاء تصویر در لایه‌های Pooling هست.

📌 جفری هینتون برای رفع این مشکل، شبکه‌های کپسولی (CapsNets) رو معرفی کرد:

🔹 هر کپسول یک بردار خروجی می‌ده، نه یک عدد.

طول بردار = احتمال وجود ویژگی
جهت بردار = موقعیت، زاویه، اندازه و…


🔹 به جای "ثبات در برابر تغییرات" (Invariance)، به دنبال "هم‌وردی" (Equivariance) هست. یعنی شبکه درک می‌کنه که شیء با تغییر زاویه یا اندازه، همون شیء باقی می‌مونه.

🔹 مکانیزم Dynamic Routing باعث می‌شه کپسول‌های پایین‌دست (چشم، بینی) توافق کنن و به کپسول بالادست (صورت) وصل بشن → درک واقعی ساختار.

---

مزایا:

♻️داده آموزشی کمتر
♻️مقاومت در برابر حملات تخاصمی
♻️درک عمیق روابط سلسله‌مراتبی


⚠️ چالش: هزینه محاسباتی بالاتر و هنوز در فاز تحقیقاتی
---

📖 بیشتر بخونید:
🔗 مقاله اصلی هینتون
https://arxiv.org/abs/1710.09829


#هوش_مصنوعی #CapsuleNetwork #یادگیری_عمیق #شبکه_عصبی #جفری_هینتون

@rss_ai_ir
12👍4🔥3😁3🎉2
🛠️ پایان پروژه، پایان مسئولیت نیست!

خیلی وقت‌ها وقتی یک پروژه صنعتی تموم می‌شه و به کارفرما تحویل داده می‌شه، تیم فکر می‌کنه کارش تمومه و باید سریع سراغ پروژه بعدی بره. اما واقعیت اینه که مرحله‌ی پس از تحویل (Post-Deployment Monitoring) یکی از حیاتی‌ترین بخش‌های موفقیت پروژه است.

🔍 چرا مهمه؟

♻️شرایط واقعی صنعت با محیط تست متفاوته.
♻️اپراتورها ممکنه خطاهایی انجام بدن که در سناریوهای آزمایشی پیش‌بینی نشده.
♻️داده‌های جدید می‌تونن الگوهای متفاوتی داشته باشن.
♻️گاهی تنظیمات ساده مثل کالیبراسیون سنسور یا ریستارت سرویس باعث بروز مشکل می‌شه.


بهترین کار اینه که بعد از تحویل:

1. حداقل چند هفته پایش فعال داشته باشید.
2. گزارش خطاها و لاگ‌ها رو جمع‌آوری و تحلیل کنید.
3. آموزش کاربران نهایی رو جدی بگیرید.
4. آماده باشید برای تغییرات کوچک (Patch) یا اصلاحات سریع.



🔑 تحویل یک پروژه موفق فقط به روز Delivery ختم نمی‌شه؛ بلکه زمانی معنا پیدا می‌کنه که در محیط واقعی پایدار و قابل اعتماد کار کنه.

#هوش_مصنوعی #پروژه_صنعتی #مدیریت_پروژه #AI_industrial
10🔥4😁4🎉4👍2
☕️؛ احتمال نابودی بشر توسط هوش مصنوعی
@rss_ai_ir

🔹 به دنبال صحبت‌های اخیر جفری هینتون، یک صفحه جالب در ویکی‌پدیا منتشر شده که در آن فهرستی از دانشمندان و کارآفرینان مشهور آورده شده و هرکدام تخمین خود از احتمال نابودی بشر توسط هوش مصنوعی را داده‌اند.

📊 این احتمال با نام P(doom) شناخته می‌شود (Probability of Doom یا احتمال سناریوی آخرالزمانی).

چند نمونه از این برآوردها:

✳️ایلان ماسک → ۱۰ تا ۳۰ درصد

✳️جفری هینتون → بیش از ۵۰ درصد

✳️داریو آمودی (مدیرعامل Anthropic) → ۱۰ تا ۲۵ درصد

✳️یوشوا بنجیو → ۵۰ درصد

✳️دنیل کوکوتاجیلو (نویسنده یکی از معروف‌ترین گزارش‌های خطرات هوش مصنوعی) → ۷۰ تا ۸۰ درصد

✳️رُمان یامپولسکی → ۹۹.۹ درصد 😬


🔻 بدبین‌ترین‌ها: یامپولسکی و ماکس تگمارک.
🔻 خوش‌بین‌ترین‌ها: یان لِکون، ریچارد ساتن و مارک آندرسن (حدود ۰ درصد).

📉 میانگین کل تخمین‌ها: حدود ۱۴.۴ درصد
📈 میانه: تقریباً ۵ درصد
---

🔗 منبع: Wikipedia — P(doom)
---

به نظر شما این عددها نشانه‌ی اغراق و بدبینی است یا باید جدی گرفت؟ 🤔

#هوش_مصنوعی #خطرات #P_doom
@rss_ai_ir
👍9😁7🔥6🎉43
📊 کاربردهای هوش مصنوعی مولد در سال ۲۰۲۵
@rss_ai_ir

بر اساس تحلیل Harvard Business Review، این‌ها پرکاربردترین موارد استفاده از Generative AI در سال ۲۰۲۵ هستند (در مقایسه با ۲۰۲۴):


---

🔺 رشد چشمگیر

🧑‍⚕️ سلامت و سبک زندگی (Healthy Living): +۶۵
👨‍💻 کدنویسی (Generate Code): +۴۲
🖼️ تولید تصویر با AI: +۵۳
🎨 خلاقیت (Creativity): +۱۸
🎤 آمادگی برای مصاحبه: +۲۴
📚 یادگیری و آموزش (Enhance Learning): +۴

---
🔻 افت رتبه

🔍 جستجوی تخصصی (Specific Search): –۱۰
🛠️ رفع اشکال (Troubleshoot): –۹
🎓 یادگیری شخصی‌سازی‌شده: –۸

---

🆕 ورود کاربردهای تازه

👶 سرگرمی کودک (Child Entertainment)
🍼 کمک در نگهداری کودک (Childcare Help)
🧳 برنامه‌ریزی سفر (Travel Itinerary)
🏢 مدل‌های سازمانی (Corporate LLM)
✍️ مقاله‌های دانشجویی (Student Essays)
🚫 مقابله با مزاحمت آنلاین (Anti-trolling)

---

📌 نتیجه‌گیری:
هوش مصنوعی مولد در سال ۲۰۲۵ از مرحله‌ی ایده‌پردازی فراتر رفته و وارد زندگی روزمره، سلامت، آموزش و حتی خانواده شده است.


---

#هوش_مصنوعی #AI #GenerativeAI
@rss_ai_ir
👍10😁75🎉5👏3🙏1
🔒 جیلبریک در هوش مصنوعی؛ تهدید پنهان
@rss_ai_ir

امروزه بسیاری از کاربران تلاش می‌کنند محدودیت‌های مدل‌های زبانی بزرگ را دور بزنند. این کار که جیلبریک (Jailbreak) نام دارد، می‌تواند پیامدهای خطرناکی به همراه داشته باشد.

⚠️ جیلبریک چیست؟
به معنای وادار کردن مدل به تولید خروجی‌هایی است که معمولاً ممنوع شده‌اند؛ مثل کدهای مخرب، محتوای حساس یا دسترسی به داده‌های محرمانه.

🛑 روش‌های رایج

✳️دستکاری ورودی‌ها (Prompt Injection)
✳️رمزگذاری یا تغییر شکل متن برای عبور از فیلترها
✳️سوءاستفاده از استدلال گام‌به‌گام مدل (Chain-of-Thought Hijacking)
✳️آلوده کردن داده‌های مرجع (Data Poisoning / RAG)


📊 آمار تکان‌دهنده

✳️همچنین GPT-4o در برخی تست‌های امنیتی تا ۲۲.۷٪ موارد قابل جیل‌بریک است.
✳️در سناریوهای پیچیده‌تر این عدد حتی به ۷۸.۶٪ می‌رسد.
✳️همچنین Claude-3.5 مقاومت بیشتری دارد، اما همچنان آسیب‌پذیر است.


🛡️ راهکارهای مقابله

✳️تست و ارزیابی مداوم (Red Teaming)
✳️استفاده از مدل‌های محافظ (Guardian)
✳️آموزش مقاوم با سناریوهای حمله (Adversarial Training)
✳️پایش بلادرنگ رفتار مشکوک
✳️ترکیب هوش مصنوعی با قوانین سنتی امنیت سایبری



---

📌 در یک جمله:
جیلبریک همانند یک «ویروس رفتاری» در دنیای AI است که اگر مهار نشود، می‌تواند به سرعت کل اکوسیستم را آلوده کند.

#هوش_مصنوعی #جیل_بریک #امنیت_سایبری
@rss_ai_ir
🔥15🎉13😁9👍75🤯1😱1
📊 سهم هوش مصنوعی در اقتصاد ۲۰۳۵
@rss_ai_ir

تحلیل‌ها نشون می‌ده که تا سال ۲۰۳۵، هوش مصنوعی بزرگ‌ترین ارزش اقتصادی رو در صنایع زیر ایجاد می‌کنه:

🏭 تولید (Manufacturing) → بیش از ۱۰ تریلیون دلار
💼 خدمات حرفه‌ای و مالی → چندین تریلیون دلار ارزش افزوده
🛒 خرده‌فروشی و عمده‌فروشی → رشد چشمگیر
📡 اطلاعات و ارتباطات → سهم بالا در ارزش اقتصادی

بخش‌های دیگر مثل بهداشت و درمان، حمل‌ونقل و خدمات عمومی هم بهره‌مند می‌شن، اما در مقیاس کوچک‌تر.
کمترین اثرگذاری مربوط به کشاورزی و هنر و سرگرمی است.


---

📌 جمع‌بندی:
هوش مصنوعی تا یک دهه آینده از مرز تکنولوژی فراتر می‌ره و به موتور محرک اقتصاد جهانی تبدیل می‌شه.

#هوش_مصنوعی #اقتصاد #AI
@rss_ai_ir
🔥95👍5🎉5😁1