DLeX: AI Python

✍️

لینک توییت : https://x.com/Figure_robot/status/2052770982214172892?s=20

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4❤1

2.7K viewsNaviD DariYa, 18:31

این دوتا ربات با کمک هم اتاق رو مرتب می کنن. شرکت Figure 👉 @ai_python ✍️ لینک توییت : https://x.com/Figure_robot/status/2052770982214172892?s=20

آقای Corey Lynch در این باره خاطر نشان کردن که :

To be clear, there's no explicit messaging between these robots, they coordinate their actions fully visually, e.g. head nods.

2👍4❤1

2.5K viewsNaviD DariYa, 18:45

گوگل کروم هم قابلیت Skills اضافه کرده

👉

✍️

Please open Telegram to view this post

VIEW IN TELEGRAM

1👍4❤2

2.46K viewsNaviD DariYa, 21:35

متدهای رایج تغییر رفتار مدل های زبانی :

👉

How to change model behavior! Context engineering, fine-tuning and more

✍️

How to change model behavior! Context engineering, fine-tuning and more

https://youtu.be/oqbKWwUhh4Y?si=qr81Br44pflBK-i4

Please open Telegram to view this post

VIEW IN TELEGRAM

YouTube

A look at context engineering, fine tuning, LoRA and more!

▬▬▬▬▬▬ C H A P T E R S ⏰ ▬▬▬▬▬▬
00:00 - Introduction
00:27 - Model 101
01:46 - Parameters
04:40 - Hidden layers and dimensions
05:35 - Embeddings
07:08 - Training phase
07:53 - Prompts and responses…

1❤3👍2

1.75K viewsNaviD DariYa, 10:11

توضیحات در مورد دوره منتورینگ

Forwarded from Reza Jafari

معرفی بنچمارک جدید ProgramBench : سخترین آزمون مهندسی نرم افزار برای LLMها

بنچمارک ProgramBench یه بنچمارک خیلی جدی و متفاوت برای ارزیابی توانایی LLMها در ساخت نرم‌افزار از صفره. ایده‌ی اصلیش اینه که ببینه آیا مدل‌های زبانی واقعاً می‌تونن فقط با داشتن یک executable و documentation، دوباره کل یک برنامه رو بازسازی کنن یا نه.

توی هر تسک، Agent فقط به فایل اجرایی برنامه و مستنداتش دسترسی داره؛ نه Source Code رو می‌بینه، نه اجازه‌ی decompile کردن داره و نه حتی اینترنت در اختیارشه. یعنی مدل باید دقیقاً مثل یه مهندس نرم‌افزار واقعی، رفتار برنامه رو بررسی کنه، Architecture طراحی کنه، Language انتخاب کنه، کل Source Code رو بنویسه و حتی Build Script هم بسازه.

این بنچمارک حدود ۲۰۰ تسک مختلف داره؛ از ابزارهای سبک command-line مثل jq و ripgrep گرفته تا پروژه‌های سنگین و پیچیده‌ای مثل PHP، FFmpeg و SQLite.

نکته‌ی مهم اینه که ProgramBench هیچ ساختار آماده‌ای به مدل نمی‌ده. خبری از method signature، class skeleton یا حتی توضیح درباره‌ی ساختار فایل‌ها نیست. Agent خودش باید تصمیم بگیره برنامه چطور modular بشه، چه abstractionهایی تعریف بشه و interfaceها چه شکلی باشن. همین باعث میشه این بنچمارک بیشتر از اینکه صرفاً coding رو بسنجه، توانایی واقعی software design و system architecture رو اندازه‌گیری کنه.

بعد از اینکه Agent برنامه رو تحویل می‌ده، یه test suite خیلی بزرگ رفتار نسخه‌ی ساخته‌شده رو با برنامه‌ی اصلی مقایسه می‌کنه. این تست‌ها با agent-driven fuzzing تولید شدن و در مجموع بیشتر از 248 هزار behavioral test روی ۲۰۰ تسک اجرا میشه. فقط وقتی همه‌ی تست‌ها پاس بشن، اون تسک «حل‌شده» حساب میشه.

یکی از جذاب‌ترین بخش‌های ProgramBench اینه که عمداً جلوی shortcutها و cheating گرفته شده. Agentها داخل sandbox اجرا میشن، اینترنت ندارن و حتی دسترسی read به binary هم ندارن؛ یعنی ابزارهایی مثل decompiler، disassembler یا objdump عملاً کار نمی‌کنن. هدف اینه که benchmark واقعاً توانایی “building from scratch” رو اندازه بگیره، نه سرهم کردن کدهای decompiled.

امتیازها فعلاً خیلی پایینن، ولی این خودش نشون می‌ده مسئله چقدر سخت و واقعی طراحی شده. با اینکه مدل‌ها روی خیلی از تسک‌ها partial progress دارن، ولی هنوز ساخت کامل و بدون نقص نرم‌افزارهای بزرگ برای AI یه چالش جدیه.

در کل، ProgramBench الان یکی از جدی‌ترین بنچمارک‌ها برای سنجش توانایی واقعی AI Agentها در Software Engineering محسوب میشه؛ جایی که فقط code generation مهم نیست، بلکه planning، architecture، debugging و understanding رفتار سیستم هم نقش اصلی رو دارن.

🔗

لینک سایت ProgramBench

👑

🏆

نحوه ثبت‌نام در دوره منتورینگ

🤝

تجارب موفق قبلی بچه‌ها از منتورینگ

@reza_jafari_ai

Please open Telegram to view this post

VIEW IN TELEGRAM

3❤12👍6

2.1K viewsNaviD DariYa, 10:30

Forwarded from ایلان ماسک به فارسی

😂

🖥

🙄

Please open Telegram to view this post

VIEW IN TELEGRAM

8🐳6❤2

2.67K viewsNaviD DariYa, 18:14

جزئیات آسیب پذیری کشف شده در Ollama :

👉

Ollama Out-of-Bounds Read Vulnerability Allows Remote Process Memory Leak

✍️

Please open Telegram to view this post

VIEW IN TELEGRAM

1😭5👍2💔2

2.65K viewsNaviD DariYa, 21:58

قبلن در چانال به این موضوع اشاره کرده بودیم که اجنت های هوش مصنوعی به قدری در اکوسیستم Microsoft اینتگریت شدن که حتی در محصولی مثل Entra ، همون دسترسی هایی که به کاربران معمولی می دیم برای اجنت های خودکار هوش مصنوعی هم وجود داره و قابل تعریف هستند.

👉

Unlocking knowledge through intelligence: Lessons learned using SharePoint agents at Microsoft

✍️

حالا سوال اینجاست که دیتاهای ما چگونه باشند تا اجنت ها، موثر تر بتوانند آن ها را بخوانند و نتایج قابل اتکا تری به ما ارائه کنند؟ برای مثل در SharePoint ساختار مناسب برای داده ها چگونه است؟

این پست وبلاگ مایکروسافت درباره همین موضوع است :

Unlocking knowledge through intelligence: Lessons learned using SharePoint agents at Microsoft - Inside Track Blog

Please open Telegram to view this post

VIEW IN TELEGRAM

Microsoft News

Discover how we’re using SharePoint agents to scale enterprise knowledge internally here at Microsoft.

1❤5👍2

2.59K viewsNaviD DariYa, 21:35

در حال حاضر سه راه اصلی برای ایجاد محدودیت خواندن داده ها برای Agent های هوش مصنوعی در SharePoint وجود داره.

👉

✍️

نکته مهم درباره راه سوم اینه که نیاز به لایسنس اضافه داره.

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤4👍2

2.23K viewsNaviD DariYa, 21:52

This media is not supported in your browser

0:10

VIEW IN TELEGRAM

👉

👨‍💻

Please open Telegram to view this post

VIEW IN TELEGRAM

6👍8❤3🐳3

2.33K viewsNaviD DariYa, edited 16:57

تغییرات در نسخه تازه Claude Code

👉

✍️

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤2👍2

2.49K viewsNaviD DariYa, 07:16

Forwarded from ایلان ماسک به فارسی

ایلان ماسک گفته که فقط الگوریتم X بین شبکه های اجتماعی منتشر می شه و همه می تونن ببینن.

🖥

🙄

این درحالیه که بقیه مخفیانه الگوریتم هارو دستکاری می کنند.

برخی معتقد هستند که این از نظر فنی دقیقن درست نیست. چون برای مثال وزن های مدل Ranking در رپوی گیت هاب منتشر نشده. و ایراداتی از این قبیل. که البته من خودم چک نکردم و اطلاع ندارم.

اما در هر صورت ایلان ماسک امروز لینک گیت هاب جدید ترین الگوریتم رو به اشتراک گذاشت :

Elon Musk auf X: „The latest 𝕏 algorithm has been published to GitHub https://t.co/ZCOm51uxmh“ / X

Please open Telegram to view this post

VIEW IN TELEGRAM

8👍9❤3

2.48K viewsNaviD DariYa, 19:31

Forwarded from ایلان ماسک به فارسی

اینترنت تنها چیزی است که به معنای واقعی کلمه تولید ناخالص داخلی کل کشور را افزایش می‌دهد.

هر کشوری که با استارلینک قرارداد امضا کند، یک زیرساخت اینترنتی موازی دریافت می‌کند.

هر کشوری که تأخیر کند، بیشتر عقب می‌ماند.

🖥

🙄

The internet is the one single thing that literally lifts an entire country's GDP

Every country that signs with Starlink gets a parallel internet infrastructure

Every country that delays gets left further behind

Please open Telegram to view this post

VIEW IN TELEGRAM

10👍13😭10💔3❤1

2.28K viewsNaviD DariYa, 21:41

واقعن چرا؟ دلیلش دو تا مورد می تونه باشه به نظر من :

👉

✍️

1 - بوروکراسی شدید در اروپا

2 - احزاب سیاسی ای که کوکورانه بر ضد تمام انواع سرمایه داری هستند

Please open Telegram to view this post

VIEW IN TELEGRAM

11👍30❤4

2.28K viewsNaviD DariYa, 15:39

واقعن چرا؟ دلیلش دو تا مورد می تونه باشه به نظر من : 👉 @ai_python ✍️ 1 - بوروکراسی شدید در اروپا 2 - احزاب سیاسی ای که کوکورانه بر ضد تمام انواع سرمایه داری هستند

بعد از اینکه برخی از مخاطبان لطف کردن و نظرشون رو درباره پست قبلی گفتن، نکته مهمی توجهم رو جلب کرد.

و اونم اینه که درسته که شرکت هایی مثل DeepL یا Black Forest Labs اروپایی هستند، (البته یکی از دوستان هم گفتند HuggingFace که اون اروپایی نیست و از نظر حقوقی یک شرکت آمریکایی محسوب می شه با این که بنیانگذارانش در اصل آمریکایی نبودند) اما توجه کنید که شرکت های معرفی شده در پست قبلی، شرکت هایی هستند که مدل Frontier دارند.

👉

✍️

تقریبن به جز Mistral هیچ شرکتی در اروپا نداریم که مدل Frontier داشته باشه. مدل های Frontier مدل هایی هستند که تقریبن توی تمام بنچ مارک ها رقابت می کنند و از طرف دیگه سرمایه گذاران بسیاری هم دارند. مشخصه اصلی این شرکت ها اینه که برای AGI رقابت می کنند.

با این اوصاف این تفاوت بین آمریکا و اروپا از این نظر بسیار شدید دیده می شه.

حالا بگذریم که خود میسترال هم از نظر ماهیتی تقاوت بسیاری با شرکت هایی که به عرضه مدل های Frontier مشهور هستند داره و بیش تر مشتریانش Enterprise هستند.

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤5👍3😭2

2.49K viewsNaviD DariYa, 21:18

This media is not supported in your browser

0:46

VIEW IN TELEGRAM

وقتی از ربات اطلس می خوای که برات یه نوشیدنی بیاره :

👉

✍️

Please open Telegram to view this post

VIEW IN TELEGRAM

1🐳4❤3👍2

2.51K viewsNaviD DariYa, edited 21:26

خلاصه مختصر و مفیدی از دوره (سرتیفیکیت) AI-901 :

👉

https://youtu.be/a-yuXz_uV30?si=mdMpk_0DsY6a-9ff

✍️

Please open Telegram to view this post

VIEW IN TELEGRAM

YouTube

AI-901 Microsoft Azure AI Fundamentals Study Cram

Key information to help pass the AI-901 certification exam.

Set an environment variable:
$Env:AZURE_OPENAI_KEY = 'YOURKEYHERE'

▬▬▬▬▬▬ C H A P T E R S ⏰ ▬▬▬▬▬▬
00:00 - Introduction
00:37 - Study resources
02:49 - What is AI
05:30 - Assistants and agents…

1❤2👍2

2.56K viewsNaviD DariYa, 22:04

Forwarded from ایلان ماسک به فارسی

خب می بینم که ایلان ماسک به جای این که فوکوس بذاره روی برنامه نویسی خالص، می خواد کمی هم روی DevOps و کنترل زیرساخت، فوکوس کنه که بلکه Grok Build بتونه سری میون سرها دربیاره ...

🖥

🙄

نظر شما چیه؟

Please open Telegram to view this post

VIEW IN TELEGRAM

8👍8❤3🐳2

2.37K viewsNaviD DariYa, 22:07

مهم ترین نکاتی که در این ویدیو گفته شده :

از اواسط ماه ژوئیه، قابلیت Copilot به طور مستقیم در SharePoint برای تمام کاربرانی که لایسنس Copilot دارن فعال خواهد شد.

همچنین در Purview به منظور DLP می شه ایمیل های خارجی رو از منابع تحت دسترس Copilot مستثنی کرد.

👉

https://youtu.be/rBEBKTy7HuU?si=5WOrkpoOfCsY2GK4

✍️

Please open Telegram to view this post

VIEW IN TELEGRAM

YouTube

Copilot in SharePoint | OneDrive- & SPO-Updates | Power Automate Flows wiederherstellen | & mehr

⚠ Die NEWS: Power Automate Flows wiederherstellen | SharePoint Speicherkontingente | Copilot in SharePoint | Authoritative Sites & DLP für Copilot | M365 Backup Neuerungen

Microsoft Power Automate erhält ab 1. Juni eine Wiederherstellungsfunktion für gelöschte…

2❤2👍2

2.23K viewsNaviD DariYa, 18:52

مدل های جهانی یا همون World Models نوعی سیستم هوش مصنوعی هستن که یاد می‌گیرن جهان واقعی رو شبیه‌سازی کنن. یعنی به جای اینکه فقط تصویر یا ویدیو تولید کنن، رفتار و قوانین دنیای واقعی رو درک می‌کنن و می‌تونن اتفاقات آینده رو پیش‌بینی کنن.

تفاوتشون با مدل های Video Generation ای که الان وجود دارن چیه؟ : مدل های مثل مدل های شرکت Runway و خیلی مدل های دیگه ای که توی ذهنمون هست فقط ویدیو های کوتاه و واقع بینانه می سازن.

👉

✍️

اما World Models یک شبیه‌ساز تعاملی از جهان هستن. می‌تونی باهاشون تعامل کنی، تصمیم بگیری و ببینی چه اتفاقی می‌افته (مثل یک بازی ویدیویی هوشمند).

1️⃣ کاربردهای عملی: آموزش ربات‌ها و خودروهای خودران بدون نیاز به دنیای واقعی

2️⃣ تولید داده‌های مصنوعی (Synthetic Data) با کیفیت خیلی بالا

3️⃣ شبیه‌سازی محیط‌های پیچیده مثل شهرها، جاده‌ها، کارخانه‌ها و غیره

👉

✍️

در این ویدیو، مصاحبه‌هایی با متخصصان انویدیا مثل TJ Galda انجام شده و مدل‌هایی مثل NVIDIA Cosmos Predict و مقایسه با V-JEPA و شبیه‌ساز CARLA نشون داده می‌شه.

خود خانم Julia Turk رو می تونید از این جا دنبال کنید : https://x.com/juliarturc

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤3👍2

2.17K viewsNaviD DariYa, 14:59

کیفیت تصمیم ها، به کیفیت داده های پشت آن ها ارتباط دارد.

👉