UQ: Assessing Language Models on
Unsolved Questions
پژوهشگران آمدن به جای آزمونهای مصنوعی و بیارتباط با دنیای واقعی، پژوهشگران رویکرد تازهای پیشنهاد دادهاند: ارزیابی مدلهای زبانی روی پرسشهای واقعی و حلنشده.
در این روش، پرسشها از منابعی مثل Stack Exchange جمعآوری شده و با ترکیب اعتبارسنجی خودکار و تأیید جمعی جامعه بررسی میشوند.
🔎 نتیجه اولیه: از میان ۵۰۰ پرسش دشوار، مدلها تنها توانستهاند حدود ۱۰ مسئله را حل کنند. این یعنی پیشرفت واقعی در این مسیر میتواند همزمان مرزهای دانش انسانی را هم جابهجا کند. 🌍✨
🌐 Platform: https://uq.stanford.edu
📄 Paper: https://arxiv.org/abs/2508.17580
💻 Code: https://github.com/uq-project/UQ
🤗 Data: https://huggingface.co/datasets/uq-project/uq
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
Unsolved Questions
پژوهشگران آمدن به جای آزمونهای مصنوعی و بیارتباط با دنیای واقعی، پژوهشگران رویکرد تازهای پیشنهاد دادهاند: ارزیابی مدلهای زبانی روی پرسشهای واقعی و حلنشده.
در این روش، پرسشها از منابعی مثل Stack Exchange جمعآوری شده و با ترکیب اعتبارسنجی خودکار و تأیید جمعی جامعه بررسی میشوند.
🔎 نتیجه اولیه: از میان ۵۰۰ پرسش دشوار، مدلها تنها توانستهاند حدود ۱۰ مسئله را حل کنند. این یعنی پیشرفت واقعی در این مسیر میتواند همزمان مرزهای دانش انسانی را هم جابهجا کند. 🌍✨
🌐 Platform: https://uq.stanford.edu
📄 Paper: https://arxiv.org/abs/2508.17580
💻 Code: https://github.com/uq-project/UQ
🤗 Data: https://huggingface.co/datasets/uq-project/uq
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
✨ ریاضیات فقط فرمول و عدد نیست؛ زبانیه برای درک و حل مسائل دنیای واقعی
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
👌5⚡1
📌 خیلی وقتا RAG سنتی خوب جواب میده، مخصوصاً برای پرسشهای ساده یا وقتی دنبال یه بخش مشخص از سند هستیم. توی این حالت، سیستم فقط شبیهترین متن رو پیدا میکنه و جواب رو از همون میسازه.
اما مشکل اینجاست 👇
🔸 هر تکهی متن رو جدا از بقیه میبینه
🔸 وقتی اطلاعات تو چند سند پخش شده باشه نمیتونه «نقاط رو به هم وصل کنه»
🔸 روابط بین موجودیتها (آدمها، مکانها، مفاهیم و …) رو درک نمیکنه
🚀 اینجاست که Graph RAG وارد عمل میشه:
اول موجودیتها و ارتباطها رو از متن استخراج میکنه
بعد یه گراف دانش میسازه که همه چیز به هم وصل باشه
موقع پرسش، هم متن مرتبط رو میاره و هم رابطهها رو در نظر میگیره
در نتیجه پاسخها خیلی دقیقتر و جامعتر میشن
🔑 خلاصه بگم:
برای سوالهای سریع و ساده ➡️ RAG معمولی
برای تحلیل عمیق، ترکیب چند سند و پرسشهای پیچیده ➡️ Graph RAG
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
اما مشکل اینجاست 👇
🔸 هر تکهی متن رو جدا از بقیه میبینه
🔸 وقتی اطلاعات تو چند سند پخش شده باشه نمیتونه «نقاط رو به هم وصل کنه»
🔸 روابط بین موجودیتها (آدمها، مکانها، مفاهیم و …) رو درک نمیکنه
🚀 اینجاست که Graph RAG وارد عمل میشه:
اول موجودیتها و ارتباطها رو از متن استخراج میکنه
بعد یه گراف دانش میسازه که همه چیز به هم وصل باشه
موقع پرسش، هم متن مرتبط رو میاره و هم رابطهها رو در نظر میگیره
در نتیجه پاسخها خیلی دقیقتر و جامعتر میشن
🔑 خلاصه بگم:
برای سوالهای سریع و ساده ➡️ RAG معمولی
برای تحلیل عمیق، ترکیب چند سند و پرسشهای پیچیده ➡️ Graph RAG
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔥5⚡1👍1
HCRMP: A LLM-HINTED CONTEXTUAL REINFORCEMENT
LEARNING FRAMEWORK FOR AUTONOMOUS DRIVING
خروجی های LLM مستعد Hallucinations هستند برای مثال مدل Gemini-2.5-Pro (یکی از پیشرفتهترین LLMها)، نرخ عدم توهمزایی در وظایف مرتبط با رانندگی تنها ۵۷.۹۵٪ است. این یعنی بیش از ۴۰٪ از خروجیهای آن مستعد Hallucinations هستند که این موضوع می تواند عملکرد سیستم رانندگی رو به خطر بندازه برای همین توی این مقاله امد ن از پرادایم RLبا راهنمایی LLM استفاده کردن به این معنی حتی اگر خروجیهای LLM ناپایدار باشند، عامل RL میتواند با یادگیری سیاست خود، اشارات معنایی نادرست احتمالی را جبران کند و از تولید مستقیم اقدامات نامعقول جلوگیری نماید.
اطلاع بیشتر👇
https://arxiv.org/pdf/2505.15793
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
LEARNING FRAMEWORK FOR AUTONOMOUS DRIVING
خروجی های LLM مستعد Hallucinations هستند برای مثال مدل Gemini-2.5-Pro (یکی از پیشرفتهترین LLMها)، نرخ عدم توهمزایی در وظایف مرتبط با رانندگی تنها ۵۷.۹۵٪ است. این یعنی بیش از ۴۰٪ از خروجیهای آن مستعد Hallucinations هستند که این موضوع می تواند عملکرد سیستم رانندگی رو به خطر بندازه برای همین توی این مقاله امد ن از پرادایم RLبا راهنمایی LLM استفاده کردن به این معنی حتی اگر خروجیهای LLM ناپایدار باشند، عامل RL میتواند با یادگیری سیاست خود، اشارات معنایی نادرست احتمالی را جبران کند و از تولید مستقیم اقدامات نامعقول جلوگیری نماید.
اطلاع بیشتر👇
https://arxiv.org/pdf/2505.15793
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
⚡1
🚀 ریپازیتوری ارزشمند پر از پروژههای GenAI و AI Agents!
این ریپازیتوری شامل پروژهها و مثالهایی است که در کتگوریهای متنوع و با فریمورکهای مختلف پیادهسازی شدهاند و به راحتی قابل اجرا هستند.
💡 نمونههایی از ایجنتهای موجود:
دستیار مدیریت پروژه
دستیار تحلیل محتوا
عامل جستجوگر وب
دستیار خرید
و…
https://github.com/NirDiamant/GenAI_Agents?tab=readme-ov-file
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این ریپازیتوری شامل پروژهها و مثالهایی است که در کتگوریهای متنوع و با فریمورکهای مختلف پیادهسازی شدهاند و به راحتی قابل اجرا هستند.
💡 نمونههایی از ایجنتهای موجود:
دستیار مدیریت پروژه
دستیار تحلیل محتوا
عامل جستجوگر وب
دستیار خرید
و…
https://github.com/NirDiamant/GenAI_Agents?tab=readme-ov-file
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
👌1
فرقی نمیکنه LLM شما چقدر باهوش باشه…
📌 کلید موفقیت در دادههایی هست که داخل Context Window میذارید!
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
📌 کلید موفقیت در دادههایی هست که داخل Context Window میذارید!
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
👏3👍2
اولین مدل Vision Language ساختهشده روی OpenAI GPT-OSS منتشر شد! 🎉
این مدل جدید با نام InternVL 3.5 معرفی شده و کلی قابلیت خفن داره:
🔹 همراه با ۳۲ مدل مختلف (هم pretrain شده، هم fine-tune).
🔹 در بخش LLM از gpt-oss یا Qwen3 استفاده میکنه.
🔹 اندازهی مدلها از ۱ میلیارد تا ۲۴۱ میلیارد پارامتر متغیر هست.
HuggingFace: https://huggingface.co/collections/OpenGVLab/internvl35-68ac87bd52ebe953485927fb
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این مدل جدید با نام InternVL 3.5 معرفی شده و کلی قابلیت خفن داره:
🔹 همراه با ۳۲ مدل مختلف (هم pretrain شده، هم fine-tune).
🔹 در بخش LLM از gpt-oss یا Qwen3 استفاده میکنه.
🔹 اندازهی مدلها از ۱ میلیارد تا ۲۴۱ میلیارد پارامتر متغیر هست.
HuggingFace: https://huggingface.co/collections/OpenGVLab/internvl35-68ac87bd52ebe953485927fb
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
👍1🔥1
MIRAGE: Scaling Test-Time Inference
with Parallel Graph-Retrieval-Augmented Reasoning Chains
روش های موجود مانند search-o1 که با تقویت بازیابی در RAGها انجام میشوند اما به زنجیرهی استدلال خطی و واحد متکی هستند و اطلاعات متنی غیرساختاریافته را بهصورت تخت و بدون در نظر گرفتن زمینه وارد میکنند که نتیجه این کار ها باعث انباشه شدن خطا در طول زنجیرهی استدلال میشود که این روش توی پرش و پاسخ های پزشکی محدود میکنه (Medical QA) که برای حل این چالش آمدن MIRAGE معرفی کردن که پرسش ها رو به چند تا زیر پرسش های مبتی بر موجودیت تقسیم میکنه و زنجیره های استدلال رو به صورت موازی اجرا میکنه و میاد بازیابی لازم رو از طریق گسترش همسایگی و پیمایش چندمرحلهای انجام میده و در آخر پاسخ ها را با اعتبارسنجی میانزنجیرهای ادغام کرده و تناقضها را برطرف میسازد.
اطلاع بیشتر👇
https://arxiv.org/pdf/2508.18260
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
with Parallel Graph-Retrieval-Augmented Reasoning Chains
روش های موجود مانند search-o1 که با تقویت بازیابی در RAGها انجام میشوند اما به زنجیرهی استدلال خطی و واحد متکی هستند و اطلاعات متنی غیرساختاریافته را بهصورت تخت و بدون در نظر گرفتن زمینه وارد میکنند که نتیجه این کار ها باعث انباشه شدن خطا در طول زنجیرهی استدلال میشود که این روش توی پرش و پاسخ های پزشکی محدود میکنه (Medical QA) که برای حل این چالش آمدن MIRAGE معرفی کردن که پرسش ها رو به چند تا زیر پرسش های مبتی بر موجودیت تقسیم میکنه و زنجیره های استدلال رو به صورت موازی اجرا میکنه و میاد بازیابی لازم رو از طریق گسترش همسایگی و پیمایش چندمرحلهای انجام میده و در آخر پاسخ ها را با اعتبارسنجی میانزنجیرهای ادغام کرده و تناقضها را برطرف میسازد.
اطلاع بیشتر👇
https://arxiv.org/pdf/2508.18260
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
📂 یه ریپازیتوری فوقالعاده در گیتهاب منتشر شده که کل مسیر طراحی یک سیستم یادگیری ماشین (ML) رو پوشش میده.
این ریپو شامل چهار گام اصلیه:
- Project setup
- Data pipeline
- Modeling: selecting, training, and debugging
- Serving: testing, deploying, and maintaining
https://github.com/chiphuyen/machine-learning-systems-design
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این ریپو شامل چهار گام اصلیه:
- Project setup
- Data pipeline
- Modeling: selecting, training, and debugging
- Serving: testing, deploying, and maintaining
https://github.com/chiphuyen/machine-learning-systems-design
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🙏2💯1
چطور میتوان در زبان برنامهنویسی Malbolge عبارت «Hello world» را نوشت؟
زبان Malbolge بهعنوان یکی از سختترین زبانها برای برنامهنویسی شناخته میشود. نوشتن حتی سادهترین برنامهها در این زبان بهشدت دشوار است. اولین برنامهی «Hello World» در Malbolge تنها با کمک یک الگوریتم کامپیوتری ساخته شد، چراکه نوشتن آن بهصورت دستی عملاً غیرممکن است.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
زبان Malbolge بهعنوان یکی از سختترین زبانها برای برنامهنویسی شناخته میشود. نوشتن حتی سادهترین برنامهها در این زبان بهشدت دشوار است. اولین برنامهی «Hello World» در Malbolge تنها با کمک یک الگوریتم کامپیوتری ساخته شد، چراکه نوشتن آن بهصورت دستی عملاً غیرممکن است.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🤔6👨💻2
دوره آموزشی «LLM Zoomcamp»
توی این دوره آمده به کابردهای واقعی LLMها پرداخته و اینکه یاد میگیری که چه طوری یک سیستم هوش مصنوعی بسازی و برای افرادی که هیچ پیشزمینهای در زمینه هوش مصنوعی یا یادگیری ماشین ندارند، مناسب می باشد.
https://www.youtube.com/playlist?list=PL3MmuxUbc_hIB4fSqLy_0AfTjVLpgjV3R
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
توی این دوره آمده به کابردهای واقعی LLMها پرداخته و اینکه یاد میگیری که چه طوری یک سیستم هوش مصنوعی بسازی و برای افرادی که هیچ پیشزمینهای در زمینه هوش مصنوعی یا یادگیری ماشین ندارند، مناسب می باشد.
https://www.youtube.com/playlist?list=PL3MmuxUbc_hIB4fSqLy_0AfTjVLpgjV3R
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🙏2⚡1👌1
توی این ریپازیتوری میتونی PageIndex رو ببینی: سیستمی که مثل یه کارشناس واقعی، فکر و استدلال میکنه تا مرتبطترین بخشهای اسناد طولانی رو پیدا کنه. 🔍
دو مرحله ساده داره:
1️⃣ ساخت فهرست درختی از سند
2️⃣ جستجوی هوشمند و منطقی توی درخت
https://github.com/VectifyAI/PageIndex?tab=readme-ov-file
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
دو مرحله ساده داره:
1️⃣ ساخت فهرست درختی از سند
2️⃣ جستجوی هوشمند و منطقی توی درخت
https://github.com/VectifyAI/PageIndex?tab=readme-ov-file
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🚀 اگه قصد دارین AI Agent درست کنین، حتما این دوتا تکنولوژی رو یاد بگیرین:
✨ ۱- Google ADK
یک فریمورک فوقالعاده قدرتمند برای ساختن ایجنتها که الان به سرعت داره توی صنعت فراگیر میشه.
✨ ۲- Agent2Agent (A2A) Protocol
پروتکلی برای ارتباط ایجنتها با همدیگه.
📌 نکته مهم اینه که خود ریپوهای رسمی این ابزارها پر از مثالهای عالی هستن و میتونین خیلی سریع و عملی باهاشون کار یاد بگیرین.
-A2A: https://github.com/a2aproject/A2A
- ADK: https://google.github.io/adk-docs/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
✨ ۱- Google ADK
یک فریمورک فوقالعاده قدرتمند برای ساختن ایجنتها که الان به سرعت داره توی صنعت فراگیر میشه.
✨ ۲- Agent2Agent (A2A) Protocol
پروتکلی برای ارتباط ایجنتها با همدیگه.
📌 نکته مهم اینه که خود ریپوهای رسمی این ابزارها پر از مثالهای عالی هستن و میتونین خیلی سریع و عملی باهاشون کار یاد بگیرین.
-A2A: https://github.com/a2aproject/A2A
- ADK: https://google.github.io/adk-docs/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
GitHub
GitHub - a2aproject/A2A: An open protocol enabling communication and interoperability between opaque agentic applications.
An open protocol enabling communication and interoperability between opaque agentic applications. - a2aproject/A2A
📂 توی ریپازیتوری زیر، همهی لینکهای منابع رایگان برای یادگیری Machine Learning رو جمعآوری شده🚀
https://github.com/victor-explore/Machine-Learning-Library
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
https://github.com/victor-explore/Machine-Learning-Library
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
👍3⚡1
شرکت Hugging Face ابزاری متنباز به نام AI Sheets ارائه کرده که به شما امکان میدهد بدون نیاز به کدنویسی، دیتاستها را بسازید، ویرایش کنید یا غنیسازی کنید. این ابزار هم روی سیستم شخصی قابل اجراست و هم روی Hugging Face Hub. به این ترتیب میتوانید به هزاران مدل موجود در Hub دسترسی داشته باشید؛ چه از طریق Inference Providers و چه مدلهای لوکال، حتی شامل مدلهای gpt-oss از OpenAI.
https://github.com/huggingface/aisheets
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
https://github.com/huggingface/aisheets
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
شرکت چینی Moonshot AI قابلیتی جدید به Kimi اضافه کرده به نام PPT Assistant. با این ابزار میتوانید تنها با وارد کردن یک متن ساده یا حتی فایلهای PDF و Word، بلافاصله یک پاورپوینت حرفهای و آماده ارائه بسازید. نکته جذاب اینکه این قابلیت بهطور کامل از زبان فارسی پشتیبانی میکند و کاملاً رایگان است؛ بدون هیچ محدودیتی.
https://www.kimi.com/kimiplus/cvvm7bkheutnihqi2100
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
https://www.kimi.com/kimiplus/cvvm7bkheutnihqi2100
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
⚡4
MIT: Machine Learning for Computational Biology
این دوره MIT قراره نشون بده چطور میشه با کمک هوش مصنوعی و یادگیری ماشین، دنیای زیستشناسی رو از ژنوم و پروتئین گرفته تا درمانها و دادههای بیماران، عمیقتر درک کرد. موضوعاتی مثل مدلهای زبانی ژنوم و پروتئین، AlphaFold2، اپیژنومیک، کشف دارو با AI و تحلیل دادههای پزشکی رو پوشش میده. به زبان ساده، پلیه بین علم داده و زیستشناسی برای کشفهای مهم در سلامت و داروسازی.
Fall'24 Lecture Videos: http://tinyurl.com/MLCBlectures
Fall'24 Lecture Notes: http://tinyurl.com/MLCB24notes
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این دوره MIT قراره نشون بده چطور میشه با کمک هوش مصنوعی و یادگیری ماشین، دنیای زیستشناسی رو از ژنوم و پروتئین گرفته تا درمانها و دادههای بیماران، عمیقتر درک کرد. موضوعاتی مثل مدلهای زبانی ژنوم و پروتئین، AlphaFold2، اپیژنومیک، کشف دارو با AI و تحلیل دادههای پزشکی رو پوشش میده. به زبان ساده، پلیه بین علم داده و زیستشناسی برای کشفهای مهم در سلامت و داروسازی.
Fall'24 Lecture Videos: http://tinyurl.com/MLCBlectures
Fall'24 Lecture Notes: http://tinyurl.com/MLCB24notes
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🙏3
یه پکیج اومده که میگه میشه سیستم RAG مقیاسپذیر و با بهرهوری بالا ساخت، کاملاً لوکال و رایگان!
https://github.com/yichuan-w/LEANN
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
https://github.com/yichuan-w/LEANN
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🚀 چرا Momentum تو بهینهسازی انقدر موثره؟
اگه دوست داری بفهمی چرا الگوریتمهای Momentum و Gradient Descent انقدر سریع و هوشمند عمل میکنن و چطور با مفهوم “eigenfeatures” و تحلیل منحنی خطا به سرعت به جواب میرسن، این سایت یه منبع عالیه:
https://distill.pub/2017/momentum/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
اگه دوست داری بفهمی چرا الگوریتمهای Momentum و Gradient Descent انقدر سریع و هوشمند عمل میکنن و چطور با مفهوم “eigenfeatures” و تحلیل منحنی خطا به سرعت به جواب میرسن، این سایت یه منبع عالیه:
https://distill.pub/2017/momentum/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
👏3
📌 معرفی ریپازیتوری جذاب:
https://github.com/aishwaryanr/awesome-generative-ai-guide
این ریپازیتوری مثل یک مرکز جامع برای منابع GenAI عمل میکنه و پر از آپدیتهای تازه در مورد:
🔹 مقالات جدید حوزه Generative AI
🔹 منابع مصاحبه و سوالات رایج
🔹 نوتبوکها و ریپازیتوریهای کدنویسی
🔹 دورههای رایگان (بیش از ۹۰ دوره مختلف)
🔹 نقشهراههای یادگیری (RAG، LLM Foundations، Agents و …)
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
https://github.com/aishwaryanr/awesome-generative-ai-guide
این ریپازیتوری مثل یک مرکز جامع برای منابع GenAI عمل میکنه و پر از آپدیتهای تازه در مورد:
🔹 مقالات جدید حوزه Generative AI
🔹 منابع مصاحبه و سوالات رایج
🔹 نوتبوکها و ریپازیتوریهای کدنویسی
🔹 دورههای رایگان (بیش از ۹۰ دوره مختلف)
🔹 نقشهراههای یادگیری (RAG، LLM Foundations، Agents و …)
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
👏2