📌 معرفی مقاله DAPO
🔍 مقالهی جدید "DAPO: An Open‑Source LLM Reinforcement Learning System at Scale" توسط تیم ByteDance منتشر شده و یک چارچوب متنباز برای بهینهسازی مدلهای زبانی با RL ارائه میده.
✅ نکات برجسته:
معرفی الگوریتم DAPO با تکنیکهایی مثل Clip‑Higher و Token‑Level Policy Gradient
ارزیابی روی دیتاست چالشبرانگیز AIME 2024
کسب امتیاز ۵۰ با مدل Qwen‑2.5‑32B، جلوتر از DeepSeek‑R1
انتشار کامل کد، داده و آموزش روی GitHub
https://arxiv.org/pdf/2503.14476
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔍 مقالهی جدید "DAPO: An Open‑Source LLM Reinforcement Learning System at Scale" توسط تیم ByteDance منتشر شده و یک چارچوب متنباز برای بهینهسازی مدلهای زبانی با RL ارائه میده.
✅ نکات برجسته:
معرفی الگوریتم DAPO با تکنیکهایی مثل Clip‑Higher و Token‑Level Policy Gradient
ارزیابی روی دیتاست چالشبرانگیز AIME 2024
کسب امتیاز ۵۰ با مدل Qwen‑2.5‑32B، جلوتر از DeepSeek‑R1
انتشار کامل کد، داده و آموزش روی GitHub
https://arxiv.org/pdf/2503.14476
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
یک دیتاست شعر فارسی منتشر کردن که شامل بیش از 80 هزار شعر از شاعران کلاسیک و معاصر هست.
برای آموزش مدلهای زبانی، تحلیل سبک شعر، یا پروژههای NLP فارسی میتونید ازش استفاده کنید.
https://www.kaggle.com/datasets/jigsaw13/persian-poem-dataset
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
برای آموزش مدلهای زبانی، تحلیل سبک شعر، یا پروژههای NLP فارسی میتونید ازش استفاده کنید.
https://www.kaggle.com/datasets/jigsaw13/persian-poem-dataset
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
👍8😍7
یک دوره کوتاه ولی جالب راجع Claude Code و اینکه چطور از code assistant استفاده کنید.
https://www.deeplearning.ai/short-courses/claude-code-a-highly-agentic-coding-assistant/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
https://www.deeplearning.ai/short-courses/claude-code-a-highly-agentic-coding-assistant/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این یک پلیلیست فوقالعاده و ضروری برای مبتدیان در حوزه مدلهای زبانی بزرگ (LLM) است! 🎯
📺 پلیلیست "Understanding Large Language Models" موضوعات پایهای و مهم زیر را پوشش میدهد:
1️⃣ What is temperature in LLM?
2️⃣ Pretraining Large Language Models: Everything You Need to Know!
3️⃣ How Attention Mechanism Works in Transformer Architecture
4️⃣ What Are Word Embeddings?
5️⃣ LLM Training Starts Here: Dataset Preparation & Tokenization Explained!
6️⃣ LLMs Like ChatGPT, Explained Visually – How Do They Really Work?
https://www.youtube.com/playlist?list=PLUfbC589u-FSwnqsvTHXVcgmLg8UnbIy3
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
📺 پلیلیست "Understanding Large Language Models" موضوعات پایهای و مهم زیر را پوشش میدهد:
1️⃣ What is temperature in LLM?
2️⃣ Pretraining Large Language Models: Everything You Need to Know!
3️⃣ How Attention Mechanism Works in Transformer Architecture
4️⃣ What Are Word Embeddings?
5️⃣ LLM Training Starts Here: Dataset Preparation & Tokenization Explained!
6️⃣ LLMs Like ChatGPT, Explained Visually – How Do They Really Work?
https://www.youtube.com/playlist?list=PLUfbC589u-FSwnqsvTHXVcgmLg8UnbIy3
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔥4
یک مدل جدید اومده برای پارس کردن داکیومنت و OCR.حدود ۱۰۰ زبان از جمله فارسی را هم پشتیبانی میکنه.
https://github.com/rednote-hilab/dots.ocr
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
https://github.com/rednote-hilab/dots.ocr
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔥1
تبدیل آسان فایلهای PDF به دادههای تمیز و آماده برای مدلهای زبانی! 🐬
فریمورک متنباز Dolphin ابزاری برای پردازش اسناد است که میتواند PDFها را به قالبهای ساختاریافتهای مانند Markdown، HTML، LaTeX و JSON تبدیل میکند.
https://github.com/bytedance/Dolphin
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
فریمورک متنباز Dolphin ابزاری برای پردازش اسناد است که میتواند PDFها را به قالبهای ساختاریافتهای مانند Markdown، HTML، LaTeX و JSON تبدیل میکند.
https://github.com/bytedance/Dolphin
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔥1
اگر دنبال استفاده از AI بخصوص مدلهای LLM و سیستم های ایجنتیک درموضوعات مالی مثل سرمایه گذاری، تحقیقات مالی، و تریدینگ هستید این چندتا مقاله را بخونید. کلی مطالب جالب و فریمورک های جالبی را پیشنهاد میده.
- TradingAgents: Multi-Agents LLM Financial Trading Framework
https://arxiv.org/pdf/2412.20138
- From Deep Learning to LLMs: A survey of AI in Quantitative
Investment
https://arxiv.org/pdf/2503.21422
- Enhancing Investment Analysis: Optimizing AI-Agent
Collaboration in Financial Research
https://arxiv.org/pdf/2411.04788
- Are Generative AI Agents Effective Personalized Financial
Advisors?
https://arxiv.org/pdf/2504.05862
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
- TradingAgents: Multi-Agents LLM Financial Trading Framework
https://arxiv.org/pdf/2412.20138
- From Deep Learning to LLMs: A survey of AI in Quantitative
Investment
https://arxiv.org/pdf/2503.21422
- Enhancing Investment Analysis: Optimizing AI-Agent
Collaboration in Financial Research
https://arxiv.org/pdf/2411.04788
- Are Generative AI Agents Effective Personalized Financial
Advisors?
https://arxiv.org/pdf/2504.05862
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔥2
«این واقعاً جعبهابزار مهندس هوش مصنوعی است که به آن نیاز دارید:
فهرستی از بیش از ۱۲۰ کتابخانه و فریمورک، دستهبندیشده براساس کاربرد. وقتی پروژهی جدیدی آغاز میکنید (مثل آموزش مدل، ساخت عاملهای هوشمند، RAG و غیره)، میتوانید بهسادگی فهرست را بررسی کنید و مطمئن شوید که دارید از بهترین گزینه استفاده میکنید.»
https://github.com/KalyanKS-NLP/llm-engineer-toolkit
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
فهرستی از بیش از ۱۲۰ کتابخانه و فریمورک، دستهبندیشده براساس کاربرد. وقتی پروژهی جدیدی آغاز میکنید (مثل آموزش مدل، ساخت عاملهای هوشمند، RAG و غیره)، میتوانید بهسادگی فهرست را بررسی کنید و مطمئن شوید که دارید از بهترین گزینه استفاده میکنید.»
https://github.com/KalyanKS-NLP/llm-engineer-toolkit
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
📚 دوره دادهساختارها و الگوریتمها از MIT 🎓
یک دوره جامع و معتبر از دانشگاه MIT که مفاهیم پایه و پیشرفته دادهساختارها و الگوریتمها را به زبانی ساده و کاربردی آموزش میدهد.
Introduction to Algorithms
https://ocw.mit.edu/courses/6-006-introduction-to-algorithms-spring-2020/
Design and Analysis of Algorithms
https://ocw.mit.edu/courses/6-046j-design-and-analysis-of-algorithms-spring-2015/
#الگوریتم
📣👨💻 @AlgorithmDesign_DataStructuer
یک دوره جامع و معتبر از دانشگاه MIT که مفاهیم پایه و پیشرفته دادهساختارها و الگوریتمها را به زبانی ساده و کاربردی آموزش میدهد.
Introduction to Algorithms
https://ocw.mit.edu/courses/6-006-introduction-to-algorithms-spring-2020/
Design and Analysis of Algorithms
https://ocw.mit.edu/courses/6-046j-design-and-analysis-of-algorithms-spring-2015/
#الگوریتم
📣👨💻 @AlgorithmDesign_DataStructuer
👌1💯1
برای تسلط واقعی بر مدلهای زبانی بزرگ (LLM)، ایجنتها و سیستمهای هوش مصنوعی، یکی از بهترین نقطههای شروع، پلتفرم Hugging Face است.
1. LLM Course
https://huggingface.co/learn/llm-course/chapter1/1
2. Agents Course
https://huggingface.co/learn/agents-course/unit0/introduction
3. Deep RL Course
https://huggingface.co/learn/deep-rl-course/unit0/introduction
4. Computer Vision Course
https://huggingface.co/learn/computer-vision-course/unit0/welcome/welcome
5. Audio Course
https://huggingface.co/learn/audio-course/chapter0/introduction
6. ML for Games Course
https://huggingface.co/learn/ml-games-course/unit0/introduction
7. ML for 3D Course
https://huggingface.co/learn/ml-for-3d-course/unit0/introduction
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
1. LLM Course
https://huggingface.co/learn/llm-course/chapter1/1
2. Agents Course
https://huggingface.co/learn/agents-course/unit0/introduction
3. Deep RL Course
https://huggingface.co/learn/deep-rl-course/unit0/introduction
4. Computer Vision Course
https://huggingface.co/learn/computer-vision-course/unit0/welcome/welcome
5. Audio Course
https://huggingface.co/learn/audio-course/chapter0/introduction
6. ML for Games Course
https://huggingface.co/learn/ml-games-course/unit0/introduction
7. ML for 3D Course
https://huggingface.co/learn/ml-for-3d-course/unit0/introduction
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
👍1🙏1
هوش مصنوعی: مفاهیم و تکنیکها
این دوره آموزشی که توسط یکی از استادان مؤسسه علوم هند (IISC) در بنگلور ارائه میشود، در نهایت حدود ۶۰ ویدئو خواهد داشت... که از مباحث ریاضی تا موضوعات پیشرفته هوش مصنوعی را پوشش میدهد.
https://www.youtube.com/playlist?list=PLgMDNELGJ1CZSGn478v1uKbzxJzKWZ7zs
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این دوره آموزشی که توسط یکی از استادان مؤسسه علوم هند (IISC) در بنگلور ارائه میشود، در نهایت حدود ۶۰ ویدئو خواهد داشت... که از مباحث ریاضی تا موضوعات پیشرفته هوش مصنوعی را پوشش میدهد.
https://www.youtube.com/playlist?list=PLgMDNELGJ1CZSGn478v1uKbzxJzKWZ7zs
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🙏1
مایکروسافت بهترین دوره آموزش هوش مصنوعی مولد را منتشر کرد!
این دوره رایگان شامل ۲۱ درس است که در گیتهاب در دسترس قرار دارد و تمام چیزهایی را که برای شروع ساخت برنامههای هوش مصنوعی مولد لازم دارید، به شما آموزش میدهد.
https://github.com/microsoft/generative-ai-for-beginners
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این دوره رایگان شامل ۲۱ درس است که در گیتهاب در دسترس قرار دارد و تمام چیزهایی را که برای شروع ساخت برنامههای هوش مصنوعی مولد لازم دارید، به شما آموزش میدهد.
https://github.com/microsoft/generative-ai-for-beginners
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🙏1👌1
📌 معرفی یک کتابخانهی پایتونی برای پردازش داده با LLMهای عاملمحور 🤖📄
🔹در واقع DocETL یک کتابخانهی پایتونی قدرتمند است که امکان ساخت و اجرای پایپلاینهای پردازش داده را فراهم میکند.
✨ این ابزار بهویژه برای وظایف پیچیدهی پردازش اسناد طراحی شده و میتواند فرایندهای چندمرحلهای را بهشکل هوشمند و خودکار انجام دهد.
🚀 اگر با دادههای متنی یا اسناد حجیم کار میکنید، DocETL میتواند دستیار توانمندی برای شما باشد.
https://github.com/ucbepic/docetl
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔹در واقع DocETL یک کتابخانهی پایتونی قدرتمند است که امکان ساخت و اجرای پایپلاینهای پردازش داده را فراهم میکند.
✨ این ابزار بهویژه برای وظایف پیچیدهی پردازش اسناد طراحی شده و میتواند فرایندهای چندمرحلهای را بهشکل هوشمند و خودکار انجام دهد.
🚀 اگر با دادههای متنی یا اسناد حجیم کار میکنید، DocETL میتواند دستیار توانمندی برای شما باشد.
https://github.com/ucbepic/docetl
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
👌1
🚀 پایان سلطهی الگوریتم دیکسترا؟! 🤯
الگوریتم دیکسترا سالها بهعنوان یک روش استاندارد برای پیدا کردن کوتاهترین مسیر شناخته میشد. این الگوریتم با شروع از یک نقطهی مبدا و گسترش تدریجی به نقاط دیگر، مسیر بهینه را پیدا میکند.
اما یکی از محدودیتهای بزرگ آن، نیاز به مرتبسازی مداوم نقاط برای انتخاب نزدیکترین گره است؛ فرآیندی که میتواند سرعت اجرای آن را کاهش دهد. ⏳
🔬 حالا محققان الگوریتم جدیدی معرفی کردهاند که بدون نیاز به مرتبسازی، کوتاهترین مسیرها را محاسبه میکند. نتیجه؟
✅ سرعت بیشتر 🚀
✅ حذف گلوگاه مرتبسازی 🔄
✅ عملکرد بهتر در شبکههای بزرگ 🌐
به نظر میرسد با این پیشرفت، الگوریتم دیکسترا دیگر همیشه بهینهترین انتخاب نخواهد بود! 📉
مقاله کامل :
arxiv.org/pdf/2504.17033
#الگوریتم
📣👨💻 @AlgorithmDesign_DataStructuer
الگوریتم دیکسترا سالها بهعنوان یک روش استاندارد برای پیدا کردن کوتاهترین مسیر شناخته میشد. این الگوریتم با شروع از یک نقطهی مبدا و گسترش تدریجی به نقاط دیگر، مسیر بهینه را پیدا میکند.
اما یکی از محدودیتهای بزرگ آن، نیاز به مرتبسازی مداوم نقاط برای انتخاب نزدیکترین گره است؛ فرآیندی که میتواند سرعت اجرای آن را کاهش دهد. ⏳
🔬 حالا محققان الگوریتم جدیدی معرفی کردهاند که بدون نیاز به مرتبسازی، کوتاهترین مسیرها را محاسبه میکند. نتیجه؟
✅ سرعت بیشتر 🚀
✅ حذف گلوگاه مرتبسازی 🔄
✅ عملکرد بهتر در شبکههای بزرگ 🌐
به نظر میرسد با این پیشرفت، الگوریتم دیکسترا دیگر همیشه بهینهترین انتخاب نخواهد بود! 📉
مقاله کامل :
arxiv.org/pdf/2504.17033
#الگوریتم
📣👨💻 @AlgorithmDesign_DataStructuer
🔥7
✨ ریاضی فقط دربارهی اعداد نیست، بلکه دربارهی کشف الگوهای پیچیده در دنیای اطراف ماست.
👨💻 مفاهیم ریاضی میتوانند فراتر از کلاسهای درس، کاربردهای جالب و گستردهای در برنامهنویسی داشته باشند.
📘 در این راهنما، Tiago به بررسی «معماری ریاضی» میپردازد و توضیح میدهد که چگونه میتوان از آن در کدنویسی استفاده کرد.
https://www.freecodecamp.org/news/the-architecture-of-mathematics-and-how-developers-can-use-it-in-code/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
👨💻 مفاهیم ریاضی میتوانند فراتر از کلاسهای درس، کاربردهای جالب و گستردهای در برنامهنویسی داشته باشند.
📘 در این راهنما، Tiago به بررسی «معماری ریاضی» میپردازد و توضیح میدهد که چگونه میتوان از آن در کدنویسی استفاده کرد.
https://www.freecodecamp.org/news/the-architecture-of-mathematics-and-how-developers-can-use-it-in-code/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
👍1
اگه تا حالا وقت نکردید RAG یاد بگیرید، این دوره جدید DeepLearning AI میتونه یه انتخاب عالی باشه
https://www.deeplearning.ai/courses/retrieval-augmented-generation-rag/?utm_campaign=rag-launch&utm_medium=social&utm_source=dlai-sm
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
https://www.deeplearning.ai/courses/retrieval-augmented-generation-rag/?utm_campaign=rag-launch&utm_medium=social&utm_source=dlai-sm
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🚀 RAG-Anything:
یک RAG همهکاره و کاملاً متنباز روی گرافها!
🔹در واقع RAG-Anything یک سیستم گرافمحور برای RAG چندموداله است که روی LightRAG اجرا میشود.
این ابزار برای مدیریت اسناد طراحی شده و تمام انواع محتوا (متنی، تصویری، جدولی، فرمول ریاضی و ... ) را در یک ساختار یکپارچه پشتیبانی میکند.
✨ ویژگیها:
📄 پشتیبانی از همهی مدالیتهها در یک ساختار واحد
⚡️ پردازش منعطف: MinerU-based parsing یا ورودی مستقیم چندموداله
🖼 پردازش اختصاصی برای تصاویر، جداول، معادلات ریاضی و محتوای ناهمگن
🔍 جستجوی پیشرفته با درک متنی و چندموداله
🤖 شناسایی و دستهبندی خودکار محتوا و هدایت آن به کانالهای پردازشی بهینه
📌 اگه دنبال یک RAG قدرتمند و یکپارچه هستی، این پروژه ارزش امتحان کردن رو داره!
https://github.com/HKUDS/RAG-Anything
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
یک RAG همهکاره و کاملاً متنباز روی گرافها!
🔹در واقع RAG-Anything یک سیستم گرافمحور برای RAG چندموداله است که روی LightRAG اجرا میشود.
این ابزار برای مدیریت اسناد طراحی شده و تمام انواع محتوا (متنی، تصویری، جدولی، فرمول ریاضی و ... ) را در یک ساختار یکپارچه پشتیبانی میکند.
✨ ویژگیها:
📄 پشتیبانی از همهی مدالیتهها در یک ساختار واحد
⚡️ پردازش منعطف: MinerU-based parsing یا ورودی مستقیم چندموداله
🖼 پردازش اختصاصی برای تصاویر، جداول، معادلات ریاضی و محتوای ناهمگن
🔍 جستجوی پیشرفته با درک متنی و چندموداله
🤖 شناسایی و دستهبندی خودکار محتوا و هدایت آن به کانالهای پردازشی بهینه
📌 اگه دنبال یک RAG قدرتمند و یکپارچه هستی، این پروژه ارزش امتحان کردن رو داره!
https://github.com/HKUDS/RAG-Anything
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔥1
📝 GraphRAG-R1
توی مقالات قبلی برای بازیابی روی گرافها از روشهای هیورستیک از پیش تعریفشده استفاده میشد، که دقت و کارایی رو محدود میکرد.
🔹 اما این مقاله برای اولین بار با بهکارگیری Reinforcement Learning (RL) تونسته این محدودیت رو برطرف کنه و فرآیند بازیابی رو هوشمند و بهینهتر بسازه.
https://arxiv.org/pdf/2507.23581
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
توی مقالات قبلی برای بازیابی روی گرافها از روشهای هیورستیک از پیش تعریفشده استفاده میشد، که دقت و کارایی رو محدود میکرد.
🔹 اما این مقاله برای اولین بار با بهکارگیری Reinforcement Learning (RL) تونسته این محدودیت رو برطرف کنه و فرآیند بازیابی رو هوشمند و بهینهتر بسازه.
https://arxiv.org/pdf/2507.23581
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
📘 Reinforcement Learning from Human Feedback (RLHF) – Short Book
این یه introduction کوتاه دربارهی RLHF و post-training روی language models هست.
https://rlhfbook.com/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این یه introduction کوتاه دربارهی RLHF و post-training روی language models هست.
https://rlhfbook.com/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
مقالهای از علوم پزشکی کاشان با 426 سایتیشن ریترکت شد. بس کن دیتاسازی رو هموطن!
https://pubpeer.com/publications/FF831BF73E8D00ABF9004B8BC4B2BD
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
https://pubpeer.com/publications/FF831BF73E8D00ABF9004B8BC4B2BD
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🤣9