Transformers 2: Self-adaptive LLMs
نسل دوم مدلهای ترانسفورمر (Transformers 2 با ویژگی (Self-adaptive) طراحی شدهاند تا بتوانند عملکرد خود را در شرایط مختلف بهینه کنند. این مدلها از معماری بهبودیافتهای استفاده میکنند که قابلیت تغییر پارامترها و مقیاسپذیری را بر اساس پیچیدگی وظایف دارد. خودتنظیمی در این مدلها، امکان یادگیری بهتر از دادههای متنوع و ارائه پاسخهای دقیقتر در زمان واقعی را فراهم میکند.
Paper: https://arxiv.org/pdf/2501.06252v2.pdf
Code:
https://github.com/SakanaAI/self-adaptive-llms
https://github.com/codelion/adaptive-classifier
Datasets: GSM8K - HumanEval - MATH
MBPP - TextVQA - OK-VQA - ARC (AI2 Reasoning Challenge)
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
نسل دوم مدلهای ترانسفورمر (Transformers 2 با ویژگی (Self-adaptive) طراحی شدهاند تا بتوانند عملکرد خود را در شرایط مختلف بهینه کنند. این مدلها از معماری بهبودیافتهای استفاده میکنند که قابلیت تغییر پارامترها و مقیاسپذیری را بر اساس پیچیدگی وظایف دارد. خودتنظیمی در این مدلها، امکان یادگیری بهتر از دادههای متنوع و ارائه پاسخهای دقیقتر در زمان واقعی را فراهم میکند.
Paper: https://arxiv.org/pdf/2501.06252v2.pdf
Code:
https://github.com/SakanaAI/self-adaptive-llms
https://github.com/codelion/adaptive-classifier
Datasets: GSM8K - HumanEval - MATH
MBPP - TextVQA - OK-VQA - ARC (AI2 Reasoning Challenge)
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
ML, DL, AND AI Cheat Sheet.pdf
7.5 MB
تمام Cheat Sheetهای کاربردی در حوزههای یادگیری ماشین، یادگیری عمیق و هوش مصنوعی را یکجا در این مجموعه گردآوری شده است. 📚💡
اگر به دنبال مرجع سریع و جامع برای مفاهیم کلیدی این حوزهها هستید، این مجموعه مناسب شماست.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
اگر به دنبال مرجع سریع و جامع برای مفاهیم کلیدی این حوزهها هستید، این مجموعه مناسب شماست.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
DeepseekAI 🐋
مدل Janus-Pro منتشر شد! این نسخهی پیشرفته از Janus بهبود چشمگیری در درک چندوجهی (Multimodal Understanding) و تولید محتوای بصری دارد.
✨ برتری در رقابت تصویرسازی:
مدل Janus-Pro-7B موفق شد در رتبهبندی مربوط به تولید تصویر از متن**، مدلهای مطرحی مانند **DALL·E 3 از OpenAI و Stable Diffusion از Stability AI را پشت سر بگذارد!
🔍 DeepseekAI با این پیشرفت، گامی مهم در مسیر توسعه مدلهای هوش مصنوعی چندوجهی برداشته است.
https://github.com/deepseek-ai/Janus/blob/main/janus_pro_tech_report.pdf
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
مدل Janus-Pro منتشر شد! این نسخهی پیشرفته از Janus بهبود چشمگیری در درک چندوجهی (Multimodal Understanding) و تولید محتوای بصری دارد.
✨ برتری در رقابت تصویرسازی:
مدل Janus-Pro-7B موفق شد در رتبهبندی مربوط به تولید تصویر از متن**، مدلهای مطرحی مانند **DALL·E 3 از OpenAI و Stable Diffusion از Stability AI را پشت سر بگذارد!
🔍 DeepseekAI با این پیشرفت، گامی مهم در مسیر توسعه مدلهای هوش مصنوعی چندوجهی برداشته است.
https://github.com/deepseek-ai/Janus/blob/main/janus_pro_tech_report.pdf
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
Fast Think-on-Graph: Wider, Deeper and Faster Reasoning of Large Language Model on Knowledge Graph
Github: https://github.com/dosonleung/fasttog
Paper: https://arxiv.org/abs/2501.14300v1
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
Github: https://github.com/dosonleung/fasttog
Paper: https://arxiv.org/abs/2501.14300v1
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
مقالهی DeepSeek-R1: ارتقای توانایی استدلال در مدلهای زبانی بزرگ با یادگیری تقویتی که توسط تیم #DeepSeek ارائه شده، بازتاب گستردهای در جامعهی هوش مصنوعی داشته است. 🔥🤖
این پژوهش بر بهبود قابلیت استدلال مدلهای زبانی بزرگ (LLMs) از طریق یادگیری تقویتی تمرکز دارد. نویسندگان در این کار، چارچوبی نوآورانه به نام DeepSeek-R1 معرفی کردهاند که با ایجاد مشوقهایی برای فرآیندهای منطقی در حین آموزش، به افزایش تواناییهای استدلالی LLMها کمک میکند. این روش، مدلهای زبانی را از صرفاً پردازش متن فراتر برده و آنها را قادر میسازد تا روشهای استدلالی پیچیدهتری را توسعه دهند، که این امر میتواند عملکردشان را در طیف وسیعی از کاربردهای پیشرفته بهبود ببخشد. 🚀📚
این رویکرد، بحثهای فراوانی را در میان پژوهشگران و متخصصان برانگیخته، اما بیشک دریچهای تازه به سوی پیشرفتهای آینده در این حوزه گشوده است. 🌟🔍
Paper:https://arxiv.org/abs/2501.12948
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این پژوهش بر بهبود قابلیت استدلال مدلهای زبانی بزرگ (LLMs) از طریق یادگیری تقویتی تمرکز دارد. نویسندگان در این کار، چارچوبی نوآورانه به نام DeepSeek-R1 معرفی کردهاند که با ایجاد مشوقهایی برای فرآیندهای منطقی در حین آموزش، به افزایش تواناییهای استدلالی LLMها کمک میکند. این روش، مدلهای زبانی را از صرفاً پردازش متن فراتر برده و آنها را قادر میسازد تا روشهای استدلالی پیچیدهتری را توسعه دهند، که این امر میتواند عملکردشان را در طیف وسیعی از کاربردهای پیشرفته بهبود ببخشد. 🚀📚
این رویکرد، بحثهای فراوانی را در میان پژوهشگران و متخصصان برانگیخته، اما بیشک دریچهای تازه به سوی پیشرفتهای آینده در این حوزه گشوده است. 🌟🔍
Paper:https://arxiv.org/abs/2501.12948
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🎞 Machine Learning with Graphs: design space of graph neural networks
💥Free recorded course by Prof. Jure Leskovec
📢 بررسی جامع طراحی معماری GNN با GraphGym 🧠📊
در این مقاله، یک بررسی سیستماتیک از طراحی معماری GNN ارائه شده است که شامل سه جنبه کلیدی میشود:
✅ فضای طراحی GNN: شامل طراحی درونلایهای، بینلایهای و تنظیمات یادگیری.
✅ فضای وظایف GNN: همراه با معیارهای شباهت برای انتقال بهترین مدلها بین وظایف مختلف.
✅ روش ارزیابی مؤثر GNN: برای پاسخ به سؤالات مهم طراحی، مانند تأثیر BatchNorm در GNNها.
💡 همچنین، GraphGym بهعنوان یک پلتفرم کدنویسی معرفی شده است که طراحی معماری GNN را سادهتر میکند.
Design Space for Graph Neural Networks
📽 Watch
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
💥Free recorded course by Prof. Jure Leskovec
📢 بررسی جامع طراحی معماری GNN با GraphGym 🧠📊
در این مقاله، یک بررسی سیستماتیک از طراحی معماری GNN ارائه شده است که شامل سه جنبه کلیدی میشود:
✅ فضای طراحی GNN: شامل طراحی درونلایهای، بینلایهای و تنظیمات یادگیری.
✅ فضای وظایف GNN: همراه با معیارهای شباهت برای انتقال بهترین مدلها بین وظایف مختلف.
✅ روش ارزیابی مؤثر GNN: برای پاسخ به سؤالات مهم طراحی، مانند تأثیر BatchNorm در GNNها.
💡 همچنین، GraphGym بهعنوان یک پلتفرم کدنویسی معرفی شده است که طراحی معماری GNN را سادهتر میکند.
Design Space for Graph Neural Networks
📽 Watch
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
arXiv.org
Design Space for Graph Neural Networks
The rapid evolution of Graph Neural Networks (GNNs) has led to a growing number of new architectures as well as novel applications. However, current research focuses on proposing and evaluating...
🤖 عامل هوش مصنوعی (AI Agent) چیست؟
یک عامل هوش مصنوعی (AI Agent) نرمافزاری است که میتواند با محیط خود تعامل داشته باشد، دادهها را جمعآوری کند و از آنها برای دستیابی به اهداف از پیش تعیینشده استفاده کند. این عامل قادر است بهترین اقدامات ممکن را برای رسیدن به این اهداف انتخاب کند.
ویژگیهای کلیدی عوامل هوش مصنوعی:
✅ عملکرد خودکار: یک عامل میتواند بدون نیاز به دخالت مداوم انسان اقدامات خود را انجام دهد. البته، در برخی موارد میتواند دارای یک حلقه انسانی (Human in the Loop) باشد تا کنترل حفظ شود.
✅ حافظه و دانش: عامل میتواند ترجیحات فردی را ذخیره کرده و شخصیسازی انجام دهد. همچنین، میتواند دانش را ذخیره کرده و پردازش اطلاعات و تصمیمگیری را بر عهده بگیرد. مدلهای زبانی بزرگ (LLM) نیز میتوانند این وظایف را انجام دهند.
✅ درک و پردازش اطلاعات محیطی: عامل باید بتواند اطلاعات موجود در محیط خود را دریافت و پردازش کند.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
یک عامل هوش مصنوعی (AI Agent) نرمافزاری است که میتواند با محیط خود تعامل داشته باشد، دادهها را جمعآوری کند و از آنها برای دستیابی به اهداف از پیش تعیینشده استفاده کند. این عامل قادر است بهترین اقدامات ممکن را برای رسیدن به این اهداف انتخاب کند.
ویژگیهای کلیدی عوامل هوش مصنوعی:
✅ عملکرد خودکار: یک عامل میتواند بدون نیاز به دخالت مداوم انسان اقدامات خود را انجام دهد. البته، در برخی موارد میتواند دارای یک حلقه انسانی (Human in the Loop) باشد تا کنترل حفظ شود.
✅ حافظه و دانش: عامل میتواند ترجیحات فردی را ذخیره کرده و شخصیسازی انجام دهد. همچنین، میتواند دانش را ذخیره کرده و پردازش اطلاعات و تصمیمگیری را بر عهده بگیرد. مدلهای زبانی بزرگ (LLM) نیز میتوانند این وظایف را انجام دهند.
✅ درک و پردازش اطلاعات محیطی: عامل باید بتواند اطلاعات موجود در محیط خود را دریافت و پردازش کند.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
Mathematics_for_Machine_Learning .pdf
1.4 MB
📌 ریاضیات برای یادگیری ماشین
درک عمیق ریاضیات، کلید یادگیری ماشین و علوم داده است. این کتاب مفاهیم پایهای مانند جبر خطی، آمار و حساب دیفرانسیل را پوشش میدهد و مسیر ورود به دنیای هوش مصنوعی را هموار میکند.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
درک عمیق ریاضیات، کلید یادگیری ماشین و علوم داده است. این کتاب مفاهیم پایهای مانند جبر خطی، آمار و حساب دیفرانسیل را پوشش میدهد و مسیر ورود به دنیای هوش مصنوعی را هموار میکند.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
💡 یک پکیج فوقالعاده برای یادگیری علوم داده و یادگیری ماشین!
👩🏻💻 اگر به دنبال منابع جامع و کاربردی در زمینه علوم داده و یادگیری ماشین هستید، این مخزن GitHub هر چیزی که نیاز دارید را یکجا جمع کرده است!
📌 چه چیزهایی در این مجموعه پیدا میکنید؟
✅ برگههای تقلب کاربردی – نکات کلیدی و مهم، همه در یکجا برای دسترسی سریع.
📚 کتابهای ارزشمند – منابعی که وقت گذاشتن روی آنها واقعا مفید است.
❓ سوالات متداول – مباحثی که معمولا مطرح میشوند و دانستن آنها میتواند درک عمیقتری به شما بدهد.
🚀 پروژههای عملی – ایدههایی که میتوانید به عنوان پروژههای شخصی استفاده کنید و مهارتهای خود را تقویت کنید.
🎯 در یک کلام: یک مجموعه کامل و منظم برای یادگیری و تقویت مهارتهایتان در علوم داده، بدون سردرگمی!
🔗 لینک مخزن را اینجا ببینید: 👇
https://github.com/khanhnamle1994/cracking-the-data-science-interview?tab=readme-ov-file
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
👩🏻💻 اگر به دنبال منابع جامع و کاربردی در زمینه علوم داده و یادگیری ماشین هستید، این مخزن GitHub هر چیزی که نیاز دارید را یکجا جمع کرده است!
📌 چه چیزهایی در این مجموعه پیدا میکنید؟
✅ برگههای تقلب کاربردی – نکات کلیدی و مهم، همه در یکجا برای دسترسی سریع.
📚 کتابهای ارزشمند – منابعی که وقت گذاشتن روی آنها واقعا مفید است.
❓ سوالات متداول – مباحثی که معمولا مطرح میشوند و دانستن آنها میتواند درک عمیقتری به شما بدهد.
🚀 پروژههای عملی – ایدههایی که میتوانید به عنوان پروژههای شخصی استفاده کنید و مهارتهای خود را تقویت کنید.
🎯 در یک کلام: یک مجموعه کامل و منظم برای یادگیری و تقویت مهارتهایتان در علوم داده، بدون سردرگمی!
🔗 لینک مخزن را اینجا ببینید: 👇
https://github.com/khanhnamle1994/cracking-the-data-science-interview?tab=readme-ov-file
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
GitHub
GitHub - khanhnamle1994/cracking-the-data-science-interview: A Collection of Cheatsheets, Books, Questions, and Portfolio For DS/ML…
A Collection of Cheatsheets, Books, Questions, and Portfolio For DS/ML Interview Prep - khanhnamle1994/cracking-the-data-science-interview
⚠️ انتشارات O'Reilly Media، یکی از معتبرترین ناشران در حوزههای برنامهنویسی، دادهکاوی و هوش مصنوعی، ۱۰ کتاب ارزشمند در زمینه علم داده را به صورت رایگان در اختیار علاقهمندان قرار داده است.
✔️ برای دسترسی به نسخههای آنلاین و PDF این کتابها، میتوانید از لینکهای زیر استفاده کنید: 👇
Python Data Science Handbook
┌ Online
└ PDF
Python for Data Analysis book
┌ Online
└ PDF
Fundamentals of Data Visualization book
┌ Online
└ PDF
R for Data Science book
┌ Online
└ PDF
Deep Learning for Coders book
┌ Online
└ PDF
DS at the Command Line book
┌ Online
└ PDF
Hands-On Data Visualization Book
┌ Online
└ PDF
Think Stats book
┌ Online
└ PDF
Think Bayes book
┌ Online
└ PDF
Kafka, The Definitive Guide
┌ Online
└ PDF
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
✔️ برای دسترسی به نسخههای آنلاین و PDF این کتابها، میتوانید از لینکهای زیر استفاده کنید: 👇
Python Data Science Handbook
┌ Online
Python for Data Analysis book
┌ Online
Fundamentals of Data Visualization book
┌ Online
R for Data Science book
┌ Online
Deep Learning for Coders book
┌ Online
DS at the Command Line book
┌ Online
Hands-On Data Visualization Book
┌ Online
Think Stats book
┌ Online
Think Bayes book
┌ Online
Kafka, The Definitive Guide
┌ Online
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
Parameter-Inverted Image Pyramid Networks for Visual Perception and Multimodal Understanding
Github: https://github.com/opengvlab/piip
Paper: https://arxiv.org/abs/2501.07783v1
Dataset: https://paperswithcode.com/dataset/gqa
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
Github: https://github.com/opengvlab/piip
Paper: https://arxiv.org/abs/2501.07783v1
Dataset: https://paperswithcode.com/dataset/gqa
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
مدل زبانی «هرمز با ۸ میلیارد پارامتر» آمد.
این مدل، یک مدل زبانی کوچک (زیر ۱۳ بیلیون پارامتر) محسوب میشه که بر اساس Command R و روی دیتاستهایی که «مانی میرزایی» عزیز در «پلتفرم ماکس» زحمت ساختش رو کشیده بود ترین شده. کل پروسه ترین حدود ۴۰۰۰ دلار و ۵۰ ساعت طول کشیده.
اطلاعات بیشتر شامل روش اجرا و بنچمارکها:
https://github.com/mann-e/hormoz
و دسترسی به مدل:
https://huggingface.co/mann-e/Hormoz-8B
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این مدل، یک مدل زبانی کوچک (زیر ۱۳ بیلیون پارامتر) محسوب میشه که بر اساس Command R و روی دیتاستهایی که «مانی میرزایی» عزیز در «پلتفرم ماکس» زحمت ساختش رو کشیده بود ترین شده. کل پروسه ترین حدود ۴۰۰۰ دلار و ۵۰ ساعت طول کشیده.
اطلاعات بیشتر شامل روش اجرا و بنچمارکها:
https://github.com/mann-e/hormoz
و دسترسی به مدل:
https://huggingface.co/mann-e/Hormoz-8B
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
آموزش ویدیویی "Dive into LLMs like ChatGPT" از آندری کارپاتی شامل موضوعات زیر است:
- pretraining data (internet)
- tokenization
- neural network I/O
- neural network internals
- inference
- training and inference
...
https://www.youtube.com/watch?v=7xTGNNLPyMI
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
- pretraining data (internet)
- tokenization
- neural network I/O
- neural network internals
- inference
- training and inference
...
https://www.youtube.com/watch?v=7xTGNNLPyMI
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
Demystifying Long Chain-of-Thought Reasoning in LLMs
paper:https://arxiv.org/abs/2502.03373
code :https://github.com/eddycmu/demystify-long-cot
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
paper:https://arxiv.org/abs/2502.03373
code :https://github.com/eddycmu/demystify-long-cot
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🌟 به دنیای Transformers و Self-Attention وارد شوید با یکی از بهترین گنجینههای پنهان یوتیوب! 🧠✨ هیچکس مثل پروفسور Bryce مفاهیم پیچیدهی هوش مصنوعی را توضیح نمیدهد – اشتیاق او به تدریس و تعهدش به وضوح مطالب، هر درس را فراموشنشدنی میکند. 💡📚
فرقی ندارد که یک علاقهمند به AI باشید، دانشجوی Machine Learning، یا صرفاً کنجکاو درباره فناوریهای پیشرفته، این ویدئو یک must-watch واقعی است! 🎥 آماده شوید تا درک خود را از Transformers به جذابترین شکل ممکن ارتقا دهید! 🚀
🔗 https://youtu.be/e9-0BxyKG10?si=EGCMhIn0xaBdrjtf
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
فرقی ندارد که یک علاقهمند به AI باشید، دانشجوی Machine Learning، یا صرفاً کنجکاو درباره فناوریهای پیشرفته، این ویدئو یک must-watch واقعی است! 🎥 آماده شوید تا درک خود را از Transformers به جذابترین شکل ممکن ارتقا دهید! 🚀
🔗 https://youtu.be/e9-0BxyKG10?si=EGCMhIn0xaBdrjtf
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer