دوره رایگان Harvard CS50 – دوره علوم کامپیوتر (نسخه 2023)
این دوره شامل موارد زیر است:
- Lecture 0 - Scratch
- Lecture 1 - C
- Lecture 2 - Arrays
- Lecture 3 - Algorithms
- Lecture 4 - Memory
- Lecture 5 - Data Structures
- Lecture 6 - Python
- Lecture 7 - SQL
- Lecture 8 - HTML, CSS, JavaScript
- Lecture 9 - Flask
- Lecture 10 - Emoji
- Cybersecurity (امنیت سایبری)
https://www.freecodecamp.org/news/harvard-university-cs50-computer-science-course-2023/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این دوره شامل موارد زیر است:
- Lecture 0 - Scratch
- Lecture 1 - C
- Lecture 2 - Arrays
- Lecture 3 - Algorithms
- Lecture 4 - Memory
- Lecture 5 - Data Structures
- Lecture 6 - Python
- Lecture 7 - SQL
- Lecture 8 - HTML, CSS, JavaScript
- Lecture 9 - Flask
- Lecture 10 - Emoji
- Cybersecurity (امنیت سایبری)
https://www.freecodecamp.org/news/harvard-university-cs50-computer-science-course-2023/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
برای استفاده راحتتر از ChatGPT، شما میتوانید آن را مستقیماً روی دسکتاپ خود نصب کنید. این کار به شما این امکان را میدهد که بدون نیاز به مرورگر، بهراحتی به ChatGPT دسترسی داشته باشید و از امکانات آن بهرهمند شوید.
Link: ChatGPT on your desktop
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
Link: ChatGPT on your desktop
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
Probability Theory.pdf
5.1 MB
جزوههای درسی استنفورد درباره "نظریه احتمالات" (سطح دکتری)
#الگوریتم
📣👨💻 @AlgorithmDesign_DataStructuer
#الگوریتم
📣👨💻 @AlgorithmDesign_DataStructuer
۱۰ کتاب برتر برای یادگیری ماشین
اگر به دنبال منابعی عالی برای شروع یا پیشرفت در یادگیری ماشین هستید، این لیست شامل ۱۰ کتاب برتر در این زمینه میتواند به شما کمک کند:
1️⃣ Machine Learning نوشتهی *Tom M. Mitchell*
این کتاب یکی از پایهایترین و معتبرترین منابع برای یادگیری اصول یادگیری ماشین است و مباحث را به صورت جامع و قابل درک ارائه میدهد.
2️⃣ Pattern Recognition and Machine Learning نوشتهی *Christopher M. Bishop*
یک منبع پیشرفته که به شناسایی الگوها و مبانی یادگیری ماشین میپردازد، مناسب برای علاقهمندان به تئوریهای عمیقتر.
3️⃣ The Hundred-Page Machine Learning Book نوشتهی *Andriy Burkov*
یک کتاب جمعوجور و کاربردی که مفاهیم اصلی یادگیری ماشین را تنها در ۱۰۰ صفحه توضیح میدهد.
4️⃣ Machine Learning For Absolute Beginners نوشتهی *Oliver Theobald*
این کتاب، یادگیری ماشین را برای مبتدیان از صفر و با زبانی ساده توضیح میدهد و برای شروعی آسان بسیار مفید است.
5️⃣ Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow نوشتهی *Geron Aurelien*
یکی از محبوبترین منابع برای یادگیری عملی یادگیری ماشین با استفاده از کتابخانههای مطرح مانند Scikit-Learn، Keras و TensorFlow.
6️⃣ Fundamentals of Machine Learning for Predictive Data Analytics نوشتهی *John D. Kelleher, Brian Mac Namee, و Aoife D’Arcy*
این کتاب تمرکز خاصی بر تجزیهوتحلیل دادهها و پیشبینی دارد و به شما کمک میکند اصول پایهای این حوزه را بیاموزید.
7️⃣ Machine Learning for Humans نوشتهی *Vishal Maini و Samer Sabri*
یک منبع رایگان و جذاب که مفاهیم یادگیری ماشین را به زبان ساده و داستانی توضیح میدهد.
8️⃣ Introduction to Machine Learning with Python: A Guide for Data Scientists نوشتهی *Andreas Müller*
این کتاب، راهنمایی جامع برای استفاده از زبان پایتون در پروژههای یادگیری ماشین است.
9️⃣ Advanced Machine Learning with Python نوشتهی *John Hearty*
برای کسانی که میخواهند دانش خود را در یادگیری ماشین و پایتون به سطح پیشرفتهتری برسانند، این کتاب انتخاب مناسبی است.
🔟 Machine Learning With TensorFlow نوشتهی *Nishant Shukla*
این کتاب به آموزش یادگیری ماشین با استفاده از فریمورک قدرتمند TensorFlow میپردازد و برای علاقهمندان به کار با شبکههای عصبی بسیار مفید است.
هر یک از این کتابها میتواند شما را در مسیر یادگیری ماشین به خوبی هدایت کند، بسته به اینکه تازهکار هستید یا به دنبال گسترش دانش پیشرفته خود هستید! 📚✨
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
اگر به دنبال منابعی عالی برای شروع یا پیشرفت در یادگیری ماشین هستید، این لیست شامل ۱۰ کتاب برتر در این زمینه میتواند به شما کمک کند:
1️⃣ Machine Learning نوشتهی *Tom M. Mitchell*
این کتاب یکی از پایهایترین و معتبرترین منابع برای یادگیری اصول یادگیری ماشین است و مباحث را به صورت جامع و قابل درک ارائه میدهد.
2️⃣ Pattern Recognition and Machine Learning نوشتهی *Christopher M. Bishop*
یک منبع پیشرفته که به شناسایی الگوها و مبانی یادگیری ماشین میپردازد، مناسب برای علاقهمندان به تئوریهای عمیقتر.
3️⃣ The Hundred-Page Machine Learning Book نوشتهی *Andriy Burkov*
یک کتاب جمعوجور و کاربردی که مفاهیم اصلی یادگیری ماشین را تنها در ۱۰۰ صفحه توضیح میدهد.
4️⃣ Machine Learning For Absolute Beginners نوشتهی *Oliver Theobald*
این کتاب، یادگیری ماشین را برای مبتدیان از صفر و با زبانی ساده توضیح میدهد و برای شروعی آسان بسیار مفید است.
5️⃣ Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow نوشتهی *Geron Aurelien*
یکی از محبوبترین منابع برای یادگیری عملی یادگیری ماشین با استفاده از کتابخانههای مطرح مانند Scikit-Learn، Keras و TensorFlow.
6️⃣ Fundamentals of Machine Learning for Predictive Data Analytics نوشتهی *John D. Kelleher, Brian Mac Namee, و Aoife D’Arcy*
این کتاب تمرکز خاصی بر تجزیهوتحلیل دادهها و پیشبینی دارد و به شما کمک میکند اصول پایهای این حوزه را بیاموزید.
7️⃣ Machine Learning for Humans نوشتهی *Vishal Maini و Samer Sabri*
یک منبع رایگان و جذاب که مفاهیم یادگیری ماشین را به زبان ساده و داستانی توضیح میدهد.
8️⃣ Introduction to Machine Learning with Python: A Guide for Data Scientists نوشتهی *Andreas Müller*
این کتاب، راهنمایی جامع برای استفاده از زبان پایتون در پروژههای یادگیری ماشین است.
9️⃣ Advanced Machine Learning with Python نوشتهی *John Hearty*
برای کسانی که میخواهند دانش خود را در یادگیری ماشین و پایتون به سطح پیشرفتهتری برسانند، این کتاب انتخاب مناسبی است.
🔟 Machine Learning With TensorFlow نوشتهی *Nishant Shukla*
این کتاب به آموزش یادگیری ماشین با استفاده از فریمورک قدرتمند TensorFlow میپردازد و برای علاقهمندان به کار با شبکههای عصبی بسیار مفید است.
هر یک از این کتابها میتواند شما را در مسیر یادگیری ماشین به خوبی هدایت کند، بسته به اینکه تازهکار هستید یا به دنبال گسترش دانش پیشرفته خود هستید! 📚✨
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
💡 خداحافظ Adam، سلام ADOPT!
به نظر میرسه وقتش رسیده که بهینهساز (Optimizer) مدلهای Deep Learning و LLMها رو ارتقا بدیم! ✨
بهینه ساز ADOPT بهعنوان جایگزینی برای Adam معرفی شده و تونسته یکی از مشکلات اساسی Adam، یعنی عدم تضمین همگرایی (Convergence) در آپدیت وزنها رو حل کنه.
🔬 این برتری فقط یک ادعای تئوری نیست؛ بلکه در عمل هم در اکثر مسائل، از جمله pretraining مدل GPT-2، عملکرد بهتری داشته است.
💡 ایده اصلی و راهکار ADOPT برای تضمین همگرایی:
1️⃣ حذف گرادیان کنونی از تخمین momentum دوم
2️⃣ نرمالسازی گرادیان پیش از آپدیت momentum
به کمک این بهینهساز، فرآیند یادگیری مدلها نهتنها پایدارتر بلکه کارآمدتر شده است. 🚀
Paper : https://arxiv.org/abs/2411.02853
code : https://github.com/iShohei220/adopt
به نظر میرسه وقتش رسیده که بهینهساز (Optimizer) مدلهای Deep Learning و LLMها رو ارتقا بدیم! ✨
بهینه ساز ADOPT بهعنوان جایگزینی برای Adam معرفی شده و تونسته یکی از مشکلات اساسی Adam، یعنی عدم تضمین همگرایی (Convergence) در آپدیت وزنها رو حل کنه.
🔬 این برتری فقط یک ادعای تئوری نیست؛ بلکه در عمل هم در اکثر مسائل، از جمله pretraining مدل GPT-2، عملکرد بهتری داشته است.
💡 ایده اصلی و راهکار ADOPT برای تضمین همگرایی:
1️⃣ حذف گرادیان کنونی از تخمین momentum دوم
2️⃣ نرمالسازی گرادیان پیش از آپدیت momentum
به کمک این بهینهساز، فرآیند یادگیری مدلها نهتنها پایدارتر بلکه کارآمدتر شده است. 🚀
Paper : https://arxiv.org/abs/2411.02853
code : https://github.com/iShohei220/adopt
arXiv.org
ADOPT: Modified Adam Can Converge with Any $β_2$ with the Optimal Rate
Adam is one of the most popular optimization algorithms in deep learning. However, it is known that Adam does not converge in theory unless choosing a hyperparameter, i.e., $β_2$, in a...
مقاله "Visualization-of-Thought Elicits Spatial Reasoning in Large Language Models" به بررسی روشی نوین برای بهبود توانایی مدلهای زبانی بزرگ (LLMs) در انجام استدلال فضایی میپردازد. ایده اصلی این تحقیق بر اساس استفاده از تصویرسازی ذهنی است؛ به این معنا که مدلها به جای پردازش صرفاً متنی، قادر به ایجاد بازنماییهای بصری از مسائل میشوند. این بازنماییها به مدل کمک میکند تا مفاهیمی نظیر فاصله، جهت و ارتباطات فضایی را بهتر درک و تحلیل کند.
Paper:https://arxiv.org/abs/2404.03622
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
Paper:https://arxiv.org/abs/2404.03622
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
اگر به یادگیری MLOps، راهاندازی مدلها در محیط تولیدی و طراحی سیستمهای یادگیری ماشین از صفر تا صد علاقهمند هستید اما نمیدانید از کجا شروع کنید، پیشنهاد میکنم نگاهی به دوره CS 329S: Machine Learning Systems Design بیندازید.
این دوره یکی از جامعترین منابع آموزشی در این حوزه است و مباحثی از اصول طراحی سیستمهای یادگیری ماشین گرفته تا نکات پیشرفته را پوشش میدهد.
یکی از جذابترین ویژگیهای این دوره، حضور سرمایهگذاران مطرح (VCs) در جلسات پایانی آن است، جایی که درباره ارائه ایدهها و استراتژیهای ورود به بازار صحبت میشود. این نشان میدهد که اگر در طراحی سیستمهای یادگیری ماشین حرفهای شوید، احتمالاً قدم در مسیر ساخت یک استارتاپ خواهید گذاشت!
این دوره از دانشگاه استنفورد است و همانطور که انتظار میرود، جامعیت فوقالعادهای دارد. این فرصت را از دست ندهید! 🚀
the link to the course : https://stanford-cs329s.github.io/syllabus.html
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این دوره یکی از جامعترین منابع آموزشی در این حوزه است و مباحثی از اصول طراحی سیستمهای یادگیری ماشین گرفته تا نکات پیشرفته را پوشش میدهد.
یکی از جذابترین ویژگیهای این دوره، حضور سرمایهگذاران مطرح (VCs) در جلسات پایانی آن است، جایی که درباره ارائه ایدهها و استراتژیهای ورود به بازار صحبت میشود. این نشان میدهد که اگر در طراحی سیستمهای یادگیری ماشین حرفهای شوید، احتمالاً قدم در مسیر ساخت یک استارتاپ خواهید گذاشت!
این دوره از دانشگاه استنفورد است و همانطور که انتظار میرود، جامعیت فوقالعادهای دارد. این فرصت را از دست ندهید! 🚀
the link to the course : https://stanford-cs329s.github.io/syllabus.html
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
دوره آموزشی LLM Agents MOOC
این دوره موضوعات زیر را پوشش میدهد:
- Foundation of LLMs
- Reasoning
- Planning, tool use
- LLM agent infrastructure
- Retrieval-augmented generation
- Code generation, data science
- Multimodal agents, robotics
- Evaluation and benchmarking on agent applications
- Privacy, safety and ethics
- Human-agent interaction, personalization, alignment
- Multi-agent collaboration
این دوره برای کسانی که علاقهمند به یادگیری عمیق در زمینه طراحی و توسعه عوامل هوشمند مبتنی بر LLM هستند، بسیار مفید است. 🚀
Link:https://www.youtube.com/playlist?list=PLS01nW3RtgopsNLeM936V4TNSsvvVglLc
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این دوره موضوعات زیر را پوشش میدهد:
- Foundation of LLMs
- Reasoning
- Planning, tool use
- LLM agent infrastructure
- Retrieval-augmented generation
- Code generation, data science
- Multimodal agents, robotics
- Evaluation and benchmarking on agent applications
- Privacy, safety and ethics
- Human-agent interaction, personalization, alignment
- Multi-agent collaboration
این دوره برای کسانی که علاقهمند به یادگیری عمیق در زمینه طراحی و توسعه عوامل هوشمند مبتنی بر LLM هستند، بسیار مفید است. 🚀
Link:https://www.youtube.com/playlist?list=PLS01nW3RtgopsNLeM936V4TNSsvvVglLc
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
آیا به GenAI/LLMs علاقه دارید؟
🔥🔥 444 دیتاست آماده! 🔥🔥
774.5 ترابایت │ 8 زبان │ 32 حوزه
Pre-training ❋ Fine-tuning ❋ Evaluation
تشکر ویژه از Yang Liu و همکارانش! 🙏
✨ این مجموعه بزرگ برای پروژههای یادگیری زبانهای مدل بزرگ بینظیر است. 🌐
Paper : https://arxiv.org/abs/2402.18041
Github:https://github.com/lmmlzn/Awesome-LLMs-Datasets
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔥🔥 444 دیتاست آماده! 🔥🔥
774.5 ترابایت │ 8 زبان │ 32 حوزه
Pre-training ❋ Fine-tuning ❋ Evaluation
تشکر ویژه از Yang Liu و همکارانش! 🙏
✨ این مجموعه بزرگ برای پروژههای یادگیری زبانهای مدل بزرگ بینظیر است. 🌐
Paper : https://arxiv.org/abs/2402.18041
Github:https://github.com/lmmlzn/Awesome-LLMs-Datasets
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
معرفی دوره
دورهای در سطح کارشناسی درباره ساختمان داده، مبتنی بر زبان برنامهنویسی ++C، تدریسشده توسط پروفسور *Yung Yi* از دانشگاه *KAIST*، کره جنوبی. فرصتی برای یادگیری برنامهنویسی شیءگرا (++C) و آشنایی با الگوریتمهای پایهای.
Link:https://yung-web.github.io/home/courses/datastructure.html
#الگوریتم
📣👨💻 @AlgorithmDesign_DataStructuer
دورهای در سطح کارشناسی درباره ساختمان داده، مبتنی بر زبان برنامهنویسی ++C، تدریسشده توسط پروفسور *Yung Yi* از دانشگاه *KAIST*، کره جنوبی. فرصتی برای یادگیری برنامهنویسی شیءگرا (++C) و آشنایی با الگوریتمهای پایهای.
Link:https://yung-web.github.io/home/courses/datastructure.html
#الگوریتم
📣👨💻 @AlgorithmDesign_DataStructuer
🎉 کانال ما به 6k عضو رسید! 🎉
ممنون از همراهی و حمایتهای شما عزیزان 🌟
منتظر محتوای جذابتر باشید! 🚀
ممنون از همراهی و حمایتهای شما عزیزان 🌟
منتظر محتوای جذابتر باشید! 🚀
🔹 یه ابزار فوقالعاده برای عاشقان چیتشیت! 🔹
اگه دوست داری یه ابزار حرفهای برای تولید چیتشیت داشته باشی، این ابزار مخصوص خودته! 🌟
کافیه یه پرامپت ورودی بهش بدی، مثل: "یه چیتشیت برای پردازش زبان طبیعی (NLP) درست کن."🔍
✨ این ابزار برات یه خلاصه کامل از NLP آماده میکنه، و جالبتر اینکه خروجیهاش میتونن شامل چارتها، نمودارها و تصاویر کاربردی باشن! 📊🖼
🔗 اگه به دنبال ابزارهای خفن برای یادگیری و تولید محتوای سریع هستی، پیشنهاد میکنم حتما امتحانش کنی!
👇 شما هم اگه ابزار جذابی میشناسید، معرفی کنید! 💬
Link : https://www.mymap.ai/cheat-sheet-maker
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
اگه دوست داری یه ابزار حرفهای برای تولید چیتشیت داشته باشی، این ابزار مخصوص خودته! 🌟
کافیه یه پرامپت ورودی بهش بدی، مثل: "یه چیتشیت برای پردازش زبان طبیعی (NLP) درست کن."🔍
✨ این ابزار برات یه خلاصه کامل از NLP آماده میکنه، و جالبتر اینکه خروجیهاش میتونن شامل چارتها، نمودارها و تصاویر کاربردی باشن! 📊🖼
🔗 اگه به دنبال ابزارهای خفن برای یادگیری و تولید محتوای سریع هستی، پیشنهاد میکنم حتما امتحانش کنی!
👇 شما هم اگه ابزار جذابی میشناسید، معرفی کنید! 💬
Link : https://www.mymap.ai/cheat-sheet-maker
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
𝐔𝐧𝐯𝐞𝐢𝐥𝐢𝐧𝐠_𝐭𝐡𝐞_𝟐𝟓_𝐓𝐲𝐩𝐞𝐬_𝐨𝐟_𝐑𝐀𝐆.pdf
2.7 MB
📚 آشنایی با ۲۵ نوع مختلف از RAG
🔍 به دنیای نوآوریهای RAG عمیقتر نگاه کنید!
درک جزئیات Retrieval-Augmented Generation (RAG) برای فعالان حوزه هوش مصنوعی بسیار اهمیت دارد. 💡
چه در حال بهینهسازی مدلهای زبانی بزرگ (LLMs) برای پرسشهای بلادرنگ باشید یا در تلاش برای پیشبرد مرزهای بازیابی تطبیقی، این راهنمای جامع، نوشتهشده توسط Bhavishya Pandit، ۲۵ نوع منحصر به فرد RAG را با اهداف و کاربردهای مختلف توضیح میدهد.
✨ از دقت اصلاحی **Corrective RAG 🔧 تا هوش تطبیقی Auto RAG 🤖، این راهکارها برای هر چالشی، راهحلی دارند.
نکات برجسته:
1. Speculative RAG:
افزایش بهرهوری با پیشنویسهای موازی ⚡️
2. Graph RAG:
ایجاد گرافهای دانش پویا برای بازیابی هوشمندتر 🕸
3. Iterative RAG:
جستجوهای دقیقتر با یادگیری تقویتی 🔄
چه در حال توسعه هوش مصنوعی مکالمهای نسل بعد باشید یا سیستمهای تولید محتوا را بهینه کنید، این چارچوبها تحولی در کار شما ایجاد خواهند کرد! 🌟
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🔍 به دنیای نوآوریهای RAG عمیقتر نگاه کنید!
درک جزئیات Retrieval-Augmented Generation (RAG) برای فعالان حوزه هوش مصنوعی بسیار اهمیت دارد. 💡
چه در حال بهینهسازی مدلهای زبانی بزرگ (LLMs) برای پرسشهای بلادرنگ باشید یا در تلاش برای پیشبرد مرزهای بازیابی تطبیقی، این راهنمای جامع، نوشتهشده توسط Bhavishya Pandit، ۲۵ نوع منحصر به فرد RAG را با اهداف و کاربردهای مختلف توضیح میدهد.
✨ از دقت اصلاحی **Corrective RAG 🔧 تا هوش تطبیقی Auto RAG 🤖، این راهکارها برای هر چالشی، راهحلی دارند.
نکات برجسته:
1. Speculative RAG:
افزایش بهرهوری با پیشنویسهای موازی ⚡️
2. Graph RAG:
ایجاد گرافهای دانش پویا برای بازیابی هوشمندتر 🕸
3. Iterative RAG:
جستجوهای دقیقتر با یادگیری تقویتی 🔄
چه در حال توسعه هوش مصنوعی مکالمهای نسل بعد باشید یا سیستمهای تولید محتوا را بهینه کنید، این چارچوبها تحولی در کار شما ایجاد خواهند کرد! 🌟
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
🎯 ارتقای تواناییهای پاسخدهی مدلهای زبانی بزرگ (LLMs)!
برای اینکه مدلهای زبانی بتونن بهترین پاسخها رو ارائه بدن، بهتره قبل از تولید جواب، اطلاعات رو از منابع خارجی مثل اینترنت یا فایلهای PDF جستجو کنیم. این فرایند که بهش RAG میگن، تأثیر زیادی روی عملکرد داره، اما اجرای درستش ساده نیست.
مراحل کلیدی در بازیابی اطلاعات از PDFها شامل این موارد میشه:
📄 اجرای OCR برای شناسایی متن در PDFهای اسکنشده
📐 استفاده از مدلهای تشخیص ساختار صفحه برای تفکیک پاراگرافها، عناوین و تصاویر
🔄 بازسازی ساختار و ترتیب خواندن صفحه
🖼 بهرهگیری از مدلهای پیشرفته برای توصیف تصاویر و جداول به زبان طبیعی
✂️ تقسیم یا ترکیب متن بهصورت منسجم و منطقی
🧠 استفاده از یک مدل تعبیه برداری قوی مثل BGE M3 برای نگاشت متن به فضای برداری معنادار
📂 ذخیرهسازی ایندکس برداری برای بازیابیهای آینده
اطلاع بیشتر:
https://huggingface.co/blog/manu/colpali
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
برای اینکه مدلهای زبانی بتونن بهترین پاسخها رو ارائه بدن، بهتره قبل از تولید جواب، اطلاعات رو از منابع خارجی مثل اینترنت یا فایلهای PDF جستجو کنیم. این فرایند که بهش RAG میگن، تأثیر زیادی روی عملکرد داره، اما اجرای درستش ساده نیست.
مراحل کلیدی در بازیابی اطلاعات از PDFها شامل این موارد میشه:
📄 اجرای OCR برای شناسایی متن در PDFهای اسکنشده
📐 استفاده از مدلهای تشخیص ساختار صفحه برای تفکیک پاراگرافها، عناوین و تصاویر
🔄 بازسازی ساختار و ترتیب خواندن صفحه
🖼 بهرهگیری از مدلهای پیشرفته برای توصیف تصاویر و جداول به زبان طبیعی
✂️ تقسیم یا ترکیب متن بهصورت منسجم و منطقی
🧠 استفاده از یک مدل تعبیه برداری قوی مثل BGE M3 برای نگاشت متن به فضای برداری معنادار
📂 ذخیرهسازی ایندکس برداری برای بازیابیهای آینده
اطلاع بیشتر:
https://huggingface.co/blog/manu/colpali
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
📚 Essential Data Science Concepts from 1 to 26
1. Algorithm
مجموعهای از قوانین یا دستورالعملها برای حل یک مسئله یا انجام یک وظیفه.
2. Big Data
مجموعه دادههای بسیار بزرگ و پیچیدهای که برنامههای پردازش داده سنتی نمیتوانند بهطور کارآمد مدیریت کنند.
3. Classification
یک نوع از وظایف یادگیری ماشین که شامل اختصاص برچسب به نمونهها بر اساس ویژگیهای آنها است.
4. Data Mining
فرایند کشف الگوها و استخراج اطلاعات مفید از مجموعه دادههای بزرگ.
5. Ensemble Learning
تکنیکی در یادگیری ماشین که چندین مدل را برای بهبود عملکرد پیشبینی ترکیب میکند.
6. Feature Engineering
فرایند انتخاب، استخراج و تبدیل ویژگیها از داده خام برای بهبود عملکرد مدل.
7. Gradient Descent
الگوریتم بهینهسازی برای کاهش خطای مدل با تنظیم تدریجی پارامترهای آن.
8. Hypothesis Testing
یک روش آماری برای نتیجهگیری درباره یک جامعه بر اساس دادههای نمونه.
9. Imputation
فرایند جایگزینی مقادیر گمشده در یک مجموعه داده با مقادیر تخمینی.
10. Joint Probability
احتمال وقوع همزمان دو یا چند رویداد.
11. K-Means Clustering
یک الگوریتم محبوب یادگیری ماشین بدون نظارت برای گروهبندی دادهها به خوشهها.
12. Logistic Regression
مدلی آماری که برای وظایف دستهبندی دودویی استفاده میشود.
13. Machine Learning
زیرمجموعهای از هوش مصنوعی که به سیستمها امکان یادگیری از دادهها و بهبود عملکرد را میدهد.
14. Neural Network
سیستمی کامپیوتری الهامگرفته از ساختار مغز انسان که برای وظایف مختلف یادگیری ماشین به کار میرود.
15. Outlier Detection
فرایند شناسایی مشاهداتی که بهطور قابلتوجهی از سایر نقاط داده فاصله دارند.
16. Precision and Recall
معیارهایی برای ارزیابی عملکرد مدلهای دستهبندی.
17. Quantitative Analysis
استفاده از روشهای ریاضی و آماری برای تحلیل و تفسیر دادهها.
18. Regression Analysis
تکنیکی آماری برای مدلسازی رابطه بین یک متغیر وابسته و یک یا چند متغیر مستقل.
19. Support Vector Machine
الگوریتمی نظارتشده در یادگیری ماشین برای وظایف دستهبندی و رگرسیون.
20. Time Series Analysis
مطالعه دادههای جمعآوریشده در طول زمان برای شناسایی الگوها، روندها و تغییرات فصلی.
21. Unsupervised Learning
تکنیکهایی در یادگیری ماشین برای شناسایی الگوها و روابط در دادههای بدون برچسب.
22. Validation
فرایند ارزیابی عملکرد و تعمیمپذیری مدل یادگیری ماشین با استفاده از مجموعه دادههای مستقل.
23. Weka
یک ابزار متنباز محبوب برای دادهکاوی و وظایف یادگیری ماشین.
24. XGBoost
پیادهسازی بهینهشدهای از تقویت گرادیان که بهطور گسترده برای وظایف دستهبندی و رگرسیون استفاده میشود.
25. Yarn
یک مدیر منابع در Apache Hadoop برای مدیریت منابع در خوشههای توزیعشده.
26. Zero-Inflated Model
یک مدل آماری برای تحلیل دادههایی با تعداد زیادی صفر، که اغلب در دادههای شمارشی مشاهده میشود.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
1. Algorithm
مجموعهای از قوانین یا دستورالعملها برای حل یک مسئله یا انجام یک وظیفه.
2. Big Data
مجموعه دادههای بسیار بزرگ و پیچیدهای که برنامههای پردازش داده سنتی نمیتوانند بهطور کارآمد مدیریت کنند.
3. Classification
یک نوع از وظایف یادگیری ماشین که شامل اختصاص برچسب به نمونهها بر اساس ویژگیهای آنها است.
4. Data Mining
فرایند کشف الگوها و استخراج اطلاعات مفید از مجموعه دادههای بزرگ.
5. Ensemble Learning
تکنیکی در یادگیری ماشین که چندین مدل را برای بهبود عملکرد پیشبینی ترکیب میکند.
6. Feature Engineering
فرایند انتخاب، استخراج و تبدیل ویژگیها از داده خام برای بهبود عملکرد مدل.
7. Gradient Descent
الگوریتم بهینهسازی برای کاهش خطای مدل با تنظیم تدریجی پارامترهای آن.
8. Hypothesis Testing
یک روش آماری برای نتیجهگیری درباره یک جامعه بر اساس دادههای نمونه.
9. Imputation
فرایند جایگزینی مقادیر گمشده در یک مجموعه داده با مقادیر تخمینی.
10. Joint Probability
احتمال وقوع همزمان دو یا چند رویداد.
11. K-Means Clustering
یک الگوریتم محبوب یادگیری ماشین بدون نظارت برای گروهبندی دادهها به خوشهها.
12. Logistic Regression
مدلی آماری که برای وظایف دستهبندی دودویی استفاده میشود.
13. Machine Learning
زیرمجموعهای از هوش مصنوعی که به سیستمها امکان یادگیری از دادهها و بهبود عملکرد را میدهد.
14. Neural Network
سیستمی کامپیوتری الهامگرفته از ساختار مغز انسان که برای وظایف مختلف یادگیری ماشین به کار میرود.
15. Outlier Detection
فرایند شناسایی مشاهداتی که بهطور قابلتوجهی از سایر نقاط داده فاصله دارند.
16. Precision and Recall
معیارهایی برای ارزیابی عملکرد مدلهای دستهبندی.
17. Quantitative Analysis
استفاده از روشهای ریاضی و آماری برای تحلیل و تفسیر دادهها.
18. Regression Analysis
تکنیکی آماری برای مدلسازی رابطه بین یک متغیر وابسته و یک یا چند متغیر مستقل.
19. Support Vector Machine
الگوریتمی نظارتشده در یادگیری ماشین برای وظایف دستهبندی و رگرسیون.
20. Time Series Analysis
مطالعه دادههای جمعآوریشده در طول زمان برای شناسایی الگوها، روندها و تغییرات فصلی.
21. Unsupervised Learning
تکنیکهایی در یادگیری ماشین برای شناسایی الگوها و روابط در دادههای بدون برچسب.
22. Validation
فرایند ارزیابی عملکرد و تعمیمپذیری مدل یادگیری ماشین با استفاده از مجموعه دادههای مستقل.
23. Weka
یک ابزار متنباز محبوب برای دادهکاوی و وظایف یادگیری ماشین.
24. XGBoost
پیادهسازی بهینهشدهای از تقویت گرادیان که بهطور گسترده برای وظایف دستهبندی و رگرسیون استفاده میشود.
25. Yarn
یک مدیر منابع در Apache Hadoop برای مدیریت منابع در خوشههای توزیعشده.
26. Zero-Inflated Model
یک مدل آماری برای تحلیل دادههایی با تعداد زیادی صفر، که اغلب در دادههای شمارشی مشاهده میشود.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
💡 معرفی Decision Transformer
مقاله "Decision Transformer: Reinforcement Learning via Sequence Modeling" یادگیری تقویتی را با معماری ترانسفورمر ترکیب میکند و آن را به مسئلهای مشابه مدلسازی دنباله تبدیل میکند. در این روش، حالات، اقدامات و پاداشها به صورت توالی نمایش داده میشوند و مدل ترانسفورمر با یادگیری از این دادهها، رفتار عامل را پیشبینی میکند. 🌟
🎯 مزایا:
- حذف نیاز به تابع ارزش یا سیاست صریح
- قابلیت یادگیری از دادههای متنوع
- استفاده از پتانسیل ترانسفورمرها در یادگیری تقویتی
این رویکرد در رباتیک، بازیها و مسائل یادگیری تقویتی پیچیده کاربردهای جذابی دارد. 🚀
Paper : https://arxiv.org/abs/2106.01345
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
مقاله "Decision Transformer: Reinforcement Learning via Sequence Modeling" یادگیری تقویتی را با معماری ترانسفورمر ترکیب میکند و آن را به مسئلهای مشابه مدلسازی دنباله تبدیل میکند. در این روش، حالات، اقدامات و پاداشها به صورت توالی نمایش داده میشوند و مدل ترانسفورمر با یادگیری از این دادهها، رفتار عامل را پیشبینی میکند. 🌟
🎯 مزایا:
- حذف نیاز به تابع ارزش یا سیاست صریح
- قابلیت یادگیری از دادههای متنوع
- استفاده از پتانسیل ترانسفورمرها در یادگیری تقویتی
این رویکرد در رباتیک، بازیها و مسائل یادگیری تقویتی پیچیده کاربردهای جذابی دارد. 🚀
Paper : https://arxiv.org/abs/2106.01345
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
💡 Prompt Engineering Techniques: Comprehensive Repository for Development and Implementation 🖋
این عنوان به منبعی کامل اشاره دارد که شامل تکنیکها و روشهای مختلف برای طراحی و بهینهسازی پرامپتها در تعامل با مدلهای زبانی هوش مصنوعی است. 🌟
🎯 هدف:
ایجاد پرامپتهایی که عملکرد و پاسخدهی مدلها را بهبود بخشیده و در کاربردهای مختلف قابل استفاده باشند.
✨ برای پژوهشگران و توسعهدهندگانی که به دنبال نوآوری در حوزه تعاملات هوش مصنوعی هستند، این مخزن یک ابزار بینظیر است. 🚀
Giyhub : https://github.com/NirDiamant/Prompt_Engineering
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
این عنوان به منبعی کامل اشاره دارد که شامل تکنیکها و روشهای مختلف برای طراحی و بهینهسازی پرامپتها در تعامل با مدلهای زبانی هوش مصنوعی است. 🌟
🎯 هدف:
ایجاد پرامپتهایی که عملکرد و پاسخدهی مدلها را بهبود بخشیده و در کاربردهای مختلف قابل استفاده باشند.
✨ برای پژوهشگران و توسعهدهندگانی که به دنبال نوآوری در حوزه تعاملات هوش مصنوعی هستند، این مخزن یک ابزار بینظیر است. 🚀
Giyhub : https://github.com/NirDiamant/Prompt_Engineering
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
This media is not supported in your browser
VIEW IN TELEGRAM
LlamaCoder:
ایده تون رو در عرض چند دقیقه تبدیل به برنامه کنید.🚀
در واقعLlamaCoder یک ابزار منبعباز است که با استفاده از مدلهای زبان بزرگ (LLM) متنباز توسعه داده شده است. این ابزار بخشی از مجموعه Claude Artifacts بوده و به شما امکان میدهد تنها با یک پرامپت ساده، برنامههای کوچک و کاربردی بسازید.
ویژگیهای LlamaCoder
✅ پشتیبانی از مدلهای قدرتمند متنباز:
- Qwen-2.5 Coder
- Llama-3.1
- Llama-3.2
✅ فناوریهای پیشرفته برای تجربهای کارآمد:
- Together AI
- Sandpack
- Next.js و Tailwind CSS
- Helicone
- Plausible
✨ با LlamaCoder، ایدههای خود را در کمترین زمان ممکن به واقعیت تبدیل کنید!
Link : https://llamacoder.together.ai/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
ایده تون رو در عرض چند دقیقه تبدیل به برنامه کنید.🚀
در واقعLlamaCoder یک ابزار منبعباز است که با استفاده از مدلهای زبان بزرگ (LLM) متنباز توسعه داده شده است. این ابزار بخشی از مجموعه Claude Artifacts بوده و به شما امکان میدهد تنها با یک پرامپت ساده، برنامههای کوچک و کاربردی بسازید.
ویژگیهای LlamaCoder
✅ پشتیبانی از مدلهای قدرتمند متنباز:
- Qwen-2.5 Coder
- Llama-3.1
- Llama-3.2
✅ فناوریهای پیشرفته برای تجربهای کارآمد:
- Together AI
- Sandpack
- Next.js و Tailwind CSS
- Helicone
- Plausible
✨ با LlamaCoder، ایدههای خود را در کمترین زمان ممکن به واقعیت تبدیل کنید!
Link : https://llamacoder.together.ai/
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
دوستان عزیز،
میدونم که آماده شدن برای مصاحبههای شغلی چقدر سخت میتونه باشه، مخصوصاً وقتی که الگوریتم و ساختمان داده (DSA) مثل یک قله دستنیافتنی به نظر میرسه.
اما باور کنید، یادگیری DSA یکی از مهمترین مهارتهاست که برای موفقیت در مصاحبهها بهش نیاز دارید. 🌟
ناامید نشید—ادامه بدید! 💪
برای کمک بهتون، یه مسابقه کاملاً رایگان پیدا کردم که میتونه توی تمرین DSA خیلی مؤثر باشه:
https://www.geeksforgeeks.org/courses/gfg-160-series
✅ رایگان بودن 100٪
به یاد داشته باشید، هر تلاش کوچیک یک قدم به سمت هدفتونه. پس هیچ وقت تسلیم نشید و ادامه بدید. 🌈
شما از چیزی که فکر میکنید به موفقیت نزدیکترید. پس با قدرت جلو برید—you’ve got this! 🚀
#الگوریتم
📣👨💻 @AlgorithmDesign_DataStructuer
میدونم که آماده شدن برای مصاحبههای شغلی چقدر سخت میتونه باشه، مخصوصاً وقتی که الگوریتم و ساختمان داده (DSA) مثل یک قله دستنیافتنی به نظر میرسه.
اما باور کنید، یادگیری DSA یکی از مهمترین مهارتهاست که برای موفقیت در مصاحبهها بهش نیاز دارید. 🌟
ناامید نشید—ادامه بدید! 💪
برای کمک بهتون، یه مسابقه کاملاً رایگان پیدا کردم که میتونه توی تمرین DSA خیلی مؤثر باشه:
https://www.geeksforgeeks.org/courses/gfg-160-series
✅ رایگان بودن 100٪
به یاد داشته باشید، هر تلاش کوچیک یک قدم به سمت هدفتونه. پس هیچ وقت تسلیم نشید و ادامه بدید. 🌈
شما از چیزی که فکر میکنید به موفقیت نزدیکترید. پس با قدرت جلو برید—you’ve got this! 🚀
#الگوریتم
📣👨💻 @AlgorithmDesign_DataStructuer
چرا به 𝐌𝐮𝐥𝐭𝐢-𝐇𝐞𝐚𝐝 𝐀𝐭𝐭𝐞𝐧𝐭𝐢𝐨𝐧 نیاز داریم وقتی که 𝐒𝐞𝐥𝐟-𝐀𝐭𝐭𝐞𝐧𝐭𝐢𝐨𝐧 داریم؟
برای درک این موضوع ب نکات زیر توجه کنید:
محدودیت 𝐒𝐞𝐥𝐟-𝐀𝐭𝐭𝐞𝐧𝐭𝐢𝐨𝐧
در واقع 𝐒𝐞𝐥𝐟-𝐀𝐭𝐭𝐞𝐧𝐭𝐢𝐨𝐧 به مدل کمک میکند روابط بین کلمات در یک دنباله را بفهمد. اما مشکل اینجاست که هر توجه (Attention) تنها میتواند روی یک جنبه از داده تمرکز کند؛ مثلاً معنای کلمات یا گرامر.
این محدودیت باعث میشود برخی روابط مهم دیگر از دست بروند.
چرا 𝐌𝐮𝐥𝐭𝐢-𝐇𝐞𝐚𝐝 𝐀𝐭𝐭𝐞𝐧𝐭𝐢𝐨𝐧؟
در واقع 𝐌𝐮𝐥𝐭𝐢-𝐇𝐞𝐚𝐝 𝐀𝐭𝐭𝐞𝐧𝐭𝐢𝐨𝐧 با استفاده از چندین "سر توجه" (Attention Heads) این مشکل را حل میکند.
هر سر داده ورودی را از زاویهای متفاوت بررسی میکند، روی جنبههایی مثل:
- معنای کلمات
- موقعیت
- زمینه (Context)
این کار باعث میشود مدل داده را عمیقتر درک کند و همزمان چندین رابطه را شناسایی کند.
چطور کار میکند؟
ورودی توسط چند سر توجه پردازش میشود و بردارهای زمینهای (Context Vectors) مثل Z1 و Z2 تولید میشوند.
سپس این بردارها با یکدیگر ادغام (Concatenate) میشوند تا نمایشی جامعتر و دقیقتر از داده ایجاد کنند.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer
برای درک این موضوع ب نکات زیر توجه کنید:
محدودیت 𝐒𝐞𝐥𝐟-𝐀𝐭𝐭𝐞𝐧𝐭𝐢𝐨𝐧
در واقع 𝐒𝐞𝐥𝐟-𝐀𝐭𝐭𝐞𝐧𝐭𝐢𝐨𝐧 به مدل کمک میکند روابط بین کلمات در یک دنباله را بفهمد. اما مشکل اینجاست که هر توجه (Attention) تنها میتواند روی یک جنبه از داده تمرکز کند؛ مثلاً معنای کلمات یا گرامر.
این محدودیت باعث میشود برخی روابط مهم دیگر از دست بروند.
چرا 𝐌𝐮𝐥𝐭𝐢-𝐇𝐞𝐚𝐝 𝐀𝐭𝐭𝐞𝐧𝐭𝐢𝐨𝐧؟
در واقع 𝐌𝐮𝐥𝐭𝐢-𝐇𝐞𝐚𝐝 𝐀𝐭𝐭𝐞𝐧𝐭𝐢𝐨𝐧 با استفاده از چندین "سر توجه" (Attention Heads) این مشکل را حل میکند.
هر سر داده ورودی را از زاویهای متفاوت بررسی میکند، روی جنبههایی مثل:
- معنای کلمات
- موقعیت
- زمینه (Context)
این کار باعث میشود مدل داده را عمیقتر درک کند و همزمان چندین رابطه را شناسایی کند.
چطور کار میکند؟
ورودی توسط چند سر توجه پردازش میشود و بردارهای زمینهای (Context Vectors) مثل Z1 و Z2 تولید میشوند.
سپس این بردارها با یکدیگر ادغام (Concatenate) میشوند تا نمایشی جامعتر و دقیقتر از داده ایجاد کنند.
#هوش_مصنوعی
📣👨💻 @AlgorithmDesign_DataStructuer