آموزش برنامه نویسی پایتون و Django
2.79K subscribers
272 photos
557 videos
52 files
2.67K links
* پیشنهادات، تبلیغات و تبادل و ... : @ma_limbs

* تعرفه تبلیغات:
https://t.me/+w-o6dHW5O31jMWNk
Download Telegram
🔵 نکته یادگیری ماشین


روش‌های تجمیعی (Ensemble Methods) معمولاً از یک مدل تنها بهتر عمل می‌کنن.

🔹 ایده اصلی: به‌جای اعتماد به یک مدل، چند مدل رو با هم ترکیب کن. مثل اینه که به‌جای یک متخصص، نظر چندین نفر رو بپرسی.

روش Bagging (مثل Random Forest): چندین مدل مشابه روی بخش‌های مختلف داده آموزش می‌دی و جواب‌ها رو میانگین/رأی‌گیری می‌کنی → کاهش واریانس.

روش Boosting (مثل XGBoost, LightGBM): مدل‌ها به‌صورت زنجیره‌ای ساخته می‌شن، هر مدل خطاهای مدل قبلی رو اصلاح می‌کنه → افزایش دقت.

روش Stacking: چند مدل مختلف (مثلاً Logistic Regression + Random Forest + SVM) رو ترکیب می‌کنی و خروجی‌شون رو به یک مدل نهایی می‌دی → قدرت بیشتر.

به زبان ساده: Ensemble یعنی “چند تا مغز با هم بهتر از یک مغزه.”

ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ


لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir
🔵 دوست داری برنامه نویس حرفه ای بشی یا مهارت های کامپیوتری خودت رو افزایش بدی؟ با عضویت در لیست تلگرامی زیر در بی نظیر ترین کانال های برنامه نویسی ما عضو شوید:

🟢 پایتون، هوش مصنوعی، یادگیری ماشین، سی ++، سی شارپ، دات نت، نود جی اس، جاوا اسکریپت، شبکه، علم داده، پایگاه داده، sql، nosql ، مهارت های ICDL، سیستم عامل، لینوکس، فتوشاپ، گرافیک، اندروید، جاوا، ساخت اپلیکیشن موبایل، ری اکت، جی کوئری، php و laravel، دروس رشته کامپیوتر، کنکور کامپیوتر و ...

عضو لیست جامع شوید:

https://t.me/addlist/_UjG99eD_E4zYzhk
https://t.me/addlist/_UjG99eD_E4zYzhk
https://t.me/addlist/_UjG99eD_E4zYzhk
This media is not supported in your browser
VIEW IN TELEGRAM
🔵 آموزش گیت (Git) - config

🟢 کیفیت : متوسط

🔴 توجه کنید این ویدیو با کیفیت متوسط می باشد. طی روزهای آینده نسخه های متفاوت با کیفیت بالاتر یا کم حجم تر از این نسخه در کانال قرار داده خواهد شد.

🟣 آموزش گیت (Git)

🟢 زبان آموزش: فارسی


ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ

لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir
🔵 دوست داری برنامه نویس حرفه ای بشی یا مهارت های کامپیوتری خودت رو افزایش بدی؟ با عضویت در لیست تلگرامی زیر در بی نظیر ترین کانال های برنامه نویسی ما عضو شوید:

🟢 پایتون، هوش مصنوعی، یادگیری ماشین، سی ++، سی شارپ، دات نت، نود جی اس، جاوا اسکریپت، شبکه، علم داده، پایگاه داده، sql، nosql ، مهارت های ICDL، سیستم عامل، لینوکس، فتوشاپ، گرافیک، اندروید، جاوا، ساخت اپلیکیشن موبایل، ری اکت، جی کوئری، php و laravel، دروس رشته کامپیوتر، کنکور کامپیوتر و ...

عضو لیست جامع شوید:

https://t.me/addlist/_UjG99eD_E4zYzhk
https://t.me/addlist/_UjG99eD_E4zYzhk
https://t.me/addlist/_UjG99eD_E4zYzhk
📚 نکته #SQLite

🟣 موضوع : ‏بررسی و مقایسه انواع ذخیره‌سازی داده‌ها در SQLite
📖 سرفصل : ‏مفاهیم اولیه داده‌های جغرافیایی

نکته 1:
‏داده‌های جغرافیایی (Geospatial Data) اطلاعاتی هستند که به صورت صریح یا ضمنی به یک مکان بر روی سطح زمین مرتبط بوده و برای مدل‌سازی پدیده‌های مکانی به کار می‌روند.

نکته 2:
‏هندسه‌ها (Geometries) نمایانگر اشکال فضایی عوارض جغرافیایی هستند و به صورت معمول شامل انواع برداری مانند نقطه (Point)، خط (LineString)، و چندضلعی (Polygon) می‌باشند.

نکته 3:
‏سیستم مرجع مختصات (Coordinate Reference System - CRS) یک چارچوب برای مکان‌یابی دقیق عوارض است و شامل یک بیضوی مرجع (Datum) و یک تصویر نقشه (Map Projection) است.

نکته 4:
‏شناسه مرجع فضایی (Spatial Reference Identifier - SRID) یک کد عددی است که به طور منحصر به فرد CRS یک هندسه را مشخص می‌کند و برای اطمینان از سازگاری مکانی ضروری است.

نکته 5:
‏فرمت WKT (Well-Known Text) یک نمایش متنی استاندارد و قابل خواندن توسط انسان برای نمایش اشکال هندسی است، نظیر POINT (x y) یا POLYGON ((x1 y1, x2 y2, ...)).

نکته 6:
‏فرمت WKB (Well-Known Binary) یک نمایش فشرده و دودویی (Binary) از هندسه‌ها است که به دلیل بهینه‌سازی در فضای ذخیره‌سازی و پردازش توسط سامانه‌های پایگاه داده استفاده می‌شود.

نکته 7:
‏تحلیل‌های توپولوژیکی (Topological Analysis) به بررسی روابط فضایی بین هندسه‌ها می‌پردازند، مانند تماس (Touches)، شامل بودن (Contains) یا تقاطع (Intersects) بدون در نظر گرفتن فاصله.

نکته 8:
‏اندیس‌های فضایی (Spatial Indexes)، نظیر R-tree، ساختارهای داده‌ای بهینه‌شده‌ای هستند که جستجوی سریع عوارض درون یک محدوده مشخص (Bounding Box) را تسهیل می‌کنند.

نکته 9:
‏متا داده‌های فضایی (Spatial Metadata) شامل اطلاعاتی در مورد جداول حاوی هندسه‌ها، ستون‌های فضایی و SRID‌های مرتبط است که برای مدیریت صحیح داده‌های GIS حیاتی است.

نکته 10:
‏فاصله ژئودزیکی (Geodesic Distance) به محاسبه فاصله واقعی بین دو نقطه روی سطح کروی یا بیضوی زمین، برخلاف فاصله اقلیدسی روی یک صفحه مسطح، اشاره دارد.


ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ

لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir
🔵 نکته یادگیری ماشین

مقیاس‌گذاری ویژگی‌ها (Feature Scaling) 📏

تصور کن یه مدل برای پیش‌بینی قیمت خونه داری. دو تا ویژگی (ستون) داری:

مساحت خونه: از ۵۰ تا ۵۰۰ متر مربع.

تعداد اتاق‌ها: از ۱ تا ۵ اتاق.

همونطور که می‌بینی، عدد مربوط به مساحت خیلی بزرگ‌تر از عدد مربوط به تعداد اتاق‌ها است. 🤯 حالا یه مدل ساده مثل SVM (ماشین بردار پشتیبان) می‌خواد این دو تا رو با هم مقایسه کنه. به خاطر اختلاف بزرگ در مقیاس، مدل ممکنه به اشتباه فکر کنه که "مساحت" خیلی مهم‌تر از "تعداد اتاق‌ها" است.

مقیاس‌گذاری ویژگی‌ها دقیقاً برای حل همین مشکل طراحی شده. هدفش اینه که تمام ویژگی‌ها رو روی یک مقیاس مشابه قرار بده تا هیچ‌کدوم به خاطر عدد بزرگ‌ترشون، زورگو نباشن و مدل به همه به یک اندازه توجه کنه.

چطور کار می‌کنه؟

دو روش اصلی و پرکاربرد وجود داره:

استانداردسازی (Standardization):
این روش داده‌ها رو طوری تغییر می‌ده که میانگینشون صفر و انحراف معیار (Standard Deviation)شون یک بشه. این شبیه اینه که تمام داده‌ها رو به یک واحد استاندارد تبدیل کنی. 🧪

نرمال‌سازی (Normalization):
این روش داده‌ها رو در یک بازه مشخص، معمولاً بین ۰ و ۱، قرار می‌ده. مثل این می‌مونه که همه رو روی یه خط‌کش یکسان قرار بدی. 📏

چرا این کار مهمه؟

عملکرد بهتر: خیلی از الگوریتم‌ها، به خصوص اون‌هایی که با فاصله‌ها سروکار دارن (مثل KNN یا SVM) یا اون‌هایی که از نزول گرادیان (Gradient Descent) استفاده می‌کنن (مثل شبکه‌های عصبی)، با داده‌های مقیاس‌گذاری‌شده خیلی بهتر و سریع‌تر کار می‌کنن. ⚡️

عدالت: این کار تضمین می‌کنه که هیچ ویژگی، به خاطر اینکه اعداد بزرگ‌تری داره، بر مدل مسلط نمی‌شه.

خلاصه که، با مقیاس‌گذاری ویژگی‌ها، مطمئن می‌شی که همه ویژگی‌ها به اندازه خودشون مهم تلقی می‌شن و مدل به همه به طور عادلانه نگاه می‌کنه. 😉

ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ


لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir
💠 عضو جامع ترین کانال های توسعه فردی، روانشناسی و موفقیت شوید:

➡️ https://t.me/addlist/AX8uaLK6gE1jNzg0

➡️ https://t.me/addlist/AX8uaLK6gE1jNzg0

شامل موضوعات آموزشی زیر:

توسعه و رشد فردی
افزایش ثروت
هدف گذاری و مدیریت زمان
مهارت های اجتماعی، ارتباطی و فن بیان
روانشناسی و خودیاری
موفقیت
عادات موثر
سلامت و تغذیه سالم
موفقیت شغلی
عبارات تاکیدی
مدیریت اضطراب و خشم
روان درمانی CBT و ACT
شخصیت شناسی و تحلیل روانشناسی
انگیزشی
کودک درون
تکنیک های NLP
یوگا
افزایش حافظه
مدیتیشن
موفقیت تحصیلی
مطالعه موثر
افزایش اعتماد به نفس
افزایش تمرکز
تفکر مثبت
افزایش خلاقیت
نقل قول های انگیزشی

با کلیک بر روی لینک زیر عضو تمامی این کانال ها شوید:

➡️ https://t.me/addlist/AX8uaLK6gE1jNzg0

➡️ https://t.me/addlist/AX8uaLK6gE1jNzg0
🔵 نکته یادگیری ماشین

یه مثال ساده با پایتون در مورد تاثیر نرمال‌سازی داده‌ها


from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
from sklearn.metrics import accuracy_score

# داده نمونه
data = load_iris()
X, y = data.data, data.target

# تقسیم داده به آموزش و تست
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# مدل KNN بدون نرمال‌سازی
model = KNeighborsClassifier()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
print("دقت بدون نرمال‌سازی:", accuracy_score(y_test, y_pred))

# مدل KNN با نرمال‌سازی
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

model_scaled = KNeighborsClassifier()
model_scaled.fit(X_train_scaled, y_train)
y_pred_scaled = model_scaled.predict(X_test_scaled)
print("دقت با نرمال‌سازی:", accuracy_score(y_test, y_pred_scaled))


نتیجه معمولا نشون میده که نرمال‌سازی باعث افزایش دقت یا پایداری مدل می‌شه، مخصوصا وقتی ویژگی‌ها مقیاس‌های متفاوتی دارند.



ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ


لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir
🔵 نکته یادگیری ماشین

بریم سراغ یه حوزه خیلی جذاب و پرکاربرد که به مدل‌ها یاد می‌ده چطور زبان انسان‌ها رو بفهمن! 🗣

پردازش زبان طبیعی (NLP) 💬

کامپیوترها اعداد رو می‌فهمن، نه کلمات رو. 🔢 یه جمله مثل "این فیلم عالی بود!" برای یک کامپیوتر فقط مجموعه‌ای از کاراکترهاست که هیچ معنی‌ای نداره.

پردازش زبان طبیعی (Natural Language Processing) یا NLP، شاخه‌ای از هوش مصنوعی است که روی آموزش مدل‌ها برای فهمیدن، تفسیر و تولید زبان انسان تمرکز داره.

اولین و مهم‌ترین کار در NLP اینه که کلمات و جملات رو به فرمی تبدیل کنیم که کامپیوتر بتونه بفهمه‌شون. این کار با استفاده از تکنیکی به نام جاسازی کلمات (Word Embeddings) انجام می‌شه.

به زبان ساده‌تر:

تصور کن برای هر کلمه، یک "نماینده عددی" درست می‌کنی. 🤝 این نماینده‌ها طوری ساخته می‌شن که کلماتی که معنی مشابهی دارن، نماینده‌های عددی مشابهی هم داشته باشن.

مثلاً نماینده عددی کلمه "پادشاه" در فضای عددی به نماینده "ملکه" خیلی نزدیکه. 👑 این نزدیکی عددی به مدل کمک می‌کنه که روابط بین کلمات رو بفهمه. به این ترتیب، مدل می‌تونه بفهمه که "پادشاه" و "ملکه" به هم مربوط هستن، حتی بدون اینکه معنی واقعی اون‌ها رو بدونه.

NLP در دنیای واقعی کاربردهای بی‌شماری داره:

ترجمه خودکار: 🌐 مثل گوگل ترنسلیت.

تحلیل احساسات: 😊😠 فهمیدن اینکه یک متن (مثلاً نظر یک مشتری) حس مثبتی داره یا منفی.

فیلتر اسپم: 🚫 تشخیص ایمیل‌های ناخواسته.

چت‌بات‌ها و دستیارهای صوتی: 🤖 مثل سیری و دستیار گوگل.

خلاصه که، پردازش زبان طبیعی یه دریچه به دنیای بی‌نهایت متن و کلمات باز می‌کنه و به مدل‌ها اجازه می‌ده مثل ما فکر کنن و صحبت کنن! 😉

ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ


لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir
🔵 با عضویت در لیست تلگرامی جامع آموزش زبان زیر عضو بی نظیرترین‌ و کامل ترین مجموعه آموزش زبان انگلیسی تلگرامی شوید:

🟢 پادکست، کوییز، گرامر، آیلتس، تافل، ویدیو، آموزش زبان به کودکان، اصطلاحات انگلیسی، زبان کنکور و ... :

https://t.me/addlist/hK74E7joz0ZiOGY0
https://t.me/addlist/hK74E7joz0ZiOGY0
https://t.me/addlist/hK74E7joz0ZiOGY0
1
🔵 نکته یادگیری ماشین

یک نکته رندوم دیگه در یادگیری ماشین:

از Differencing و Seasonal Differencing برای ایستا کردن سری‌های زمانی استفاده می‌شن.

🔹 برای Differencing: تفاضل گرفتن بین مشاهدات متوالی برای حذف روند (Trend).

مثال:

$y'_t = y_t - y_{t-1}$

🔹 برای Seasonal Differencing: تفاضل گرفتن با فاصله فصلی برای حذف الگوهای تکراری.
مثال:
$y'_t = y_t - y_{t-s}$

(s = طول فصل، مثل 12 ماه برای داده‌های سالانه)

🔹 نکته: با Differencing داده‌ها ایستا می‌شن و مدل‌های کلاسیک مثل ARIMA بهتر عمل می‌کنن.

به زبان ساده: Differencing یعنی “تغییرات واقعی رو بررسی کن نه مقادیر خام داده‌ها” 🔄



ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ


لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir
🔵 نکته یادگیری ماشین


سوگیری و عدالت در مدل‌ها (Bias and Fairness) 👤

مدل‌های یادگیری ماشین خیلی باهوشن، اما یه مشکل بزرگ دارن: اون‌ها فقط به اندازه‌ی داده‌هایی که روشون آموزش دیدن، باهوشن. اگه داده‌ها سوگیری یا تبعیض داشته باشن، مدل هم اون‌ها رو یاد می‌گیره و تکرار می‌کنه.

تصور کن یه مدل برای استخدام نیرو در یک شرکت آموزش می‌دی. 💼 اگه داده‌های تاریخی شرکت نشون بدن که برای شغل‌های مدیریتی بیشتر مردها استخدام شدن، مدل تو هم یاد می‌گیره که این شغل‌ها برای مردها مناسب‌تره و به صورت ناخودآگاه، به کاندیدهای زن امتیاز کمتری می‌ده. 🙅‍♀️

اینجاست که سوگیری مدل (Model Bias) اتفاق می‌افته. مدل بر اساس داده‌های غیرمنصفانه، تصمیم‌های تبعیض‌آمیز می‌گیره.

چطور با این مشکل مقابله کنیم؟

داده‌های باکیفیت: 📊
قبل از هر کاری، باید مطمئن بشیم داده‌های آموزشی‌مون نماینده‌ی عادلانه‌ای از تمام گروه‌ها و اقلیت‌ها هستن و هیچ سوگیری آشکاری ندارن.

ارزیابی منصفانه:
به جای فقط نگاه کردن به دقت کلی مدل، باید بررسی کنیم که مدل برای گروه‌های مختلف (مثلاً از نظر جنسیت، نژاد یا سن) به طور عادلانه عمل می‌کنه یا نه. معیارهای خاصی برای سنجش عدالت وجود دارن.

الگوریتم‌های ضد سوگیری:
روش‌هایی وجود دارن که به صورت خودکار، سوگیری مدل رو در حین یا بعد از آموزش کاهش می‌دن و تصمیم‌های اون رو عادلانه‌تر می‌کنن.

خلاصه که، مسئولیت ما اینه که مطمئن بشیم هوش مصنوعی‌ای که می‌سازیم، دنیایی بهتر و عادلانه‌تر بسازه، نه اینکه سوگیری‌های موجود رو تکرار کنه! 🌍

ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ


لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir
🔵 نکته یادگیری ماشین

کاهش ابعاد (Dimensionality Reduction) می‌تونه هم سرعت مدل رو بیشتر کنه و هم دقت رو.

🔹 وقتی تعداد ویژگی‌ها (Features) خیلی زیاد باشه، مدل‌ها دچار نفرین ابعاد (Curse of Dimensionality) می‌شن:

سرعت آموزش پایین میاد

احتمال Overfitting زیاد میشه

پیدا کردن الگوهای واقعی سخت‌تر میشه

🔹 راهکارها:

راهکار PCA (Principal Component Analysis): ترکیب خطی ویژگی‌ها برای ایجاد ویژگی‌های جدید و کم‌تعداد.

راهکار t-SNE و UMAP: بیشتر برای Visualization و نمایش داده‌های پیچیده در 2D یا 3D استفاده می‌شن.

راهکار Autoencoders: کاهش بعد غیرخطی با استفاده از شبکه‌های عصبی.

به زبان ساده: وقتی ویژگی‌ها خیلی زیادن، همه رو نگه ندار! بعضی‌هاشون رو ترکیب کن یا حذف کن تا مدل سبک‌تر و باهوش‌تر بشه.

ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ


لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir
💠 عضو جامع ترین کانال های توسعه فردی، روانشناسی و موفقیت شوید:

➡️ https://t.me/addlist/AX8uaLK6gE1jNzg0

➡️ https://t.me/addlist/AX8uaLK6gE1jNzg0

شامل موضوعات آموزشی زیر:

توسعه و رشد فردی
افزایش ثروت
هدف گذاری و مدیریت زمان
مهارت های اجتماعی، ارتباطی و فن بیان
روانشناسی و خودیاری
موفقیت
عادات موثر
سلامت و تغذیه سالم
موفقیت شغلی
عبارات تاکیدی
مدیریت اضطراب و خشم
روان درمانی CBT و ACT
شخصیت شناسی و تحلیل روانشناسی
انگیزشی
کودک درون
تکنیک های NLP
یوگا
افزایش حافظه
مدیتیشن
موفقیت تحصیلی
مطالعه موثر
افزایش اعتماد به نفس
افزایش تمرکز
تفکر مثبت
افزایش خلاقیت
نقل قول های انگیزشی

با کلیک بر روی لینک زیر عضو تمامی این کانال ها شوید:

➡️ https://t.me/addlist/AX8uaLK6gE1jNzg0

➡️ https://t.me/addlist/AX8uaLK6gE1jNzg0
💡 نکته #SQL

🟣 موضوع : ‏Partitioning جداول

نکته :

‏موقع انتخاب فیلد برای تقسیم بندی، حواست باشه که داده‌ها به طور مساوی پخش بشن. ⚖️ اینجوری تقسیم بندی بهترین کارایی رو داره.


ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ

لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir
🔵 نکته یادگیری ماشین

داده‌سنجی متقابل (Cross-Validation)

یکی از بزرگترین چالش‌های ما در یادگیری ماشین، بیش‌برازش (Overfitting) است. مدل روی داده‌های آموزشی فوق‌العاده عمل می‌کنه، ولی روی داده‌های جدید افتضاحه! 😩

داده‌سنجی متقابل راه حلی هوشمندانه برای این مشکل است. به جای اینکه فقط یک بار داده‌ها رو به دو بخش آموزشی و آزمایشی تقسیم کنیم، این کار رو چندین بار تکرار می‌کنیم.

روش کار به این صورته که داده‌های ما رو به K قسمت مساوی تقسیم می‌کنیم (مثلاً ۵ یا ۱۰ قسمت). در هر مرحله، یکی از این قسمت‌ها رو به عنوان داده آزمایشی و بقیه رو به عنوان داده آموزشی استفاده می‌کنیم. این فرآیند رو K بار تکرار می‌کنیم تا هر قسمت یک بار به عنوان داده آزمایشی استفاده بشه.

در نهایت، میانگین عملکرد مدل در تمام این K مرحله رو محاسبه می‌کنیم. این میانگین، یک ارزیابی قابل اعتمادتر و دقیق‌تر از عملکرد واقعی مدل به ما می‌ده، چون مدل روی بخش‌های مختلف داده تست شده و به یک مجموعه خاص از داده‌های آزمایشی وابسته نیست. 📈

این تکنیک به ما کمک می‌کنه:

بیش‌برازش رو شناسایی کنیم: اگر میانگین امتیازات مدل در این فرآیند خیلی پایین باشه، یعنی مدل روی داده‌های آموزشی خوب عمل کرده ولی روی داده‌های جدید (بخش‌های آزمایشی) نه، و این نشونه‌ی بیش‌برازشه.

عملکرد مدل رو به شکل واقع‌بینانه‌تری ارزیابی کنیم: به جای یک عدد واحد که می‌تونه تصادفی باشه، یک دید جامع‌تر از عملکرد مدل به دست می‌یاریم.

در واقع، داده‌سنجی متقابل مثل این می‌مونه که به جای یک بار امتحان دادن، ۵ بار با سوالات مختلف امتحان بدیم و نمره‌ی نهایی ما میانگین اون ۵ تا باشه. اینجوری نتیجه‌ی نهایی خیلی قابل اعتمادتره. 😉

ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ


لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir
👍1
🔵 با عضویت در لیست تلگرامی جامع آموزش زبان زیر عضو بی نظیرترین‌ و کامل ترین مجموعه آموزش زبان انگلیسی تلگرامی شوید:

🟢 پادکست، کوییز، گرامر، آیلتس، تافل، ویدیو، آموزش زبان به کودکان، اصطلاحات انگلیسی، زبان کنکور و ... :

https://t.me/addlist/hK74E7joz0ZiOGY0
https://t.me/addlist/hK74E7joz0ZiOGY0
https://t.me/addlist/hK74E7joz0ZiOGY0
🔵 نکته یادگیری ماشین

خب، حالا بریم سراغ یه نکته برای وقتی که یک نقطه داده، کل داستان رو به هم می‌ریزه! 🤯

داده‌های پرت (Outliers) 📈

تصور کن داری میانگین قد یک کلاس درس رو حساب می‌کنی. 🧑‍🎓 اکثر بچه‌ها قدی بین ۱.۵۰ تا ۱.۷۰ متر دارن. اما یکی از اون‌ها بازیکن بسکتباله و قدش ۲.۲۰ متره.

این یک مورد، یک داده پرت (Outlier) محسوب می‌شه. داده‌های پرت به نقاطی در داده‌ها گفته می‌شه که از بقیه نقاط خیلی خیلی دور هستن و الگوی کلی رو دنبال نمی‌کنن.

چرا داده‌های پرت خطرناکن؟

گمراه‌کننده هستن: 🤦‍♂️ وجود یک داده پرت می‌تونه میانگین یک گروه رو به شدت تغییر بده و تصویری نادرست از واقعیت نشون بده. در مثال بالا، قد متوسط کلاس خیلی بیشتر از حد واقعی می‌شه.

عملکرد مدل رو خراب می‌کنن: در یادگیری ماشین، داده‌های پرت مثل آهنربا عمل می‌کنن و خط بهترین برازش مدل رو به سمت خودشون می‌کشن. این باعث می‌شه مدل برای بقیه داده‌ها کمتر دقیق باشه.

چطور با این مشکل مقابله کنیم؟

کشف و حذف: 🗑 اولین قدم اینه که با ابزارهای بصری یا آماری، داده‌های پرت رو پیدا کنی. اگر مطمئن شدی که اون‌ها خطای ورودی داده بودن، می‌تونی اون‌ها رو حذف کنی. (اما حواست باشه اطلاعات مهمی رو از دست ندی!)

جایگزینی: می‌تونی اون‌ها رو با یک مقدار قابل قبول‌تر (مثلاً میانه) جایگزین کنی.

استفاده از مدل‌های مقاوم: بعضی از مدل‌ها به صورت طبیعی در برابر داده‌های پرت مقاوم‌تر هستن، مثل مدل‌های مبتنی بر درخت (درخت تصمیم و جنگل تصادفی).

خلاصه که، داده‌های پرت مثل مهمون‌های ناخونده هستن که می‌تونن مهمونی (مدل) رو خراب کنن! 😉

ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ


لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir
🔵 نکته یادگیری ماشین

از Time Series Forecasting برای پیش‌بینی داده‌های زمانی استفاده می‌شه.

🔹 ویژگی اصلی داده‌های زمانی: ترتیب و وابستگی بین مشاهدات اهمیت داره.
🔹 مثال‌ها: پیش‌بینی فروش، دما، ترافیک، قیمت سهام.

🔹 روش‌ها:

روش ARIMA / SARIMA: مدل‌های کلاسیک برای داده‌های ایستا (stationary).

روش Exponential Smoothing: پیش‌بینی با وزن دادن بیشتر به داده‌های اخیر.

روش LSTM / GRU: شبکه‌های عصبی برای داده‌های غیرخطی و بلندمدت.

روش Prophet (فیسبوک): ابزار ساده برای داده‌های روزانه و فصلی با روندهای مختلف.

نکته مهم: قبل از آموزش، بررسی Trend، Seasonality و Noise داده‌ها خیلی مهمه.

به زبان ساده: Time Series Forecasting یعنی “با نگاه به گذشته، آینده رو پیش‌بینی کنیم 📈.”

ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ


لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir
🔵 با عضویت در لیست تلگرامی جامع آموزش زبان زیر عضو بی نظیرترین‌ و کامل ترین مجموعه آموزش زبان انگلیسی تلگرامی شوید:

🟢 پادکست، کوییز، گرامر، آیلتس، تافل، ویدیو، آموزش زبان به کودکان، اصطلاحات انگلیسی، زبان کنکور و ... :

https://t.me/addlist/hK74E7joz0ZiOGY0
https://t.me/addlist/hK74E7joz0ZiOGY0
https://t.me/addlist/hK74E7joz0ZiOGY0
Media is too big
VIEW IN TELEGRAM
🔵 آموزش گیت (Git) - Branching and Merging

🟢 کیفیت : متوسط

🔴 توجه کنید این ویدیو با کیفیت متوسط می باشد. طی روزهای آینده نسخه های متفاوت با کیفیت بالاتر یا کم حجم تر از این نسخه در کانال قرار داده خواهد شد.

🟣 آموزش گیت (Git)

🟢 زبان آموزش: فارسی


ـــــــــــــــــــــــــــــــــــــــــــــــــــــــــ

لطفا ما رو به دیگران هم معرفی کنید...

آدرس کانال اصلی :
https://t.me/Tu_24

آدرس وبسایت:
https://Tutorial24.ir