آموزش دیتاساینس و ماشین‌لرنینگ

👩‍🎓

برنامه آموزشی هفته: رگرسیون (Regression)

🟠شنبه: تعریف و انواع رگرسیون

🔵یک‌شنبه: کاربردها

🟢دوشنبه: تابع هزینه

🔴سه‌شنبه: روش‌های بهینه سازی

🟠چهارشنبه: معیار ارزیابی

🔵پنج‌شنبه: مدل‌های Sklearn

🟢جمعه: جمع بندی

#Data_science
#Machine_Learning
#Regression

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤3🔥1👨‍💻1

2.38K views18:31

آموزش دیتاساینس و ماشین‌لرنینگ

👨‍🏫

تعریف و انواع رگرسیون (Regression)

رگرسیون یک تکنیک آماریه که برای مدل‌سازی رابطه بین یک متغیر وابسته (Dependent Variable) و یک یا چند متغیر مستقل (Independent Variable) استفاده میشه.

به عبارت دیگه، رگرسیون سعی می‌کنه رابطه بین مقادیر متغیر وابسته و مستقل را به‌صورت یک تابع ریاضی بیان کنه. در یادگیری ماشین، رگرسیون یکی از مهم‌ترین تکنیک‌های یادگیری با ناظر (Supervised Learning) هست.

انواع رگرسیون

🔵

رگرسیون خطی ساده (Simple Linear Regression): ساده‌ترین نوع رگرسیونه که در اون فقط یک متغیر مستقل وجود داره. رگرسیون خطی ساده از یک خط مستقیم برای مدل‌سازی رابطه بین متغیر وابسته و مستقل استفاده می‌کنه.

🔵

رگرسیون خطی چندگانه (Multiple Linear Regression): در این نوع رگرسیون، بیشتر از یک متغیر مستقل وجود داره. رگرسیون خطی چندگانه از یک معادله خطی برای مدل‌سازی رابطه بین متغیر وابسته و مقادیر متغیرهای مستقل استفاده می‌کنه.

🔵رگرسیون لجستیک (Logistic Regression): برای پیش‌بینی احتمال وقوع یک رویداد با استفاده از یک یا چند متغیر مستقل به کار می‌ره. این روش عمدتاً زمانی استفاده می‌شه که متغیر وابسته دارای ماهیت دوگانه یا گسسته باشه، مثل بله/خیر یا موفق/ناموفق.

رگرسیون کاربردهای گسترده‌ای مثل پیش‌بینی قیمت‌ها، پیش‌بینی فروش، پیش‌بینی جرم، پیش‌بینی بیماری و... در یادگیری ماشین و دیتا ساینس داره.

مثال: فرض کنید یک شرکت تولیدکننده کفش می‌خواد مقدار فروش کفش‌هاش رو در سال آینده پیش‌بینی کنه. این شرکت می‌تونه از رگرسیون خطی ساده برای این کار استفاده کنه.

توی این مثال، متغیر وابسته فروش و متغیر مستقل هزینه تبلیغات هست. شرکت می‌تونه از داده‌های فروش و هزینه تبلیغاتش در سال‌های گذشته برای آموزش مدل رگرسیون استفاده کنه. بعد از آموزش مدل، شرکت می‌تونه ازش برای پیش‌بینی مقدار فروش کفش‌ها در سال آینده استفاده کنه.

#Data_science
#Machine_Learning
#Regression

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍16❤3🔥1👨‍💻1

3.01K views08:01

آموزش دیتاساینس و ماشین‌لرنینگ

💡بررسی اهمیت توزیع نرمال خطاها در رگرسیون خطی

یک نکته که خیلی توی Linear Regression اهمیت داره، داشتن توزیع نرمال خطاها (residuals) هست. در رگرسیون خطی، فرض بر اینکه خطاها (اختلافات بین مقادیر واقعی و پیش‌بینی شده) باید توزیع نرمال داشته باشن. این فرض اطمینان می‌ده که مدل به درستی به داده‌ها اموزش داده شده و پیش‌بینی‌های قابل اعتمادی ارائه می‌ده. در صورت عدم برآورده شدن این شرط، ممکنه نیاز به اصلاحاتی در مدل یا تبدیل داده‌ها باشه تا به توزیع نرمال نزدیک شن.

#Data_science
#Machine_Learning
#Regression

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

👍11❤4🔥1👏1

706 views19:02

آموزش دیتاساینس و ماشین‌لرنینگ

👨‍🏫

کاربردهای رگرسیون (Applications of Regression)

🔵

مدل‌سازی و پیش‌بینی

در دنیای تجارت و اقتصاد، استفاده از رگرسیون برای پیش‌بینی فروش و تقاضا بسیار مرسومه. شرکت‌ها با بررسی داده‌های گذشته و تجزیه و تحلیل روندها، می‌تونن پیش‌بینی‌های دقیقی از وضعیت بازار در آینده داشته باشن. این رویکرد در پیش‌بینی قیمت سهام و همچنین در پیش‌بینی شرایط جوی کاربرد داره.

🔵

بازاریابی و تحلیل مشتری

در بازاریابی، رگرسیون به تحلیل پاسخ بازار به استراتژی‌های مختلف کمک می‌کنه. تحلیلگران می‌تونن با استفاده از این روش، برآورد کنن که یه مشتری در یک بازه، چه میزان ارزش برای یک شرکت یا سازمان ایجاد کرده و با تحلیل سهم بازار، استراتژی‌های بازاریابی‌ رو بهینه‌سازی کنن.

🔵

تحلیل مالی

در حوزه مالی، رگرسیون برای ارزیابی ریسک و امتیازدهی اعتباری استفاده می‌شه. مدیران با استفاده از این روش می‌تونن بازده سرمایه‌گذاری‌ها رو پیش‌بینی کنن و تحلیل‌های دقیق‌تری برای تشخیص تقلب انجام بدن.

🔵بهداشت و تحقیقات پزشکی

در حوزه پزشکی، رگرسیون در پیش‌بینی و تشخیص بیماری‌ها کاربرد داره. پزشکان و محققان از این روش برای پیش‌بینی نتایج بیمار و تحلیل اثربخشی داروها استفاده می‌کنن و همچنین در ارزیابی ریسک‌های بهداشتی مفیده.

🔵کنترل کیفیت و بهینه‌سازی فرآیند

در صنایع تولیدی، رگرسیون برای بهینه‌سازی فرآیندهای تولید و کنترل کیفیت محصولات به کار می‌ره. همچنین، در بهینه‌سازی زنجیره تأمین و تشخیص ناهنجاری‌ها هم نقش مهمی داره.

🔵

علوم اجتماعی و تحلیل رفتاری

در علوم اجتماعی، رگرسیون به تحلیل تأثیرات اجتماعی و اقتصادی کمک می‌کنه. تحلیلگران از این روش برای استخراج نظرات و تحلیل احساسات، تحقیقات آموزشی و بررسی جمعیت‌شناسی استفاده می‌کنن.

🔵

انرژی و خدمات

در صنعت انرژی، پیش‌بینی مصرف انرژی، پیش‌بینی بار و مدل‌سازی قیمت انرژی با استفاده از رگرسیون انجام می‌شه. همچنین، در بهینه‌سازی استفاده از انرژی‌های تجدیدپذیر هم کاربرد داره.

🔵

تحلیل‌های ورزشی

در حوزه ورزش، تحلیلگران از رگرسیون برای تحلیل عملکرد بازیکنان، پیش‌بینی نتایج بازی‌ها و بهینه‌سازی ترکیب تیم‌ها استفاده می‌کنن. این تحلیل‌ها در تصمیم‌گیری‌های درون بازی هم موثره.

🔵

تحلیل محیط‌زیست

در حوزه محیط‌زیست، رگرسیون برای مدل‌سازی آب‌وهوا، پیش‌بینی آلودگی و ارزیابی تأثیرات محیطی به کار می‌ره. این روش در مدیریت منابع طبیعی نقش مهمی داره.

🔵

تحلیل سری‌های زمانی

در تحلیل سری‌های زمانی، رگرسیون برای شناسایی روندها و الگوهای فصلی مورد استفاده قرار می‌گیره. این روش در پیش‌بینی شاخص‌های اقتصادی و تحلیل بازار سهام کاربرد داره.

#Data_science
#Machine_Learning
#Regression

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤3👏1👨‍💻1

710 views08:00

آموزش دیتاساینس و ماشین‌لرنینگ

💡هم‌خطی؛ یه مانع مهم در رگرسیون خطی

یکی از نکاتی که اکثر اوقات در مدل‌های رگرسیون نادیده گرفته می‌شه، اهمیت درک و تحلیل درست پدیده‌ی هم‌خطی (Collinearity) هست. هم‌خطی زمانی رخ می‌ده که دو یا چند متغیر مستقل در یک مدل رگرسیون خطی، ارتباط نزدیکی باهم داشته باشن. این مسئله می‌تونه به کاهش دقت تخمین ضرایب مدل و افزایش واریانس پیش‌بینی‌ها منجر شه.

بسیاری از تحلیل‌گران بدون بررسی وجود هم‌خطی بین متغیرها، مستقیماً شروع به ساخت مدل‌های رگرسیون خطی می‌کنن. این مسئله باعث میشه که مدل نتونه به درستی تفاوت‌های واقعی بین متغیرهای مستقل رو تشخیص بده و در نتیجه، تحلیل‌ها و پیش‌بینی‌های نادرستی ارائه شه.

برای مقابله با این مشکل، تکنیک‌های مختلفی وجود داره. یکی از این روش‌ها، استفاده از تحلیل مولفه‌های اصلی (PCA) برای کاهش ابعاد داده‌ها و از بین بردن هم‌خطیه.

پرداختن به این جزئیات می‌تونه تأثیر زیادی در افزایش دقت و قابلیت اطمینان مدل‌های رگرسیون خطی داشته باشه.

#Data_science
#Machine_Learning
#Regression

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

👍8❤2🤔1

707 viewsedited 18:30

آموزش دیتاساینس و ماشین‌لرنینگ

👨‍🏫

تابع هزینه در رگرسیون خطی

تابع هزینه (Cost Function) در رگرسیون خطی (Linear Regression)، نقش مهمی توی ارزیابی کارایی مدل داره. این تابع، بر پایه ارزیابی اختلاف بین مقادیر پیش‌بینی شده توسط مدل و مقادیر واقعی داده‌ها، عملکرد کلی مدل رو ارزیابی می‌کنه. هدف اصلی در رگرسیون خطی، به حداقل رسوندن تابع هزینه‌ست تا مدلی قابل اعتماد با بیشترین انطباق با داده‌های موجود به‌دست بیاد.

🔵یکی از توابع هزینه رایج توی رگرسیون خطی، مجموع مربعات خطاهاست (MSE). این تابع با محاسبه میانگین مربع تفاوت بین مقادیر پیش‌بینی شده مدل و مقادیر واقعی داده‌ها، میزان خطای کلی مدل رو اندازه‌گیری می‌کنه. فرمول MSE به این شکله:

MSE = (1/n) * Σ(f(x_i) - y_i)^2

توی این فرمول:

* n تعداد نقاط داده‌ست
* f(x_i) پیش‌بینی مدل برای نقطه داده x_i هست
* y_i مقدار واقعی برای نقطه داده x_i هست

🔵تابع هزینه دیگه‌ای که توی رگرسیون خطی استفاده میشه خطای میانگین مطلق (MAE) هست. این تابع با محاسبه میانگین مجموع اختلافات مطلق بین مقادیر پیش‌بینی شده مدل و مقادیر واقعی داده‌ها، میزان خطای کلی مدل رو ارزیابی می‌کنه. فرمول MAE به این شکله:

MAE = (1/n) * Σ|f(x_i) - y_i|

به طور کلی، MSE نسبت به MAE به ناهنجاری‌ها حساس‌تره. این به این معنیه که اگه تعداد کمی از نقاط داده دارای مقادیر بسیار متفاوت از مقادیر دیگه باشن، MSE می‌تونه بزرگتر از MAE باشه.

🔵برای به حداقل رسوندن تابع هزینه، از روش‌های مختلفی مثل گرادیان کاهشی استفاده می‌شه. توی روش گرادیان کاهشی پارامترهای مدل (ضرایب معادله رگرسیون) به طور مداوم در جهت مخالف شیب تابع هزینه تنظیم می‌شن. این فرآیند تا زمانی که تابع هزینه به حداقل برسه ادامه داره.

#Data_science
#Machine_Learning
#Regression

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤3👨‍💻1

764 viewsedited 09:00

آموزش دیتاساینس و ماشین‌لرنینگ

👨‍🏫

روش‌های بهینه سازی در رگرسیون

توی رگرسیون، دو روش اصلی برای پیدا کردن پارامترها وجود داره: گرادیان کاهشی (Gradient Descent) و معادله نرمال (Normal Equation). این دو روش، راه‌های متفاوتی رو برای رسیدن به هدف، یعنی کمینه کردن خطای پیش‌بینی مدل، ارائه می‌دن.

🔵 گرادیان کاهشی (Gradient Descent)

🔵این روش یه تکنیک بهینه‌سازیه که برای پیدا کردن مقادیر بهینه پارامترها (مثل وزن‌ها در رگرسیون خطی) استفاده می‌شه. توی گرادیان کاهشی، ما با یه مجموعه اولیه از پارامترها شروع می‌کنیم و به تدریج اونها رو به‌روز می‌کنیم تا به نقطه‌ای برسیم که خطای مدل به حداقل برسه. این به‌روزرسانی‌ها با استفاده از مشتقات جزئی تابع خطا (مثلا MSE) نسبت به هر پارامتر انجام می‌شه.

🔵گرادیان کاهشی (GD) در مواردی که تعداد ویژگی‌ها زیاده مفیده، اما نیاز به تعیین پارامترهایی مثل نرخ یادگیری (Learning Rate) داره و ممکنه به تعداد زیادی تکرار نیاز داشته باشه. این روش یه تکنیک بهینه‌سازی عمومیه که فقط محدود به رگرسیون خطی نمی‌شه و در انواع مختلف رگرسیون، مثل رگرسیون خطی، رگرسیون لجستیک (برای طبقه‌بندی)، و سایر مدل‌های یادگیری ماشین که نیاز به کمینه‌سازی یه تابع هدف دارن، کاربرد داره.

🔵انتخاب نرخ یادگیری (Learning Rate) یکی از مهم‌ترین پارامترها در گرادیان کاهشیه. اگه این نرخ خیلی کوچک باشه، فرآیند بهینه‌سازی ممکنه خیلی آهسته پیش بره و زمان زیادی نیاز داشته باشه. از طرف دیگه، اگه نرخ یادگیری خیلی بزرگ باشه، ممکنه از نقطه بهینه عبور کنیم و به جواب نرسیم.

🔵توی گرادیان کاهشی، مقیاس‌بندی ویژگی‌ها (Feature Scaling) می‌تونه در بهبود سرعت همگرایی (Convergence Rate) فرآیند بهینه‌سازی مؤثر باشه. این کار باعث می‌شه که ویژگی‌های مختلف در یک مقیاس مشابه قرار بگیرن، که به پیدا کردن مینیمم تابع خطا کمک می‌کنه.

🔵 معادله نرمال (Normal Equation)

🔵این روش یه راه حل تحلیلی برای یافتن پارامترهای رگرسیون خطیه. توی این روش، به جای استفاده از روش تکرار (Iterative) مثل گرادیان کاهشی، ما می‌تونیم مستقیماً مقادیر بهینه پارامترها رو از طریق فرمول ریاضی مشخص شده در معادله نرمال پیدا کنیم. این روش معمولاً در شرایطی بهینه عمل می‌کنه که تعداد ویژگی‌ها (متغیرهای مستقل) بیش از حد زیاد نباشه.

🔵معادله نرمال (NE) روشی سریع و بدون نیاز به تنظیم پارامتره، اما ممکنه در مواجهه با تعداد بسیار زیادی از ویژگی‌ها کارآمد نباشه و همچنین مستلزم محاسبات ماتریسیه که در مقیاس‌های بزرگ حافظه‌بر و زمان‌بره. این روش بیشتر مختص به رگرسیون خطیه و به طور مستقیم پارامترهای بهینه رو برای مدل‌های رگرسیون خطی محاسبه می‌کنه.

#Data_science
#Machine_Learning
#Regression

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👨‍💻3👍1🔥1

712 viewsedited 09:10

آموزش دیتاساینس و ماشین‌لرنینگ

💡مقایسه عملکرد GD و NE در مواجهه با داده‌های پرت

گرادیان کاهشی (GD) قابلیت انعطاف بیشتری در برابر داده‌های پرت (Outliers) داره. این روش تکراری، با توجه به تغییرات تدریجی در پارامترها، می‌تونه تأثیر داده‌های نامتعارف رو کاهش بده.

در حالی که معادله نرمال (NE) که به طور مستقیم مقادیر بهینه رو از طریق محاسبات ریاضی تعیین می‌کنه، ممکنه بیشتر تحت تأثیر داده‌های نامتعارف قرار بگیره. این ویژگی گرادیان کاهشی اونو برای مواجهه با داده‌های دنیای واقعی که اکثرا دارای Outlier هستن، مطلوب می‌کنه.

#Data_science
#Machine_Learning
#Regression

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

👍6❤2🔥2

652 views18:52

آموزش دیتاساینس و ماشین‌لرنینگ

👨‍🏫

آموزش r2-score: شاخص ارزیابی رگرسیون

🔵تعریف

سنجه r2-score، که به عنوان ضریب تعیین شناخته می‌شه، یه معیار برای ارزیابی کیفیت برازش مدل‌های رگرسیونی (اینکه مدل چقدر خوب کار می‌کنه) در یادگیری ماشینه. این معیار نشون‌دهنده درصد تغییرات در متغیر وابسته‌ست (ویژگی یا نتیجه مورد نظر برای پیش‌بینی) که توسط متغیرهای مستقل (عوامل پیش‌بینی‌کننده در مدل) توضیح داده میشه.

🔵نحوه محاسبه

برای محاسبه r2-score، اول میزان دقت مدل رگرسیون رو با یه مدل پایه که فقط میانگین متغیر وابسته (Dependent Variable) رو پیش‌بینی می‌کنه، مقایسه می‌کنیم. سپس، r2-score رو با تقسیم مجموع مربعات تفاضل پیش‌بینی‌های مدل (Sum of Squares Regression, SSR) از خط بهینه بر مجموع کل مربعات تفاضلات (Sum of Squares Total, SST)، که تفاوت‌های داده‌های واقعی از میانگین اونهاست رو محاسبه می‌کنیم.

🔵مقدارهای ممکن برای r2-score

اگه r2-score = 1 باشه نشون‌دهنده برازش کامله، یعنی تمامی تغییرات متغیر وابسته توسط مدل پوشش داده شده.

اگه r2-score نزدیک به 1 باشه، نشون‌دهنده برازش خوب مدله، اما همیشه نشون‌دهنده یک مدل خوب برای پیش‌بینی نیست، چرا که ممکنه بر اثر بیش‌برازش (overfitting) به دست اومده باشه.

اگه r2-score نزدیک به 0 باشه نشون می‌ده که مدل تقریبا هیچ یک از تغییرات متغیر وابسته رو یادنگرفته.

🔵محدودیت‌های r2-score

تنها میزان تطابق داده‌های موجود رو می‌سنجه و لزوما دقت مدل در پیش‌بینی داده‌های جدید رو نشون نمی‌ده. همچنین ممکنه به دلیل افزایش تعداد متغیرهای مستقل در مدل افزایش پیدا کنه؛ حتی اگه این متغیرها اطلاعات مفیدی ارائه نکنن.

🔵استفاده از r2-score در کنار سایر معیارها

برای ارزیابی دقیق‌تر یه مدل رگرسیون، توصیه می‌شود r2-score رو در کنار سایر معیارها مثل خطای میانگین مربعات (MSE) یا خطای میانگین مطلق (MAE) استفاده کنیم. این امر به درک بهتری از عملکرد کلی مدل کمک می‌کنه.

#Data_science
#Machine_Learning
#Regression

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤2🔥1👨‍💻1

703 views08:01

آموزش دیتاساینس و ماشین‌لرنینگ

❓کوئیز شماره ۱۹: سنجه r2-score

کدوم یک از گزینه‌های زیر بهترین استراتژی برای ارزیابی r2-score در یه مدل رگرسیون خطی با هدف کاهش احتمال بیش‌برازشه؟

💡کاربرد Cross-Validation برای تخمین r2-score

توی یادگیری ماشین، cross-validation یه روش ارزیابیه که برای سنجش توانایی مدل در پیش‌بینی داده‌های جدید استفاده می‌شه.

توی این روش، داده‌ها به چندین بخش تقسیم می‌شن. مدل روی تمامی بخش‌ها به جز یکی آموزش داده می‌شه و بخش باقی‌مونده به عنوان داده‌ی تست برای ارزیابی مدل به کار می‌ره. این روند برای هر یک از بخش‌ها به صورت دوره‌ای تکرار می‌شه.

در هر دور، یه r2-score محاسبه می‌شه که نشون‌دهنده میزان دقت مدل توی اون بخش خاصه. در نهایت، میانگین مقادیر r2-score به عنوان شاخصی از کیفیت کلی مدل در نظر گرفته می‌شه.

این روش به ما اجازه می‌ده تا از دقت مدل در پیش‌بینی داده‌هایی که قبلاً ندیده، اطمینان حاصل کنیم و از بیش‌برازش جلوگیری کنیم.

تصور کنین مدل ما یک دانش‌آموزه و داده‌ها مجموعه‌ای از سوالات امتحانی هستن. به جای اینکه تمام سوالات رو یک‌جا به دانش‌آموز بدهیم، ما سوالات را به چند بخش تقسیم می‌کنیم و در هر بار فقط بخشی از سوالات رو می‌پرسیم. به این ترتیب، می‌توانیم مطمئن شویم که دانش‌آموز (یعنی مدل ما) فقط جواب‌ها رو حفظ نکرده، بلکه واقعاً یاد گرفته و می‌تونه به سوالات جدید هم جواب بده.

سنجه r2-score در اینجا مثل نمره‌ای هست که به هر بخش از امتحان داده می‌شه. در نهایت، میانگین این نمرات به ما نشون می‌ده که مدل در کل چقدر خوب عمل کرده. این روش کمک می‌کنه تا مدل‌هایی که فقط روی یک نوع خاص از داده‌ها خوب کار می‌کنن و در مواجهه با داده‌های جدید موفق نیستن، شناسایی شن.

#Data_science
#Machine_Learning
#Regression

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

👍10❤2🤔1

2.33K views17:31

آموزش دیتاساینس و ماشین‌لرنینگ

👨‍🏫

مدل‌های Sklearn برای رگرسیون خطی

توی این آموزش به بررسی مدل‌های رگرسیون خطی در کتابخانه scikit-learn (sklearn)، که یکی از کتابخانه‌های محبوب در زمینه یادگیری ماشینه، می‌پردازیم. scikit-learn ابزارهای قدرتمندی رو برای ایجاد، آموزش و ارزیابی مدل‌های رگرسیون خطی در اختیار ما قرار می‌ده.

🔵Simple and Multiple Linear Regression

گرسیون خطی ساده، رابطه‌ای بین یک متغیر مستقل و یک متغیر وابسته رو مدل‌سازی می‌کنه و رگرسیون خطی چندگانه زمانی استفاده می‌شه که بیشتر از یه متغیر مستقل وجود داره.


from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

🔵Ridge Regression

این مدل رگرسیون خطی با اعمال یه جریمه (alpha) روی مجموع مربعات ضرایب عمل می‌کنه، که این کار به منظور پیشگیری از پدیده بیش‌برازش انجام می‌شه.

from sklearn.linear_model import Ridge
model = Ridge(alpha=1.0)
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

🔵Lasso Regression

رگرسیون Lasso با اضافه کردن یه جریمه به مجموع مطلق ضرایب از بیش‌برازش جلوگیری می‌کنه.

from sklearn.linear_model import Lasso
model = Lasso(alpha=1.0)
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

🔵Elastic-Net Regression

این مدل ترکیبی از Ridge و Lasso هست و هر دو نوع جریمه رو اعمال می‌کنه.

from sklearn.linear_model import ElasticNet
model = ElasticNet(alpha=1.0, l1_ratio=0.5)  # l1_ratio تعادل بین ریج و لاسو را تعیین می‌کند
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

🔵مراحل کلیدی در استفاده از این مدل‌ها در sklearn

۱. وارد کردن کلاس مربوطه: اول باید کلاس مربوط به مدل مورد نظر رو از sklearn وارد کنین.
۲. ایجاد نمونه مدل: با استفاده از کلاس وارد شده، یه نمونه از مدل ایجاد کنین.
۳. آموزش مدل: مدل رو با استفاده از داده‌های آموزشی آموزش بدین.
۴. ارزیابی مدل: با استفاده از داده‌های تست، عملکرد مدل رو ارزیابی کنین.

در نهایت، scikit-learn به شما این امکان رو می‌ده که با استفاده از این مدل‌ها، برآورد دقیق و قابل اطمینانی از روابط بین متغیرهای مختلف ایجاد کنین، که یکی از مهم‌ترین بخش‌های یادگیری ماشینه.

#Data_science
#Machine_Learning
#Regression

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10👍3🔥2👨‍💻2

660 views08:30

آموزش دیتاساینس و ماشین‌لرنینگ

🧑‍🎓

داکر در دیتا ساینس و پروژه‌های ماشین لرنینگ چطور به کار برده می‌شه؟

تصور کنین روی یک پروژه تا آخر کار کردین و به بهترین راه‌حل رسیدین، اما زمانی که کد رو به تیم دیگه ارسال می‌کنین، کدی که روی سیستم شما کار می‌کرد، روی سرورها و سیستم‌های دیگه کار نمی‌کنه.

راه‌حل چیه؟ اینجاست که داکر وارد می‌شه. با استفاده از داکر می‌شه محیطی دقیق و یکسان برای پروژه تعریف کرد و اطمینان حاصل کرد که کد بدون مشکل، بدون توجه به محیط و تنظیمات قبلی اجرا خواهد شد.

🟢

برای مطالعه بیشتر کلیک کنین:

👉

📎

http://ctdrs.ir/ds0289

#MLOps
#Data_Science

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6🔥3👏2👌1

715 views17:31

About

Blog

Apps

Platform