ماتریس درهم ریختگی یا سردرگمی یک ابزار قدرتمند و پرکاربرد در ارزیابی عملکرد مدلهای یادگیری ماشینه. این ماتریس کمک میکنه تا نحوه عملکرد مدل در تشخیص درست و نادرست نمونهها مشخص شه و درنهایت نتیجهگیری شه که مدل چقدر دقیق عمل میکنه.
استفاده درست از ماتریس سردرگمی و فهم صحیح شاخصهای مختلفش به ساخت مدلهای دقیقتر و کارآمدتر کمک میکنه.
#Evaluation_Metrics
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍5👏2👌1
❓کوییز شماره ۱۶۴: ماتریس سردرگمی در کدوم یک از سناریوهای زیر میتونه بهطور خاص مهمتر از دقت کلی مدل باشه؟
Anonymous Quiz
18%
در مواردی که توزیع دادهها متوازنه.
15%
در مواردی که تشخیص نادرست هزینه زیادی نداره.
45%
در مواردی که دادههای نامتوازن داریم.
21%
در مواردی که تعداد نمونهها کمه.
❤5😎3👍2
نمودار ROC (Receiver Operating Characteristic) و مساحت زیر آن AUC (Area Under the Curve) دو ابزار مهم در ارزیابی عملکرد مدلهای یادگیری ماشین هستن. این ابزارها به خصوص در مدلهای طبقهبندی (Classification) کاربرد دارن و به ما کمک میکنن تا بفهمیم مدل چقدر خوب تونسته دستهبندی کنه.
برای رسم نمودار ROC، اول باید یک سری آستانه (Threshold) تعیین کرد. برای هر آستانه، نرخهای FPR و TPR محاسبه و بعد نقاط مربوط به هر آستانه روی نمودار رسم میشن. با اتصال این نقاط، منحنی ROC به دست میاد.
#Evaluation_Metrics
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤4🔥2👌1
❓کوییز شماره ۱۶۵: در تحلیل چندکلاسه (Multiclass)، کدوم روش معمولاً برای محاسبه AUC استفاده میشه؟
Anonymous Quiz
10%
محاسبه AUC به طور مستقیم با استفاده از تمام کلاسها.
24%
میانگین نرخهای مثبت کاذب (FPR) و مثبت صحیح (TPR) برای هر کلاس.
43%
میانگین AUCهای محاسبه شده برای هر کلاس در برابر سایر کلاسها (One-vs-Rest).
24%
میانگین AUCهای محاسبه شده برای هر جفت کلاس (One-vs-One).
😎4❤2🤔2👍1
Forwarded from رضا شکرزاد - علمداده و هوش مصنوعی
اگه شما یک دانشمند داده، مهندس یادگیری ماشین، پژوهشگر حوزه هوش مصنوعی یا فقط یک علاقهمند به AI هستین، این راهنما برای شماست. هر آنچه که نیازه درباره یادگیری هوش مصنوعی در سال ۲۰۲۴ بدونین، اینجا نوشته شده.
#Artificial_Intelligence
@DSLanders | دیاسلندرز
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥3👏1
Forwarded from کافه تدریس | Cafetadris.com
اگه به کلاس یا ویدئوی آموزشی کنکور ارشد یا دکتری، مشاوره یا آزمون نیاز دارین یا دوست دارین یه مهارت رو بهصورت کامل یاد بگیرین، فرصت دارین علاوه بر استفاده از تخفیفهای ویژه، در قرعهکشی ۵ کلاس رایگان ۱٫۰۰۰٫۰۰۰ تومانی شرکت کنین.
🎒 دیدن تخفیفها و شرکت در جشنواره:
@cafetadris | کافهتدریس
Please open Telegram to view this post
VIEW IN TELEGRAM
معیارهای خوشهبندی نظارت شده برای ارزیابی کیفیت خوشهبندی با مقایسه خوشهها با برچسبهای واقعی استفاده میشن. در اینجا بعضی از معیارهای خوشهبندی نظارت شده رایج توضیح داده شدن:
شاخص تنظیم شده رند (Adjusted Rand Index - ARI): شاخص ARI میزان شباهت بین دو خوشهبندی رو اندازهگیری میکنه. این شاخص جفتهای نمونههایی رو که در خوشههای پیشبینی شده و واقعی به یک خوشه یا خوشههای مختلف اختصاص داده شدن، میشماره و نتایج رو برای شانس تصادفی تنظیم میکنه. ARI بین -1 تا 1 نوسان داره، که 1 نشوندهنده توافق کامل بین خوشهبندیها و 0 نشوندهنده توافقی که بهطور تصادفی به دست آمده، هست.
شاخص نرمال شده اطلاعات متقابل (Normalized Mutual Information - NMI):
شاخص NMI میزان اطلاعات مشترک بین دو خوشهبندی رو اندازهگیری میکنه. این شاخص مقدار اطلاعاتی که از یک خوشهبندی درباره خوشهبندی دیگه به دست میان رو نشون میده و نتایج رو بین 0 (بدون اطلاعات مشترک) و 1 (اطلاعات کامل) نرمالسازی میکنه. NMI برای ارزیابی میزان همبستگی و وابستگی بین خوشهها مفیده.
همگنی، کامل بودن، و اندازه V:
- همگنی (Homogeneity): شاخص همگنی اطمینان حاصل میکنه که هر خوشه تنها اعضای یک کلاس خاص رو در بر داره. اگه هر خوشه فقط شامل دادههای یک دسته خاص باشه، خوشهبندی همگنه.
- کامل بودن (Completeness): شاخص کامل بودن اطمینان حاصل میکنه که همه اعضای یک کلاس خاص به یک خوشه واحد اختصاص داده شدن. اگه همه نمونههای یک کلاس در یک خوشه قرار بگیرن، خوشهبندی کامله.
- اندازه V (V-Measure): اندازه V میانگین هارمونیک همگنی و کامل بودنه. این شاخص تعادلی بین همگنی و کامل بودن برقرار میکنه و میزان کارایی خوشهبندی رو نشون میده.
شاخص فولکس-مالوز (Fowlkes-Mallows Index - FMI):
شاخص FMI میانگین هندسی دقت و یادآوری جفت نقاطی که با هم خوشهبندی شدن رو اندازهگیری میکنه. این شاخص بین 0 تا 1 نوسان داره، که 1 نشوندهنده خوشهبندی کامل و 0 نشوندهنده خوشهبندی ضعیفه. FMI به ارزیابی میزان شباهت بین خوشههای واقعی و پیشبینی شده کمک میکنه.
شاخص تنظیم شده اطلاعات متقابل (Adjusted Mutual Information - AMI):
شاخص AMI شبیه به NMI هست اما امتیاز اطلاعات متقابل رو برای شانس تنظیم میکنه. AMI میزان اطلاعات مشترک بین دو خوشهبندی رو اندازهگیری میکنه و نتایج رو برای تاثیرات شانس تصادفی تنظیم میکنه، که در نتیجه به ارائه ارزیابی دقیقتر کمک میکنه.
معیارهای مبتنی بر ماتریس درهم ریختگی (Confusion Matrix-Based Metrics):
این معیارها شامل دقت (Precision)، یادآوری (Recall) و امتیاز F1 هستن. این معیارها میتونن برای ارزیابی عملکرد خوشهبندی با در نظر گرفتن مسئله به عنوان یک مسئله طبقهبندی تطبیق داده شن. ماتریس آشفتگی توزیع نتایج پیشبینی شده رو در مقابل نتایج واقعی نشون میده و به تحلیل دقیقتر عملکرد الگوریتم کمک میکنه.
این معیارها راهی برای ارزیابی کمی نتایج خوشهبندی با مقایسه آنها با مجموعهای از برچسبهای واقعی ارائه میدن و به تحلیل دقیقتر کیفیت خوشهبندی کمک میکنن.
#Evaluation_Metrics
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤2🔥1👌1
❓کوییز شماره ۱۶۶: چرا از ضریب رند تعدیلشده (Adjusted Rand Index) استفاده میشه؟
Anonymous Quiz
21%
برای کاهش تاثیر تعداد خوشهها روی ارزیابی.
50%
برای مقایسه نتایج خوشهبندی با یک مرجع نظارت شده و ارزیابی کیفیت.
29%
برای ارزیابی کیفیت خوشهبندی بر اساس تعداد خوشهها.
0%
برای بهبود دقت محاسبه شده در نمونههای بزرگ.
😎3❤2👍1👌1
ارزیابیهای خوشهبندی بدون نظارت، کیفیت خوشهبندیها رو بدون نیاز به برچسبهای واقعی یا از پیش تعیینشده بررسی میکنن.
- انسجام: اندازهگیری میکنه که اعضای یک خوشه چقدر به هم نزدیک هستن.
- جداسازی: اندازهگیری میکنه که یک خوشه چقدر از خوشههای دیگه متمایز یا جداست.
#Evaluation_Metrics
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤3👏2👌1
❓کوییز شماره ۱۶۷: کدوم شاخص ارزیابی خوشهبندی میزان فشردگی داخل خوشهها رو اندازهگیری میکنه؟
Anonymous Quiz
14%
Gap Statistic
17%
Dunn Index
48%
WCSS
21%
Silhouette Index
🤔4👍3❤2😎1
در دنیای پیچیدهی #یادگیری_عمیق و پردازش تصویر، مدلهای مختلفی برای تشخیص و شناسایی اشیا در تصاویر توسعه پیدا کردن که اولینشون الگوریتم R-CNN هست. بعد از این مدل که دقت قابل قبولی هم داشت، مدلهای Fast R-CNN و Faster R-CNN طراحی شدن تا نواقص R-CNN رو رفع کنن.
#Deep_Learning
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2🔥1👏1
#Weekend
#Evaluation_Metrics
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍3👏2
#Clustering
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6👏3👌1
Audio
در این دوره بهصورت جامع مباحث دیتاساینس و ماشین لرنینگ، از مقدماتی تا پیشرفته، بررسی میشه.
#DS_Course
@DSLanders | دیاسلندرز
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤2🔥1
خوشهبندی (Clustering) یک روش یادگیری بدون نظارت (Unsupervised Learning) در یادگیری ماشینه که برای گروهبندی دادهها به کار میره. در خوشهبندی، دادهها به گروهها تقسیم میشن و هر گروه شامل دادههاییه که از نظر ویژگیهای مورد نظر، شباهت بیشتری به هم و تفاوتهای بیشتری با دادههای گروههای دیگه دارن. الگوریتمهای خوشهبندی تلاش میکنن تا الگوها و ساختارهای مخفی در دادهها رو شناسایی کنن.
اصول خوشهبندی بر مبنای شباهت و تفاوت بین دادههاست. شباهت بر اساس معیارهای مختلفی مثل فاصله اقلیدسی، همبستگی یا بقیه معیارهای فاصله سنجی تعیین شه.
الگوریتمهای مختلفی برای خوشهبندی دادهها وجود دارن که میتونن براساس نوع دادهها و اهداف خاص هر مسئله، استفاده شن. بعضی از این الگوریتمها عبارتند از:
#Clustering
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3👏1
خوشهبندی، یکی از شیوههای یادگیری ماشین بدون نظارته که ازش برای کشف ساختارها و الگوهای مخفی در مجموعه دادههای بزرگ استفاده میشه. در این مقاله، با انواع روشهای #خوشهبندی و کاربردهاش در صنایع مختلف آشنا میشیم و نحوه پیادهسازی این الگوریتمها در پایتون رو بررسی میکنیم.
#Clustering
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2🔥1👏1
الگوریتم K-means یک روش بدون ناظر برای خوشهبندی دادههاست که سعی داره دادهها رو به K خوشه تقسیم کنه. این الگوریتم از K مرکز اولیه (centroid) شروع میکنه و بهصورت تکراری مراکز خوشهها رو بهروزرسانی میکنه تا زمانی که خوشهها تغییر نکنن.
الگوریتم K-means شامل چند مرحله مهمه:
۱. تعیین تعداد خوشهها (K): در اولین مرحله، باید تعداد خوشههایی که قصد داریم دادهها رو به اونها تقسیم کنیم، مشخص کنیم. این تعداد رو با K نشون میدیم.
۲. انتخاب مراکز اولیه: در این مرحله، K نقطه بهعنوان مراکز اولیه خوشهها بهطور تصادفی از بین دادهها انتخاب میشن. این نقاط میتونن به روشهای مختلفی انتخاب شن، اما معمولاً از روشهای تصادفی استفاده میشه.
۳. تخصیص دادهها به نزدیکترین مرکز: در این مرحله، هر داده به نزدیکترین مرکز (centroid) تخصیص داده میشه. برای تعیین نزدیکی، معمولاً از فاصله اقلیدسی استفاده میشه.
۴. بهروزرسانی مراکز: بعد از تخصیص دادهها به خوشهها، مراکز خوشهها بهروزرسانی میشن. برای هر خوشه، مرکز جدید محاسبه میشه که میانگین نقاط اون خوشه است.
۵. تکرار مراحل ۳ و ۴: مراحل تخصیص دادهها و بهروزرسانی مراکز تا زمانی که مراکز خوشهها تغییر نکنن یا تغییرات بسیار کوچک باشن، تکرار میشن. در این حالت، الگوریتم به همگرایی رسیده و خوشهبندی نهایی انجام شده.
#Clustering
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3👌3👏1
❓کوییز شماره ۱۶۸: چطور میشه تاثیر دادههای پرت رو در نتایج الگوریتم K-means کاهش داد؟
Anonymous Quiz
41%
استفاده از نرمالسازی دادهها
17%
استفاده از الگوریتمهای مقاوم مثل K-medoids
22%
افزایش تعداد تکرارهای الگوریتم
20%
استفاده از الگوریتم K-means++
👍3🤔3❤1😎1
در حوزه یادگیری بدون نظارت (Unsupervised Learning)، الگوریتم K-means به عنوان یک تکنیک اساسی برای خوشهبندی دادهها استفاده میشه و در زمینه تقسیمبندی مشتری، تشخیص تصویر یا تشخیص ناهنجاری کاربرد داره. در این مطلب، نحوه کارکرد الگوریتم K-means، کاربردهاش و بهترین شیوهها برای پیادهسازیش بررسی شدن.
#Clustering
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍4🔥2👏1