#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤3👌2👏1👨💻1
قبل از وارد کردن دیتا به مدل، باید خطاها، نویز، مقادیر گمشده، تکراری یا نادرست مدیریت شن تا خروجی مدل بهینه شه. پاکسازی دادهها مرحلهایه که در اون دادهها از نظر کیفیت بررسی و اصلاح میشن و این کار نتایج تحلیلها رو تحت تأثیر قرار میده. بنابراین، پاکسازی داده به دلایل زیر اهمیت دارد:
- شناسایی و حذف رکوردهای تکراری
- اصلاح خطاهای ورودی (مثلاً غلط املاییها)
- تکمیل دادههای ناقص (مثلاً پر کردن فیلدهای خالی)
- استانداردسازی دادهها (مثلاً یکنواخت کردن فرمت تاریخها)
- تأیید اعتبار دادهها (مثلاً بررسی کدهای پستی)
- همه مراحل Data Cleansing
- تبدیل دادهها به فرمتهای مورد نیاز
- یکپارچهسازی منابع مختلف داده
- حذف دادههای غیرضروری یا بیربط
در کل Data Cleansing بیشتر به اصلاح و حذف خطاهای موجود در دادهها تمرکز داره و Data Cleaning به آماده و یکپارچهسازی کلی دادهها برای استفاده.
#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍5👌2👨💻1