کالج علم داده | Data College
483 subscribers
75 photos
4 videos
7 files
30 links
🔵💎 ما در این کانال به ارائه محتواها و آموزش‌های مفید، ساختارمند و جامع در حوزه علم داده، به شما می‌پردازیم.

با محتوای علمی و به‌روز ما همیشه یک قدم جلوتر باشید.
Download Telegram
🔥 4 کتابخانهٔ قدرتمند Python برای مصورسازی داده‌ها:

🟡‏ Matplotlib برای ساخت انواع نمودارهای پایه
🟡‏ Seaborn برای گراف‌های آماری زیبا و خوانا
🟡‏ Plotly برای داشبوردهای تعاملی تحت وب
🟡‏ Altair برای تعریف چارت‌ها با سینتکس ساده

📊 انتخاب درست لایبرری، داستان داده‌هات رو جذاب می‌کنه!

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔥 3 تکنیک برای ارتقاء کیفیت داده‌ها قبل از مدل‌سازی:

1️⃣‏ Deduplication: حذف رکوردهای تکراری
2️⃣‏ Imputation: پر کردن مقادیر از دست‌رفته با میانگین/میانه
3️⃣‏ Normalization: یکسان‌سازی دامنه فیچرها

💡 دیتای تمیز، پایه‌ی هر مدل دقیقیه!

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔥 4 نکته برای Debugging در کد ML:

1️⃣ ‏ Print Shapes: ابعاد Tensor/Array‌رو چک کن
2️⃣ Sanity Check: یک نمونه‌دیتا با Label دستی تست کن
3️⃣ Gradient Monitoring: مطمئن شو گرادیانت‌ها ناپدید یا منفجر نمی‌شن
4️⃣ ‏ Unit Test: تابع پیش‌پردازش، Evaluation و Metrics رو جداگانه تست کن

💡 دیباگ اصولی، تأخیر تو پروژ‌ه رو کاهش می‌ده!

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔥 3 کتاب رایگان برای یادگیری Deep Learning:

🟡 ‏ Dive into Deep Learning” (MXNet, PyTorch)
🟡‏ “Neural Networks and Deep Learning” (Michael Nielsen)
🟡 ‏ Deep Learning” (Goodfello– Online Draft)

📚 منابع آزاد، پایه‌تونو قوی می‌کنه!

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔥 3 تاکتیک ساده برای جلوگیری از Data Drift:

1️⃣ مانیتور کردن توزیع فیچرها به‌صورت دوره‌ای
2️⃣ مقایسه Performance فعلی با Baseline قبلی
3️⃣ استفاده از Retraining Trigger زمانی که افت قابل‌توجه می‌بینی

😀 داده وقتی تغییر کنه، مدل بدون مراقبت خراب می‌شه—پایش رو اتومات کن!

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔥 3 روش سریع برای ارزیابی مدل بدون دیتای جدید:

🟡 Cross-Validation به‌جای یک تقسیم ساده
🟡 Learning Curve برای دیدن under/overfit بودن
🟡 Permutation Feature Importance برای فهم اینکه کدوم فیچر واقعا اثر داره

🔍 مدل بدون فهم درست از رفتار، فقط شانسه—این سه تا رو حتما اجرا کن!

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔥 4 اشتباه رایج در Feature Engineering:

🟡 استفاده از تمام فیچرها بدون انتخاب
🟡 نساختن تعاملات معنادار (Feature Interaction)
🟡 نادیده گرفتن زمان/سری زمانی در داده‌های ترتیبی
🟡 نرمال‌سازی نادرست قبل از تقسیم Train/Test

😵 فیچر خوب، نیمی از مدل خوبه.

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
1
🔥 3 ابزار رایگان برای جمع‌آوری داده‌های با کیفیت:
🟡 Kaggle Datasets برای دیتای آماده
‏ Google Forms + API برای نظرسنجی سفارشی
🟡 Open Data Portals (مثلاً data.gov)

⚠️ داده‌های خوب از هیچ شروع نمی‌شن؛ منابع رو بلد باش.

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔥 3 ابزار رایگان برای جمع‌آوری داده‌های با کیفیت:

🟡 Kaggle Datasets برای دیتای آماده
🟡 Google Forms + API برای نظرسنجی سفارشی
🟡 Open Data Portals (مثلاً data.gov)

🔔 داده‌های خوب از هیچ شروع نمی‌شن؛ منابع رو بلد باش.

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔥 3 نشانهٔ Data Leakage که مدل رو فریب می‌ده

1️⃣ فیچرهایی که بعد از رخداد برچسب جمع‌آوری شدن (آینده در دادهٔ گذشته!)
2️⃣ اشتراک شناسه/ردپای کاربر بین Train و Test (نشت هویتی)
3️⃣ پیش‌پردازش روی کل دیتا قبل از Split (میانگین/نرمال‌سازی مشترک)

💡 قبل از آموزش، نشت رو ببند—وگرنه دقتِ ظاهری، تو تولید دود می‌شه!

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
🔥 3 روش اعتبارسنجی مطمئن برای سری‌های زمانی (Time Series CV):

🟡 Expanding Window: هر بار دادهٔ آموزش بزرگ‌تر می‌شود، افق پیش‌بینی ثابت می‌ماند.
🟡 Sliding Window: پنجرهٔ ثابت، به‌صورت لغزان روی زمان حرکت می‌کند.
🟡 Blocked K-Fold: تاهای زمانیِ پشت‌سرهم بدون قاطی‌شدن گذشته و آینده.

🔔 با CV زمان‌محور، از نشت آینده جلوگیری کن و برآورد واقع‌بینانه بگیر!

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
🔥 3 ابزار رایگان برای جمع‌آوری داده‌های با کیفیت:

🟡 Kaggle Datasets برای دیتای آماده
🟡 Google Forms + API برای نظرسنجی سفارشی
🟡 Open Data Portals (مثلاً data.gov)

💡 داده‌های خوب از هیچ شروع نمی‌شن؛ منابع رو بلد باش.

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔥 4 معیار درست برای ارزیابی کلاسه‌بندی نامتوازن:

1️⃣ PR-AUC بهتر از ROC-AUC وقتی کلاس مثبت کم‌یابه
2️⃣ F1 / F0.5 / F2 بسته به اهمیت Precision یا Recall
3️⃣ Balanced Accuracy برای دیتای با نسبت نامتوازن
4️⃣ Calibration Curve تا ببینی نمرهٔ احتمال واقعیه یا نه

💡 اول «چه چیزی» مهمه رو مشخص کن، بعد متریک رو انتخاب کن.

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
1
📚𝘿𝙖𝙩𝙖-𝘿𝙧𝙞𝙫𝙚𝙣 𝘿𝙚𝙘𝙞𝙨𝙞𝙤𝙣 𝙈𝙖𝙠𝙞𝙣𝙜 & 𝙍𝙤𝙗𝙪𝙨𝙩 𝙊𝙥𝙩𝙞𝙢𝙞𝙯𝙖𝙩𝙞𝙤𝙣 𝙫𝙞𝙖 𝙈𝙖𝙘𝙝𝙞𝙣𝙚 𝙇𝙚𝙖𝙧𝙣𝙞𝙣𝙜

📊دوره آموزشی تصمیم‌گیری داده‌محور و بهینه‌سازی استوار با یادگیری ماشین و پایتون

👨‍💻 در سه سطح از پایه تا پیشرفته و کلاس جهانی

✍️ از آشنایی با مفاهیم پایه تصمیم‌گیری مبتنی بر یادگیری ماشین تا تکنیک‌های پیشرفته بهینه‌سازی استوار داده‌محور ...


✔️ با گواهی معتبر دو زبانه از انجمن مهندسی صنایع ایران IIIE

🤝با حمایت دانشگاه علم و صنعت ایران و آکادمی تخصصی آپتیم‌یار

👨‍🏫 با تدریس اساتید برجسته کشور

🎓 کاربردی در پژوهش‌های تحصیلات تکمیلی دانشگاهی، سازمان‌ها و صنایع


📍حضوری: تهران، دانشگاه علم و صنعت ایران

📆 زمان سطح مقدماتی:  ۲۰ ، ۲۶ و ۲۷ شهریور ■ ۸.۳۰ تا ۱۲.۳۰


🔗 برنامه تفصیلی و سرفصل‌های کامل

🔗 ثبت‌نام و جزئیات بیشتر

🔗 پشتیبانی (تلگرام)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32💯1
🔥 3 محور مانیتورینگ مدل در Production:

1️⃣ Data/Concept Drift با آزمون توزیع و افت متریک
2️⃣ Latency & Cost per Prediction روی هر سرویس
3️⃣ Error Analysis زنده (Segmentها، Outlierها)

💡 هشدار آستانه‌ای + ریترین خودکار = مدل سالم‌تر.

🔵 @DataScience_Function
Please open Telegram to view this post
VIEW IN TELEGRAM
📚𝘿𝙖𝙩𝙖-𝘿𝙧𝙞𝙫𝙚𝙣 𝘿𝙚𝙘𝙞𝙨𝙞𝙤𝙣 𝙈𝙖𝙠𝙞𝙣𝙜 & 𝙍𝙤𝙗𝙪𝙨𝙩 𝙊𝙥𝙩𝙞𝙢𝙞𝙯𝙖𝙩𝙞𝙤𝙣 𝙫𝙞𝙖 𝙈𝙖𝙘𝙝𝙞𝙣𝙚 𝙇𝙚𝙖𝙧𝙣𝙞𝙣𝙜

📊 تصمیم‌گیری داده‌محور و بهینه‌سازی استوار با یادگیری ماشین و پایتون


🔹 آخرین افزایش ظرفیت فقط برای 5 نفر (تا 17 شهریور)

⭕️ ظرفیت این دوره بسیار محدود است و افزایش ظرفیت دیگری صورت نمی‌پذیرد.

🔗 پشتیبانی تلگرام و ثبت‌نام


📍حضوری: تهران، دانشگاه علم و صنعت ایران
📆 زمان سطح مقدماتی:  ۲۰ ، ۲۶ و ۲۷ شهریور ■ ۸.۳۰ تا ۱۲.۳۰


🔗 برنامه تفصیلی و سرفصل‌های کامل
🔗 جزئیات بیشتر
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1💯1
Forwarded from Sahar Kamali
📌سرفصل‌ها :

🔹مسیرها و نیازمندی‌های ادامه تحصیل در خارج از کشور (چگونگی اخذ پذیرش و فاند برای دانشجویان دکتری)
🔹بررسی کشور‌های با پتانسیل بالا برای تحصیل و کار (با درنظر گرفتن وضعیت فعلی اخذ ویزا)
🔹ورود به بازار کار در کشورهای توسعه‌یافته
🔹زیرشاخه‌های پرتقاضا و آینده‌دار برای بازار کار بین المللی

🔹چالش‌های دانشجویان ایرانی خارج از کشور

🎙مخاطبان:
همه دانشجویان و فارغ‌التحصیلان علاقه‌مند به ادامه تحصیل و کار درخارج از ایران

🔎 میهمانان:

حسین همیشه‌بهار
از  Harvard University
فارغ‌التحصیل دانشگاه صنعتی امیرکبیر

شیرین رفیعی
از  Google
فارغ‌التحصیل دانشگاه تهران

🎤 میزبان:
احسان حسینی
از  Imperial College London
فارغ‌التحصیل دانشگاه صنعتی شریف

🎞 وبینار ضبط خواهد شد و ویدیوی آن در اختیار همه افرادی که ثبت نام کرده‌اند قرار می‌گیرد.


🗓 تاریخ : شنبه ۱۲ مهرماه
🕣 ساعت : ۲۰:۳۰
ثبت نام:👇🏼
لینک۱: https://b2n.ir/rg9334
لینک۲: https://tinyurl.com/38vw6w7a