کارگروه علم داده
428 subscribers
458 photos
14 videos
119 files
431 links
ارتباط با ادمین:
@Smn_statistics
Download Telegram
🔶فرایند تحلیل داده:

1⃣ طرح مسئله
2⃣ جمع آوری داده ها
3⃣ بررسی داده ها
4⃣ پاک سازی و آماده سازی داده ها
5⃣ مدلسازی
6⃣ ارزیابی مدل
7⃣ گزارش دهی

🆔@dsfum
🔶 نسبت زمانی که در پروژه های علم داده برای کارهای مختلف صرف می شود

۲۲ درصد آماده سازی داده ها
۱۶ درصد پاکسازی داده ها
۱۶ درصد گزارش دهی و ارائه
۱۳ درصد مصورسازی
۹ درصد انتخاب مدل
۹ درصد مدلسازی
۹ درصد عملیاتی کردن مدل ها
۷ درصد سایر

🆔@dsfum
برنامه روز جهانی سواد آماری
لینک برای شرکت بصورت آنلاین
https://shorturl.at/abdnt
یوتیوب سرفصل Statistical Literacy
https://www.youtube.com/channel/UCTOuxIhJxcxNOntTpamJeAA
Logit, Probit, and Multinomial Logit.pdf
853.1 KB
🔶آموزش رگرسیون های لجستیک، چندسطحی و ترتیبی در R

منبع
🆔@dsfum
🔶مزایا استفاده از تحلیل داده ها در زنجیره تامین :

1⃣پیش بینی نیاز بازار
2⃣بهینه سازی مدیریت انبارها
3⃣مدیریت ارتباط تامین کنندگان
4⃣بهبود تجربه مشتری
5⃣امنیت اطلاعات

🆔@dsfum
👍2
Ordinal Regression (1).pdf
233.7 KB
🔶رگرسیون ترتیبی

منبع

🆔@dsfum
Data Analyst Job Market 2024.pdf
2.6 MB
🔶وضعیت بازار کار تحلیل داده در سال ۲۰۲۴
👨‍💻مهارت های مورد استفاده توسط متخصصین
💵میزان درآمد

منبع: 365data science

🆔@dsfum
👍1
🔶مثال هایی از کاربردهای الگوریتم های یادگیری ماشین

🆔@dsfum
Git Cheat sheet.pdf
1.4 MB
🔶فایل راهنمای گیت هاب

نرم افزار و سایت github ابزاری مدیریت نسخه های مختلفی هست که برای کد خود ایجاد می کنید.

فرض کنید حین برنامه نویسی قصد دارید روش های مختلفی برای حل یک مسئله را امتحان کنید. می خواهید هر کدام در یک فایل جدا قرار داشته باشد. ابزار گیت هاب به شما کمک خواهد کرد.

یا تصور کنید در یک تیم روی یک پروژه همکاری می کنید. می توانید بخش های مختلف پروژه را بین اعضای تیم تقسیم کنید و هر کدام روی بخش خود کار کنید، یا کدهای سایر اعضای تیم را بررسی کنید و با آنها مشورت کنید.

یادگیری گیت هاب می تواند مسیر برنامه نویسی را برای شما و تیم‌تان ساده کند.

🆔@dsfum
🔶در مدل سازی گاها پیش می آید که توزیع داده ها به صورت متوازن نیست و داده ها در برخی نقاط دچار تمرکز هستن.

مثلا فرض کنید هدف شما انجام رگرسیون است. ولی شکل توزیع داده ها طوری است که به صورت دو گروه جدا از هم نیز دیده می شود.

اینجا برای اینکه پیش بینی دقیق تری داشته باشیم، می توانیم از روش های یادگیری گروهی(ensemble learning) استفاده کنیم.

در یادگیری گروهی، ترکیبی از چند الگوریتم به عنوان مدل در پیش بینی استفاده می شود.

مثلا در مثالی که در تصویر می بینید، داده ها در نقطه صفر دچار تورم است. این موضوع باعث شده که مدل رگرسیونی یادگیری ضعیفی داشته باشد.
در حالی که مدل ensemble که از ترکیب درخت تصمیم و مدل رگرسیونی ساخته شده یادگیری نسبتا دقیقی داشته است.
مثال ذکر شده ترکیب یک الگوریتم رگرسیونی و یک الگوریتم طبقه بندی است.

🆔@dsfum
👍1
Assumptions of linear regression.pdf
2.6 MB
🔶فرض های زیر بنایی رگرسیون خطی

منبع: maven analytics
🆔@dsfum
🔶مهارت های فنی و نرم مورد نیاز در تحلیل داده

🆔@dsfum
🔶مقایسه SQL و NoSQL

🆔@dsfum
👍2
🔶اهمیت مصورسازی

داده های خام، داده هایی پیچیده و نامفهوم برای مخاطب است.

برای اینکه بتوان از داده ها در تصمیم گیری استفاده کرد، لازم است که ابتدا پاک سازی شده و سپس به شکلی که در ذهن مخاطب قابل درک تر باشد گزارش داد.

مصورسازی، ابزاری است که کار انتقال نتایج به دست آمده از تحلیل ها یا گزارشی از اطلاعات موجود در داده ها به شکل قابل تفسیر و فهم منتقل می کند.

🆔@dsfum
👍2
Basic Data Cleaning.pdf
2.1 MB
🔶راهنمای پاکسازی داده ها

🆔@dsfum
👍2
🔶نقشه راه یادگیری ماشین با پایتون

منبع: quera

🆔@dsfum
👍1
K - Nearest Neigbor and it’s Hyperparameter.pdf
530.9 KB
🔶آشنایی با الگوریتم knn

منبع:analytics vidhya

🆔@dsfum
👍2
A Guide to Random Forest.pdf
369.5 KB
🔶آشنایی با الگوریتم جنگل تصادفی

منبع: analytics vidhya

🆔@dsfum
معرفی بهترین منابع برای یافتن دیتاست
برای پروژه‌های علوم داده خود


0️⃣کگل:
◀️لینک:
kaggle


⚡️ دیتاست دانشگاه‌ها

1️⃣ ریپازیتوری UCI
◀️ لینک دیتاست:
UCL Datasets

2️⃣ دیتاورس Harvard
◀️ لینک دیتاورس:
Harvard Datavers


🛣 دیتاست شرکت‌های بزرگ

1️⃣ دیتاست AWS

◀️ لینک: Registry of Open Data on AWS

2️⃣ دیتاست تحقیقات مایکروسافت
◀️ لینک:
Microsoft Research Datasets

3️⃣ دیتاست جستجوی گوگل
◀️ لینک:
Google Dataset Search


🟢 پلتفرم‌های اُپن سورس

1️⃣ دیتاست پلتفرم Huggingface
◀️ لینک:
Huggingface Datasets

2️⃣ دیتاست پلتفرم OpenML
◀️ لینک:
OpenML Datasets

منبع:
@DataScience_ir

——————————————————————
🆔@dsfum
🔶چهار روش برای مقایسه مدل ها در صنعت:

1⃣استراتژی آزمون A/B (آزمون فرضیه)
2⃣استراتژی آزمون قناری
3⃣استراتژی آزمون جای داده
4⃣استراتژی آزمون سایه

🆔@dsfum
#استخدام
#شرکت_آهار
#مهندسی_کامپیوتر، #مهندسی_فناوری_اطلاعات


📋شرکت خدمات نیروگاهی آهار جهت تکمیل کادر خود در استان خراسان رضوی، از افراد واجد شرایط دعوت به همکاری می نماید.

🔻کارشناس نرم افزار

🔹نوع قرارداد: تمام وقت
🔹ساعات کاری: شنبه تا چهارشنبه 8 تا 16:30 و پنج شنبه 8 تا 14

🔸شرایط احراز:
🔹 بازه سنی: 22-35 سال
🔹 وضعیت نظام وظیفه: اتمام خدمت سربازی و یا معافیت از آن الزامی است.
🔹 سابقه کار: دارای حداقل یک سال سابقه کار مرتبط
🔹 میزان تحصیلات: حداقل کارشناسی مهندسی کامپیوتر (نرم‌افزار یا سخت‌افزار) - مهندسی فناوری اطلاعات
🔹 میزان آشنایی با زبان انگلیسی: در حد متوسط
🔹 میزان تسلط به نرم افزارها:
C#(پیشرفته)
Python (متوسط)
WPF (پیشرفته)
🔸شرح شغل و وظایف:
🔹 پشتیبانی و توسعه سیستم‌های نرم‌افزاری
🔹 برنامه‌نویسی در حوزه‌های کاری Backend و Frontend

🔸تسهیلات و مزایا:
🔹سرویس رفت و برگشت
🔹صبحانه
🔹ناهار

⬅️ از متقاضیان واجد شرایط خواهشمندیم رزومه خود را به آدرس ایمیل زیر ارسال نمایند.
📨 aharco.hr@gmail.com
Website: Www.aharco.com

💡جهت تسریع در امر بررسی رزومه ها، لطفا در عنوان ایمیل های ارسالی موقعیت شغلی مورد درخواست خود را یادداشت فرمایید.

📍نشانی:
خراسان رضوی - مشهد - کیلومتر 12 جاده آسیایی - پارک علم و فناوری خراسان - ساختمان آهار

کانال معرفی فرصتهای کارآموزی، کارورزی و شغلی - دانشکده مهندسی دانشگاه فردوسی مشهد
🆔@FUMENG_IndustOffice_Jobs
معاونت پژوهش و فناوری دانشکده مهندسی
🆔@FUMEngResearch
📨reng@um.ac.ir