مدرسه پردازش و تحلیل داده دقیقه
4.05K subscribers
408 photos
62 videos
10 files
392 links
🔹یادگیری گام‌به‌گام مهارت کار با داده‌ها

وبسایت: d-learn.ir

▫️شناسه تلگرام پشتیبانی مدرسه
@dlearnsup

▫️اینستاگرام
instagram.com/dlearn.ir
▫️توییتر
twitter.com/dlearn_ir
▫️لینکدین
linkedin.com/company/dlearn
Download Telegram
با هر زمینۀ شغلی و تحصیلی می‌توانیم علوم داده و فنون مرتبط با آن را یاد بگیریم.

مدرسه پردازش و تحلیل داده دقیقه جایی است برای یاد‌گیری گام‌به‌گامِ مهارت‌های لازم برای کار با داده‌ها.

▫️آدرس مدرسه: d-learn.ir

@dlearn_ir
شبکه‌های اجتماعی:

▫️تلگرام
t.me/dlearn_ir
▫️اینستاگرام
instagram.com/dlearn.ir
▫️توییتر
twitter.com/dlearn_ir
▫️لینکدین
linkedin.com/company/dlearn
🔍 علوم داده چیست و چگونه کار می‌کند؟

علوم داده (Data Science) مجموعه‌ای از دانش، مهارت، ابزار و روش برای استخراج الگوهای ناآشکار و مفید از داده‌‌هاست. این مجموعه علی‌رغم اهداف پیچیده و پرجاذبه‌اش مانند کشف الگوهای پنهان، پی بردن به عوامل رخدادها و پیش‌بینی رفتارها و … ماهیتی بسیار ساده دارد. علوم داده به صورت قدم به قدم، قابل فهمیدن و یادگیری است.

اگر دوست دارید نقشه‌ای کلی از مولفه‌های اصلی علوم داده در ذهنتان ترسیم شود و موقعیت خود را در آن پیدا کنید، مطلب زیر را در وبسایت مدرسه مطالعه کنید:

▫️ d-learn.ir/what-is-data-science

@dlearn_ir
R یا Python ?!
مسئله این نیست!

وقتی کسی می‌خواهد یادگیری در علوم داده را شروع کند یکی از سوالاتی که معمولاً با آن بر می‌خورد این است که R بهتر است یا Python؟
واقعیت این است که پایتون و R دو ابزار اصلی پردازش و تحلیل داده در دنیا هستند. هر دوی این ابزارها بسیار قدرتمند و پرکاربرد هستند و در بیشتر موارد هر یک به تنهایی می‌توانند کار شما را تا حد بسیار خوبی در علوم داده راه بیندازند.
اما معمولاً کسانی که پیش‌زمینۀ کاری یا تحصیلی‌شان علوم یا مهندسی کامپیوتر است با پایتون بیشتر ارتباط برقرار می‌کنند و کسانی که زمینه کاری آن‌ها آمار، علوم پایه، سایر شاخه‌های مهندسی، علوم انسانی و روزنامه‌نگاریِ داده است بیشتر به R علاقمند می‌شوند و آن را سریع‌تر و راحت‌تر فرا می‌گیرند و گاهی به رشد و توسعه آن نیز کمک می‌کنند.

البته محبوبیت R در میان تحلیلگران داده دلایل تاریخی جالبی نیز دارد که می‌توانید آن‌ها در بخش «چرا R؟» از دوره آموزشی «آشنایی با R» در لینک زیر مطالعه کنید:

d-learn.ir/courses/r-intro/lesson/why-r

@dlearn_ir
🔵 علوم اجتماعی محاسباتی چیست و چه مسائلی را در بر می‌گیرد؟

در روزگار حاضر دسترسی به داده‌های زیادی در ارتباط با پدیده‌های اجتماعی وجود دارد. پژوهشگران علوم اجتماعی می‌توانند با گردآوری و تحلیل آن‌ها موضوعات مورد علاقه خود را بررسی کنند و بر نقاط تاریک آن نور بتابانند.

علوم اجتماعی محاسباتی رویکردی میان‌رشته‌ای برای مطالعه جوامع انسانی در سطوح و ابعاد مختلف با اتکا بر تحلیل داده‌ است. به بیان دیگر، پژوهشگران با به کارگیری نظریات جامعه‌شناسی و تکیه بر توان پردازش کامپیوتر تلاش می‌کنند پیچیدگی‌های پدیده‌های اجتماعی را با استفاده از داده‌ها تبیین و تفسیر کنند.

از کجا شروع کنیم
؟

بهترین کار این است که با ابزارهای مرتبط آشنا شویم. برای شروع یادگیری می‌توانید به مدرسه پردازش و تحلیل داده دقیقه سر بزنید:

d-learn.ir/courses


اگر می خواهید بیشتر در مورد کاربرد تحلیل داده در علوم اجتماعی بدانید به لینک زیر مراجعه کنید و متن کامل را مطالعه کنید:

d-learn.ir/p/data-analysis-in-social-science-and-css/

@dlearn_ir
🗂️ #داده گاهشمار توسعه متروی تهران


برای انجام هر تحلیلی نیازمند یک داده منسجم مثلا در قالب یک جدول هستیم؛ جدولی که هر سطر آن نشان‌دهندۀ یک مشاهده و هر ستون آن دربرگیرندۀ یک ویژگی باشد. دسترسی به چنین جدولی انجام انواع محاسبات را امکان‌پذیر می‌کند دست تحلیلگر را برای بررسی‌های مختلف باز می‌گذارد.

مثلا اگر بخواهیم عملکرد توسعه متروی تهران در ۲۳ سال گذشته را ارزیابی کنیم به جدولی مشابه جدول زیر نیاز داریم که تاریخ بهره‌برداری از هر یک از ایستگاه‌ها در آن آمده باشد. این جدول را در بخش داده‌های مدرسه دقیقه ملاحظه کنید:

▫️d-learn.ir/p/tehran-metro-stations-timeline-csv

اگر می‌خواهید ببینید از این جدول چگونه می‌توان در فرایند تحلیل داده استفاده کرد به مقاله زیر در مجله دقیقه مراجعه کنید:

▫️d-mag.ir/p6988

@dlearn_ir
👍1
این تصاویر مانند بسیاری دیگر از مصورســازی‌های جذابِ داده در مجلات معتبر، با اســتفاده از کتـابخــانه‌ای بــه نــام ggplot2 ایجاد شده‌اند. روش کار با ایـن کتــابـخـــانه منعــطف و قدرتمند را در مدرسه دقیقه یاد بگیرید:

عنوان دوره:
آشنایی با مصورسازی داده در ggplot2
لینک: d-learn.ir/courses/ggplot2-intro

@dlearn_ir
👍1
🟡 تحلیل داده برای گزارش‌نویسی و دیتاژورنالیسم

#دوره‌_آموزشی_حضوری
#دوره_آموزشی_آنلاین

یکی از مهم‌ترین خلأها در بازار کار علوم داده، توان روایت‌گری موثر و جذاب با استفاده از داده‌هاست. تحلیلگر داده برای حضور موفق در بازار کار، دو مهارت مشخص لازم دارد: تحلیل داده و روایت‌گری. اگر دوست دارید هر دو مهارت را با هم رشد دهید این دوره آموزشی را از دست ندهید.

این دوره در ۱۶ ساعت (۸ جلسه در ۴ هفته) برگزار خواهد شد و برای افراد زیر کاربرد دارد:

▫️تحلیلگران و کارشناسان در کسب‌وکارها و سازمان‌ها
▫️کسانی‌ که می‌خواهند وارد بازار کار تحلیل داده شوند
▫️پژوهشگرانی که می‌خواهند با کیفیت بالاتری مقاله بنویسیند
▫️روزنامه‌نگارانی که می‌خواهند از تحلیل داده در گزارش‌هایشان استفاده کنند

🔴 مهلت ثبت‌نام تا ۱۴ مرداد


برای اطلاعات بیشتر به لینک ثبت نام مراجعه کنید:

d-learn.ir/data-journalism

@dlearn_ir
@dmag_ir
🟢 آیا می‌دانید نیمه پنهان تحلیل داده و آمار چیست؟

کسی که در آمار و تحلیل داده مشغول به فعالیت است کارش فقط بالا و پایین کردن اعداد و پیدا کردن الگوها و روابط ریاضی نیست. کار در این حوزه نیازمندی‌های دیگری هم دارد که اهمیت‌شان در عمل هیچ کم از این موارد نیست.

کسی که در این حوزه کار می‌کند بخش زیادی از وقتش را صرف توضیح اعداد می‌کند. پس باید نوشتن بلد باشد.

از طرف دیگر باید بتواند آنچه انجام داده را به صورت ساده و قابل فهم برای دیگران توضیح دهد. اینجا استفاده از نمودار و تصویر به کار می‌آید. پس باید ذائقه بصری خود را نیز پرورش داده باشد.

یادگیری این مهارت‌ها، تاثیرگذاری تحلیلگر داده و کارشناس آمار را در هر حوزه‌ای که باشد به صورت چشمگیری افزایش خواهد داد.

ایـن مــهـارت‌هـــا در هــیــچ جایی مانند «دیتاژورنالیسم» به یکدیگر پیوند نخورده‌اند. اگر می‌خواهید آن‌ها را در کنار تحلیل داده یاد بگیرید در دوره «تحلیل داده برای گزارش‌نویسی و دیتاژورنالیسم» ثبت نام کنید:

d-learn.ir/data-journalism-0105/

@dlearn_ir
#داده‌ داوطلبان کنکور سراسری کارشناسی به تفکیک رشته و جنسیت (از ۱۳۸۱ تا ۱۴۰۱):

d-learn.ir/p/iran-konkour-data

@dlearn_ir
🔵 چه مهارت‌هایی در علوم داده لازم است؟

شاید یکی از مهمترین‌ مهارت‌هایی که بتوان برای کار در علوم داده برشمرد شناخت و تحلیل موضوع باشد، چون تمامی مهارت‌های دیگر کم‌وبیش در کنار آن معنا پیدا می‌کنند. اگر بخواهیم فهرستی کوتاه از این دانش‌ها و مهارت‌ها ارائه کنیم می‌توان به موارد زیر اشاره کرد:

▫️دانش‌های‌ تخصصی برای شناخت موضوع
▫️آمار و احتمال
▫️مصورسازی داده
▫️گزارش‌نویسی و مهارت‌های ارتباطی
▫️تغییر ساختار و تبدیل داده‌ها
▫️تحلیل الگوریتم و مدیریت محاسبات حجیم
▫️یادگیری ماشین
▫️اخلاق بهره‌برداری و حکمرانی داده‌ها

اگر در امتداد مسیرهای شغلی تحلیلگر داده یا تحلیلگر کسب و کار حرکت می‌کنید سعی کنید دستی در دیتاژورنالیسم پیدا کنید.

دیتاژورنالیسم کلیدواژه‌ای است که می‌توانید مهارت‌های زیادی مانند شناخت موضوع، آمار و احتمال، تغییر ساختار داده‌ها، مصورسازی داده، ارائه، ارتباط، گزارش‌نویسی را در آن تمرین کنید و یاد بگیرید.

اگر می‌خواهید تحلیل داده و دیتاژورنالیسم را در کنار یکدیگر یاد بگیرید، در دوره آموزشی «‍‌تحلیل داده برای گزارش‌نویسی و دیتاژورنالیسم» ثبت نام کنید:

d-learn.ir/data-journalism-0105

@dlearn_ir
🔴میزان جمعیت کشورها معمولا دارای تناسبی با وضعیت اقتصادی و توانایی آن‌ها در تولید غذا است. میزان زمین قابل کشت و بارندگی معمولا توانایی کشورها در تولید غذا را نشان می‌دهد. این داده‌ها از سال ۲۰۱۱ تا ۲۰۲۱ میلادی برای تمام کشورها و مناطق جغرافیایی جهان از بانک جهانی استخراج شده است و از وبسایت مدرسه پردازش و تحلیل داده دقیقه در لینک زیر قابل دریافت است:

d-learn.ir/p/gdp_population

برای دیدن سایر داده‌های منتشر شده به مجله پرانتز سر بزنید.

d-learn.ir/category/parantez/dataset

#داده
#جمعیت
#علوم_داده

@dlearn_ir
🔵 تحلیل داده‌ به عنوان مزیت رقابتی

توماس دِیوِنپورت، استاد دانشگاه‌های ام‌آی‌تی، آکسفورد و مدرسه کسب‌وکار بابسون مقاله‌ای در مجله بررسی‌های کسب‌وکار دانشگاه هاروارد دارد با عنوان Competing Analytics.

دیونپورت این مقاله را با استدلالی ساده، اما مهم و تعیین‌کننده شروع می‌کند:

«اگر بخواهید کسب و کار خود را صرفاً با تکیه بر ویژگی‌های محصول خود از دیگران متمایز کنید راه به جایی نخواهید برد. رقبا هم به منابعی که شما دسترسی دارید دسترسی دارند و ویژگی‌هایی شبیه به ویژگی‌های محصول شما را توسعه می‌دهند.»

او چاره کار را در ایجاد مزیت رقابتی مبتنی بر «بهره‌برداریِ تحلیلی از داده‌ها» معرفی می‌کند. او معتقد است برای ایجاد تمایز با دیگران باید بهره‌برداریِ تحلیلی از داده‌ها را به عنوان بخشی جدایی‌ناپذیر از استراتژی رقابتی خود تعریف کنید.

دیونپورت در مقاله خود دستورالعملی برای این کار می‌دهد.

علیرضا کدیور این مقاله خواندنی را در وبسایت مدرسه پردازش و تحلیل داده دقیقه بررسی و تلخیص کرده است:

d-learn.ir/p/competing-analytics

@dlearn_ir
#داده‌ نسبت اشتغال به جمعیت در کشورهای جهان و شاخص نابرابری جنسیتی اشتغال

اگر می‌خواهید داده‌ای درباره بازار کار و نابرابری جنسیتی تحلیل کنید این جدول حاوی اطلاعات مهمی در این باره است:

d-learn.ir/p/employment-to-population-ratio-wb2020

این داده‌ها مربوط به نسبت اشتغال به جمعیت بالای ۱۵ سال مردان، زنان و کل جمعیت برای کشورهای جهان است که از بانک جهانی استخراج و تلفیق شده است.

-----------------------------------------------
اگر به تحلیل این نوع داده‌ها علاقه‌مندید می‌توانید برای ایده گرفتن به این مقاله در مجله دقیقه سری بزنید:
d-mag.ir/p7475
@dmag_ir
-----------------------------------------------

@dlearn_ir
🟢 تلاشی برای رتبه‌بندی دانشگاه‌های کشور

🗒 از جمله مواردی که از این داده‌ها قابل استخراج است نمونه‌ای از رتبه‌هایی است که در سه سال گذشته به صورت متوسط منجر به قبولی در برخی از رشته‌ها و دانشگاه‌ها شده‌اند. جداولی که در این قسمت عرضه شده می‌تواند برای کسانی که در حال انتخاب رشته هستند و به این رتبه‌بندی نیاز دارند نیز کاربرد داشته باشد.

📍اما مهم‌ترین بخش مقاله در واقع بخش پایانی آن است که به تحلیل رابطه رتبه منطقه و رتبه کل می‌پردازد. این تحلیل نشان می‌دهد نظام سهمیه‌بندی کنکور آنچنان که تصور می‌شود در تمامی گروه‌های آزمایشی عملکردی در راستای ارتقای عدالت اجتماعی ندارد.

به نظر می‌رسد تحلیل داده‌های بیشتری در این باره، پرده از نکات مهم بیشتری در ارتباط با نظام ارزشیابی کنکور بردارد. به همین دلیل ضرورت دارد سازمان سنجش این داده‌ها را به صورت عمومی منتشر کند.

متن کامل مقاله علیرضا کدیور و سعید مجیدی را در وبسایت مجله دقیقه مطالعه کنید:

d-mag.ir/p7811/

------------------
داده‌های این تحقیق نیز در مدرسه پردازش و تحلیل داده دقیقه در دسترس است:
d-learn.ir/p/konkour-data
@dlearn_ir

--------------
@dmag_ir