#یادگیری_ماشین
درختهای تصمیم
این حقیقت که شبکههای عصبی (به نسبت دیگر تکنیک ها) بر روی طیف گستردهای از مسائل یادگیری ماشین قابل اجرا است، باعث شده که برخی دانشمندان، شبکههای عصبی را، به عنوان الگوریتم یادگیری ماشین نهایی و برتر برشمارند. با این حال، این به این معنا نیست که شبکههای عصبی یک راه حل ساده و حتمی برای تمامی مسائل پیچیده است. در موارد مختلفی، شبکههای عصبی دچار مشکل شده و درختهای تصمیم به عنوان جایگزین مناسبی مطرح میشوند. نیاز شبکههای عصبی به دادههای حجیم و منابع محاسباتی قوی معضلی بزرگ است. تنها پس از آموزش بر روی میلیونها داده برچسب دار، موتور شناسایی تصاویر گوگل، امکان تشخیص اشیا ساده (مثل ماشینها) با دقت بالا را پیدا میکند. ولی چه تعداد تصویر ماشین، نیاز است تا به یک بچه چهار ساله معمولی نشان بدهید تا آن را بشناسد؟
ساخت درخت تصمیم
جنگلهای تصادفی
Boosting
@python_easy_learn
https://t.me/kargah2018/797
درختهای تصمیم
این حقیقت که شبکههای عصبی (به نسبت دیگر تکنیک ها) بر روی طیف گستردهای از مسائل یادگیری ماشین قابل اجرا است، باعث شده که برخی دانشمندان، شبکههای عصبی را، به عنوان الگوریتم یادگیری ماشین نهایی و برتر برشمارند. با این حال، این به این معنا نیست که شبکههای عصبی یک راه حل ساده و حتمی برای تمامی مسائل پیچیده است. در موارد مختلفی، شبکههای عصبی دچار مشکل شده و درختهای تصمیم به عنوان جایگزین مناسبی مطرح میشوند. نیاز شبکههای عصبی به دادههای حجیم و منابع محاسباتی قوی معضلی بزرگ است. تنها پس از آموزش بر روی میلیونها داده برچسب دار، موتور شناسایی تصاویر گوگل، امکان تشخیص اشیا ساده (مثل ماشینها) با دقت بالا را پیدا میکند. ولی چه تعداد تصویر ماشین، نیاز است تا به یک بچه چهار ساله معمولی نشان بدهید تا آن را بشناسد؟
ساخت درخت تصمیم
جنگلهای تصادفی
Boosting
@python_easy_learn
https://t.me/kargah2018/797
#یادگیری_ماشین
مدل سازی گروهی (یادگیری گروهی)
یکی از موثرترین شیوههای یادگیری ماشین، مدلسازی گروهی است. که همچنین به عنوان “گروهها” نیز شناخته می شود. مدلسازی گروهی، برای ساخت مدل پیشبینی کننده یکپارچه، تکنیکهای آماری را ترکیب میکند. مدلسازی گروهی، با ترکیب پیشبینیها و دنبال کردن دانش گروه است که یک دسته بندی نهایی یا خروجی با پیشبینی بهتر را ارائه میدهد.
@python_easy_learn
https://t.me/kargah2018/797
مدل سازی گروهی (یادگیری گروهی)
یکی از موثرترین شیوههای یادگیری ماشین، مدلسازی گروهی است. که همچنین به عنوان “گروهها” نیز شناخته می شود. مدلسازی گروهی، برای ساخت مدل پیشبینی کننده یکپارچه، تکنیکهای آماری را ترکیب میکند. مدلسازی گروهی، با ترکیب پیشبینیها و دنبال کردن دانش گروه است که یک دسته بندی نهایی یا خروجی با پیشبینی بهتر را ارائه میدهد.
@python_easy_learn
https://t.me/kargah2018/797
#یادگیری_ماشین
ساخت مدل با پایتون
پس از بررسی زیربنای آماری تعداد زیادی از الگوریتمها، زمان آن رسیده که یک مدل یادگیری ماشین واقعی بسازیم. با اینکه انتخابهای متنوعی برای زبان برنام هنویسی وجود دارد (همان طور که قبلاً در مورد آن بحث شد)، برای این تمرین از پایتون استفاده میکنیم چرا که یادگیری آن سریع است و برای تغییر و کار با مجموعه دادههای بزرگ، مفید و مناسب است. اگر هیچ تجربهای در برنامهنویسی با پایتون ندارید، اصلاً لازم نیست نگران باشید. هدف اصلی این فصل درک روش و قدمهای لازم برای ساخت یک مدل یادگیری ماشین ساده است.
آمادهسازی محیط کدنویسی
بارگذاری مجموعه داده
پاکسازی مجموعه داده
فرآیند پاکسازی
تقسیم مجموعه داده
انتخاب الگوریتم و تنظیم ابرپارامترها
ارزیابی نتایج
@python_easy_learn
https://t.me/kargah2018/797
ساخت مدل با پایتون
پس از بررسی زیربنای آماری تعداد زیادی از الگوریتمها، زمان آن رسیده که یک مدل یادگیری ماشین واقعی بسازیم. با اینکه انتخابهای متنوعی برای زبان برنام هنویسی وجود دارد (همان طور که قبلاً در مورد آن بحث شد)، برای این تمرین از پایتون استفاده میکنیم چرا که یادگیری آن سریع است و برای تغییر و کار با مجموعه دادههای بزرگ، مفید و مناسب است. اگر هیچ تجربهای در برنامهنویسی با پایتون ندارید، اصلاً لازم نیست نگران باشید. هدف اصلی این فصل درک روش و قدمهای لازم برای ساخت یک مدل یادگیری ماشین ساده است.
آمادهسازی محیط کدنویسی
بارگذاری مجموعه داده
پاکسازی مجموعه داده
فرآیند پاکسازی
تقسیم مجموعه داده
انتخاب الگوریتم و تنظیم ابرپارامترها
ارزیابی نتایج
@python_easy_learn
https://t.me/kargah2018/797
#یادگیری_ماشین
بهینه سازی مدل
تکنیک بهینهسازی مهم دیگر، انتخاب ویژگی است. همان طور که به خاطر دارید، در مرحله پاکسازی 9 ویژگی را حذف کردیم. الان زمان مناسبی است که درباره آن ویژگیها تجدید نظر کنید و تحلیل کنید. که آیا آنها بر روی صحت کلی مدل تاثیری دارند. ” SellerG ” ممکن است یک ویژگی جالب برای اضافه کردن به مدل باشد به خاطر اینکه احتمالا شرکت معاملات املاکی که ملک را میفروشد بر روی قیمت نهایی فروش تاثیر داشته باشد.
برعکس، حذف ویژگیها از مدل فعلی ممکن است زمان پردازش را، بدون کاهش چشمگیر دقت، کاهش بدهد، یا حتی دقت را بهبود ببخشد. برای انتخاب موثر ویژگیها، بهتر است که تغییرات ویژگیها را به تفکیک انجام دهید و نتایج را تحلیل کنید، به جای آنکه یک دفعه چندین تغییر را اعمال کنید.
@python_easy_learn
https://t.me/kargah2018/797
بهینه سازی مدل
تکنیک بهینهسازی مهم دیگر، انتخاب ویژگی است. همان طور که به خاطر دارید، در مرحله پاکسازی 9 ویژگی را حذف کردیم. الان زمان مناسبی است که درباره آن ویژگیها تجدید نظر کنید و تحلیل کنید. که آیا آنها بر روی صحت کلی مدل تاثیری دارند. ” SellerG ” ممکن است یک ویژگی جالب برای اضافه کردن به مدل باشد به خاطر اینکه احتمالا شرکت معاملات املاکی که ملک را میفروشد بر روی قیمت نهایی فروش تاثیر داشته باشد.
برعکس، حذف ویژگیها از مدل فعلی ممکن است زمان پردازش را، بدون کاهش چشمگیر دقت، کاهش بدهد، یا حتی دقت را بهبود ببخشد. برای انتخاب موثر ویژگیها، بهتر است که تغییرات ویژگیها را به تفکیک انجام دهید و نتایج را تحلیل کنید، به جای آنکه یک دفعه چندین تغییر را اعمال کنید.
@python_easy_learn
https://t.me/kargah2018/797
مقایسه کارکردهای پایتون و R
همواره یکی از چالشهای متخصصین علمداده، تحلیلگران داده و... انتخاب از میان دو زبان برنامهنویسی پایتون یا R براساس میزان قابلیتهای آنها میباشد. در ادامه بر اساس نظر بیش از 23 هزار نفر در سایت Kaggle برخی نکات از میزان استفاده از این دو زبان برنامه نویسی در حوزههای علومداده، توسعه دهنده نرمافزار، تحلیلگر داده، مهندسین داده و... ذکر شده است.
▪️بیش از 90 درصد از توسعهدهندگان نرمافزار و مهندسین داده از زبان پایتون استفاده میکند.
▪️ بیش از 75 درصد از متخصصین علمداده از پایتون بهعنوان زبان برنامهنویسی اول استفاده میکنند.
▪️بیشترین استفاده زبان R در حوزههای متخصص آمار، تحلیلگر داده و تحلیلگر کسبوکار بوده است.
◾️در 15 حوزه کار تنها در جایگاه متخصص آماری میزان استفاده زبان R از پایتون بیشتر میباشد.
پینوشت:
🔸اگر قصد فعالیت تخصصی در پروژههای علمداده را دارید نیازمند فراگیری هر دو زبان پایتون و R خواهید بود تا فراخور به نوع پروژه و قابلیتهای هر یک از این دو زبان برنامهنویسی بتوانید پروژه را بهصورت بهینه پیادهسازی و مدیریت نمایید.
🔸 اگر قصد انتخاب تنها یکزبان برنامهنویسی را از میان پایتون و R دارید زبان پایتون انتخاب بهتری خواهد بود.
@python_easy_learn
همواره یکی از چالشهای متخصصین علمداده، تحلیلگران داده و... انتخاب از میان دو زبان برنامهنویسی پایتون یا R براساس میزان قابلیتهای آنها میباشد. در ادامه بر اساس نظر بیش از 23 هزار نفر در سایت Kaggle برخی نکات از میزان استفاده از این دو زبان برنامه نویسی در حوزههای علومداده، توسعه دهنده نرمافزار، تحلیلگر داده، مهندسین داده و... ذکر شده است.
▪️بیش از 90 درصد از توسعهدهندگان نرمافزار و مهندسین داده از زبان پایتون استفاده میکند.
▪️ بیش از 75 درصد از متخصصین علمداده از پایتون بهعنوان زبان برنامهنویسی اول استفاده میکنند.
▪️بیشترین استفاده زبان R در حوزههای متخصص آمار، تحلیلگر داده و تحلیلگر کسبوکار بوده است.
◾️در 15 حوزه کار تنها در جایگاه متخصص آماری میزان استفاده زبان R از پایتون بیشتر میباشد.
پینوشت:
🔸اگر قصد فعالیت تخصصی در پروژههای علمداده را دارید نیازمند فراگیری هر دو زبان پایتون و R خواهید بود تا فراخور به نوع پروژه و قابلیتهای هر یک از این دو زبان برنامهنویسی بتوانید پروژه را بهصورت بهینه پیادهسازی و مدیریت نمایید.
🔸 اگر قصد انتخاب تنها یکزبان برنامهنویسی را از میان پایتون و R دارید زبان پایتون انتخاب بهتری خواهد بود.
@python_easy_learn
دوره آنلاین یادگیری ماشین با پایتون
📄سرفصل
✅مروی بر پایتون و ماژول های
matplotlib,numpy,pandas
✅یادگیری ماشین، یادگیری نظارت شده، نظارت نشده، نیمه نظارت شده، خوشه بندی و کاهش بعد
✅کمیت های آماری
✅رگرسیون خطی، مربع r؛ برازش و پیش بینی، رگرسیون لجستیک
✅دسته بندی ها: الگوریتم k همسایه نزدیک، درخت تصمیم گیری، جنگل تصادفی
✅آموزش ماژول sk-learn
📆زمان برگزاری جمعه ها 3 و10 و 17 اردیبهشت ساعت 10 تا 14 (مجموعا 12 ساعت)
🎥برگزار کننده: شرکت آتی پژوهش امیرکبیر
@kargah2018
📱کانال آکادمی پایتون
@python_easy_learn
☎️جهت ثبت نام و کسب اطلاع
@kargah68
📄سرفصل
✅مروی بر پایتون و ماژول های
matplotlib,numpy,pandas
✅یادگیری ماشین، یادگیری نظارت شده، نظارت نشده، نیمه نظارت شده، خوشه بندی و کاهش بعد
✅کمیت های آماری
✅رگرسیون خطی، مربع r؛ برازش و پیش بینی، رگرسیون لجستیک
✅دسته بندی ها: الگوریتم k همسایه نزدیک، درخت تصمیم گیری، جنگل تصادفی
✅آموزش ماژول sk-learn
📆زمان برگزاری جمعه ها 3 و10 و 17 اردیبهشت ساعت 10 تا 14 (مجموعا 12 ساعت)
🎥برگزار کننده: شرکت آتی پژوهش امیرکبیر
@kargah2018
📱کانال آکادمی پایتون
@python_easy_learn
☎️جهت ثبت نام و کسب اطلاع
@kargah68
🎲 دوره فصل بهار : پایتون مقدماتی تا پیشرفته (آنلاین)
🎁50 درصدتخفیف ویژه ثبت نام زود هنگام
🛫 مناسب برای مهاجرت شغلی یا تحصیلی به #آمریکا، #اروپا و #استرالیا
✅بدون نیاز به دانش قبلی در کد نویسی
🔬 48 ساعت آموزش انلاین
⏱گروه a
روزهای یکشنبه و سه شنبه ساعت 20 تا 22
17فروردین تا 25خرداد
⏱گروه b
روزهای شنبه، دوشنبه و چهارشنبه ساعت 18 تا 20 از 4 اردیبهشت تا 27 خرداد
⏱گروه c
روزهای یکشنبه،سه شنبه، پنج شنبه، ساعت 18 تا 20 از 5 اردیبهشت تا 28خرداد
📋سرفصل
🖥معرفی پایتون،متغیرها، عبارات، دستورات و عملگرها،توابع،شرطی ها و بازگشت،توابع نتیجه دار،تکرار،رشته ها،لیست ها،چند تایی ها،دیکشنری ها،فایل ها،کلاس ها و اشیا, توابع, متدها،مجموعه های اشیا,وراثت, لیست های پیوندی,پشته ها,صف ها,درخت ها
🖥آموزش ماژول های۱:
math, re, random, statistics
🖥آموزش و نصب ماژول های۲:
numpy, pandas, scipy, matplotlib,
pygame
🖥انجام مثال های کاربردی متعدد در زمینه محاسبات علمی/عددی/اماری، کد نویسی چندین بازی, سیستم نوبت دهی و رزرو و...
🧑🏫مدرس: دکتر ذبیح الله ذبیحی - پژوهشگر پسا دکتری و مدرس دانشگاه صنعتی امیرکبیر، پژوهشگر پیشین آزمایشگاه نانوبایو حسگر دانشگاه کامپلوتنسه مادرید، پژوهشگر برتر دانشگاه صنعتی امیرکبیر در سال 96- مدرس دوره های شبیه سازی و نرم افزار های تخصصی
🎥برگزار کننده: شرکت آتی پژوهش امیرکبیر
@kargah2018
📱کانال آکادمی پایتون
@python_easy_learn
📲کانال استخدام پایتون
@python_jobs_announce
📲کانال اپلای
https://t.me/joinchat/R6A3mXMv4fQNyK6h
☎️جهت ثبت نام و کسب اطلاع
@kargah68
🎁50 درصدتخفیف ویژه ثبت نام زود هنگام
🛫 مناسب برای مهاجرت شغلی یا تحصیلی به #آمریکا، #اروپا و #استرالیا
✅بدون نیاز به دانش قبلی در کد نویسی
🔬 48 ساعت آموزش انلاین
⏱گروه a
روزهای یکشنبه و سه شنبه ساعت 20 تا 22
17فروردین تا 25خرداد
⏱گروه b
روزهای شنبه، دوشنبه و چهارشنبه ساعت 18 تا 20 از 4 اردیبهشت تا 27 خرداد
⏱گروه c
روزهای یکشنبه،سه شنبه، پنج شنبه، ساعت 18 تا 20 از 5 اردیبهشت تا 28خرداد
📋سرفصل
🖥معرفی پایتون،متغیرها، عبارات، دستورات و عملگرها،توابع،شرطی ها و بازگشت،توابع نتیجه دار،تکرار،رشته ها،لیست ها،چند تایی ها،دیکشنری ها،فایل ها،کلاس ها و اشیا, توابع, متدها،مجموعه های اشیا,وراثت, لیست های پیوندی,پشته ها,صف ها,درخت ها
🖥آموزش ماژول های۱:
math, re, random, statistics
🖥آموزش و نصب ماژول های۲:
numpy, pandas, scipy, matplotlib,
pygame
🖥انجام مثال های کاربردی متعدد در زمینه محاسبات علمی/عددی/اماری، کد نویسی چندین بازی, سیستم نوبت دهی و رزرو و...
🧑🏫مدرس: دکتر ذبیح الله ذبیحی - پژوهشگر پسا دکتری و مدرس دانشگاه صنعتی امیرکبیر، پژوهشگر پیشین آزمایشگاه نانوبایو حسگر دانشگاه کامپلوتنسه مادرید، پژوهشگر برتر دانشگاه صنعتی امیرکبیر در سال 96- مدرس دوره های شبیه سازی و نرم افزار های تخصصی
🎥برگزار کننده: شرکت آتی پژوهش امیرکبیر
@kargah2018
📱کانال آکادمی پایتون
@python_easy_learn
📲کانال استخدام پایتون
@python_jobs_announce
📲کانال اپلای
https://t.me/joinchat/R6A3mXMv4fQNyK6h
☎️جهت ثبت نام و کسب اطلاع
@kargah68
📣📣📣
در صورتی که مجموعه گروه های ما براتون مفید بوده، ما رو به دوستان تان هم معرفی بفرمایید
گروه مقاله نویسی
https://t.me/joinchat/Q6zlEYTK-eGrHJbW
گروه جذب هیئت علمی
https://t.me/joinchat/Su3EqOeTAxqF0-dr
گروه آزاد سازی مدارک تحصیلی(اپلای)
https://t.me/joinchat/TUFbH5BnDh1CJQSy
گروه پسا دکتری
https://t.me/joinchat/QDZp67VjdSUEtarN
گروه شبیه سازی و مدلسازی
https://t.me/joinchat/SSXc28eOE_Mzyj7y
کانال اپلای
https://t.me/joinchat/R6A3mXMv4fQNyK6h
کانال آکادمی زبان برنامه نویسی R
@R_easy_learn
کانال آکادمی پایتون
@python_easy_learn
کانال استخدام پایتون
@python_jobs_announce
کانال کوییز زبان
@online1_quiz1
کانال آتی پژوهش امیرکبیر
@kargah2018
در صورتی که مجموعه گروه های ما براتون مفید بوده، ما رو به دوستان تان هم معرفی بفرمایید
گروه مقاله نویسی
https://t.me/joinchat/Q6zlEYTK-eGrHJbW
گروه جذب هیئت علمی
https://t.me/joinchat/Su3EqOeTAxqF0-dr
گروه آزاد سازی مدارک تحصیلی(اپلای)
https://t.me/joinchat/TUFbH5BnDh1CJQSy
گروه پسا دکتری
https://t.me/joinchat/QDZp67VjdSUEtarN
گروه شبیه سازی و مدلسازی
https://t.me/joinchat/SSXc28eOE_Mzyj7y
کانال اپلای
https://t.me/joinchat/R6A3mXMv4fQNyK6h
کانال آکادمی زبان برنامه نویسی R
@R_easy_learn
کانال آکادمی پایتون
@python_easy_learn
کانال استخدام پایتون
@python_jobs_announce
کانال کوییز زبان
@online1_quiz1
کانال آتی پژوهش امیرکبیر
@kargah2018
#علم_داده
بسیاری از ما شنیدهایم که علم داده (Data Science) علمِ دنیای فرداست و متخصصان علم داده به سرعت توسط کسب و کارها جذب میشوند؛ اما شاید فرصتی پیش نیامده باشد تا دربارهی قلمرو علم داده و زیرمجموعههای آن مطالعه کنیم.
با این فرض، میخواهیم در این درس به صورت بسیار مختصر به تعریف علم داده و معرفی دانشها و مهارتهای وابسته به آن بپردازیم.
آیا ما هم با دستاوردهای علم داده سر و کار داریم؟
ممکن است در نگاه اول به نظر برسد که بحث علم داده، یک بحث تخصصی برای محققان است و انسانهای عادی، با دستاوردهای آن سر و کار ندارند (یا اینکه هنوز سر و کار ندارند)، اما چنین فرضی درست نیست:
هر بار که به جستجو در گوگل میپردازیم؛
هر بار که یک وبسایت را باز میکنیم و تبلیغاتی متناسب با سلیقهی ما نمایش داده میشود؛
هر بار که آمازون یا سایتهای خردهفروشی دیگر، بر اساس خریدهای قبلی و انتخابهای فعلی ما، پیشنهادهای جدیدی را مطرح میکنند (موتور توصیهگر)؛
در حال استفاده از دستاوردهای علم داده هستیم. ضمن اینکه در برخی کشورهای توسعهیافته، حق بیمه، مدیریت چراغهای راهنمایی و رانندگی و توزیع امکانات و فرصتهای شهری هم با تکیه بر علم داده انجام میشود.
واقعیت این است که علم داده به معنای خاص، چند دهه قدمت دارد و به معنای عام، ریشههای آن را میتوان در قرنهای گذشته هم جستجو کرد.
اما قدرت گرفتن چند «روند» طی سالهای اخیر، باعث شده که علم داده بیش از پیش مورد توجه قرار بگیرد. از جملهی این روندها میتوان به موارد زیر اشاره کرد:
افزایش حجم دادهها (در حدی که بیگ دیتا به مسئلهی بسیاری از کسب و کارها تبدیل شد)
افزایش قدرت محاسباتی سیستمهای سختافزاری (که پیادهسازی بسیاری از پروژههای علم داده را توجیهپذیر کرد)
افزایش حجم تولید داده در اینترنت (از اطلاعات تراکنشهای انسانها و فعالیت در شبکههای اجتماعی تا دادههای گردآوری شده توسط سنسورها، مثلاً اطلاعات موقعیت فیزیکی انسانها در لحظات مختلف)
خلق روشهای جدیدتر برای تحلیل دادهها
در حال حاضر، بسیاری از کسب و کارها برای حل مسائل خود و بهخصوص سیاستگذاری و انجام اقدامهای پیشگیرانه، از علم داده کمک میگیرند.
@python_easy_learn
بسیاری از ما شنیدهایم که علم داده (Data Science) علمِ دنیای فرداست و متخصصان علم داده به سرعت توسط کسب و کارها جذب میشوند؛ اما شاید فرصتی پیش نیامده باشد تا دربارهی قلمرو علم داده و زیرمجموعههای آن مطالعه کنیم.
با این فرض، میخواهیم در این درس به صورت بسیار مختصر به تعریف علم داده و معرفی دانشها و مهارتهای وابسته به آن بپردازیم.
آیا ما هم با دستاوردهای علم داده سر و کار داریم؟
ممکن است در نگاه اول به نظر برسد که بحث علم داده، یک بحث تخصصی برای محققان است و انسانهای عادی، با دستاوردهای آن سر و کار ندارند (یا اینکه هنوز سر و کار ندارند)، اما چنین فرضی درست نیست:
هر بار که به جستجو در گوگل میپردازیم؛
هر بار که یک وبسایت را باز میکنیم و تبلیغاتی متناسب با سلیقهی ما نمایش داده میشود؛
هر بار که آمازون یا سایتهای خردهفروشی دیگر، بر اساس خریدهای قبلی و انتخابهای فعلی ما، پیشنهادهای جدیدی را مطرح میکنند (موتور توصیهگر)؛
در حال استفاده از دستاوردهای علم داده هستیم. ضمن اینکه در برخی کشورهای توسعهیافته، حق بیمه، مدیریت چراغهای راهنمایی و رانندگی و توزیع امکانات و فرصتهای شهری هم با تکیه بر علم داده انجام میشود.
واقعیت این است که علم داده به معنای خاص، چند دهه قدمت دارد و به معنای عام، ریشههای آن را میتوان در قرنهای گذشته هم جستجو کرد.
اما قدرت گرفتن چند «روند» طی سالهای اخیر، باعث شده که علم داده بیش از پیش مورد توجه قرار بگیرد. از جملهی این روندها میتوان به موارد زیر اشاره کرد:
افزایش حجم دادهها (در حدی که بیگ دیتا به مسئلهی بسیاری از کسب و کارها تبدیل شد)
افزایش قدرت محاسباتی سیستمهای سختافزاری (که پیادهسازی بسیاری از پروژههای علم داده را توجیهپذیر کرد)
افزایش حجم تولید داده در اینترنت (از اطلاعات تراکنشهای انسانها و فعالیت در شبکههای اجتماعی تا دادههای گردآوری شده توسط سنسورها، مثلاً اطلاعات موقعیت فیزیکی انسانها در لحظات مختلف)
خلق روشهای جدیدتر برای تحلیل دادهها
در حال حاضر، بسیاری از کسب و کارها برای حل مسائل خود و بهخصوص سیاستگذاری و انجام اقدامهای پیشگیرانه، از علم داده کمک میگیرند.
@python_easy_learn
#علم_داده
تعریف علم داده چیست؟
میگویند علم داده گرفتارِ جنگ تعریفها است (+). به این معنا که افراد مختلف، آن را به شکلهای متفاوتی تعریف کردهاند و چون هیچکس از تعریف دیگری راضی نیست، همه مشغول نقد تعریف یکدیگر هستند.
واقعیت این است که مدعیان تخصص علم داده هم در این میان بیتقصیر نیستند. در حدی که گاهی یک نفر که صرفاً توانایی ترسیم چند نمودار در اکسل را دارد، خود را متخصص علم داده معرفی میکند و نتیجه این میشود که عدهای میگویند: «متخصص علم داده، همان کارشناس آمار است که حقوق بیشتری میخواهد.»
اگر از این اختلافنظرها و افراطها بگذریم، میتوان گفت دو تعریف زیر تقریباً در میان غالب متخصصان علم داده پذیرفته شدهاند:
تعریف علم داده توسط براشلر و همکاران (منبع)
علم داده به ترکیب منحصربهفردی از اصول و روشها، اعم از تحلیل، مهندسی، کارآفرینی و علم ارتباطات اشاره دارد که میکوشد از دادهها، ارزش اقتصادی خلق کند.
تعریف علم داده توسط کِهِلِر (منبع)
علم داده شامل مجموعهای از اصول، مسائل، الگوریتمها و فرایندهاست که برای استخراج الگوهای غیرواضح و قابلاستفاده از حجم بزرگ دادهها بهکار گرفته میشود.
این الگوها واضح نیستند؛ به این معنا که غالباً با تحلیل شهودی کارشناسان، نمیتوان آنها را یافت و درک کرد.
این الگوها کاربردی هستند؛ به این معنا که صرفاً دادههای پیش رو را توصیف نمیکنند؛ بلکه مسیری برای اقدام عملی در اختیار ما میگذارند.
@python_easy_learn
تعریف علم داده چیست؟
میگویند علم داده گرفتارِ جنگ تعریفها است (+). به این معنا که افراد مختلف، آن را به شکلهای متفاوتی تعریف کردهاند و چون هیچکس از تعریف دیگری راضی نیست، همه مشغول نقد تعریف یکدیگر هستند.
واقعیت این است که مدعیان تخصص علم داده هم در این میان بیتقصیر نیستند. در حدی که گاهی یک نفر که صرفاً توانایی ترسیم چند نمودار در اکسل را دارد، خود را متخصص علم داده معرفی میکند و نتیجه این میشود که عدهای میگویند: «متخصص علم داده، همان کارشناس آمار است که حقوق بیشتری میخواهد.»
اگر از این اختلافنظرها و افراطها بگذریم، میتوان گفت دو تعریف زیر تقریباً در میان غالب متخصصان علم داده پذیرفته شدهاند:
تعریف علم داده توسط براشلر و همکاران (منبع)
علم داده به ترکیب منحصربهفردی از اصول و روشها، اعم از تحلیل، مهندسی، کارآفرینی و علم ارتباطات اشاره دارد که میکوشد از دادهها، ارزش اقتصادی خلق کند.
تعریف علم داده توسط کِهِلِر (منبع)
علم داده شامل مجموعهای از اصول، مسائل، الگوریتمها و فرایندهاست که برای استخراج الگوهای غیرواضح و قابلاستفاده از حجم بزرگ دادهها بهکار گرفته میشود.
این الگوها واضح نیستند؛ به این معنا که غالباً با تحلیل شهودی کارشناسان، نمیتوان آنها را یافت و درک کرد.
این الگوها کاربردی هستند؛ به این معنا که صرفاً دادههای پیش رو را توصیف نمیکنند؛ بلکه مسیری برای اقدام عملی در اختیار ما میگذارند.
@python_easy_learn
#علم_داده
آیا علم داده همان داده کاوی است؟
گاهی اوقات علم داده (Data Science) را با داده کاوی (Data Mining) و گاه با یادگیری ماشین (Machine Learning) مترادف در نظر میگیرند.
گاهی هم پیش میآید که آن را زیرمجموعهی علم آمار فرض میکنند. اما منطقیتر است که برای علم داده تعریف گستردهتری در نظر بگیریم. زیرا:
علم داده ، بر خلاف داده کاوی، تمام فرایند مرتبط با داده، از گردآوری اولیه تا عرضهی محصول مبتنی بر دادهها را در برمیگیرد و صرفاً به تحلیل داده محدود نیست.
علم داده بر خلاف روش غالب در آمار، معمولاً از جنبهی توصیفی و استنتاجی فاصله میگیرد و میکوشد بر اساس دادههای موجود، به پیشبینی و تجویز بپردازد.
بنابراین بهتر است علم داده را به معنای عامتر در نظر بگیریم و فرض کنیم سایر شاخهها (مثل آمار، داده کاوی و یادگیری ماشینی) دستاوردهای خود را در اختیار علم داده قرار میدهند.
@python_easy_learn
آیا علم داده همان داده کاوی است؟
گاهی اوقات علم داده (Data Science) را با داده کاوی (Data Mining) و گاه با یادگیری ماشین (Machine Learning) مترادف در نظر میگیرند.
گاهی هم پیش میآید که آن را زیرمجموعهی علم آمار فرض میکنند. اما منطقیتر است که برای علم داده تعریف گستردهتری در نظر بگیریم. زیرا:
علم داده ، بر خلاف داده کاوی، تمام فرایند مرتبط با داده، از گردآوری اولیه تا عرضهی محصول مبتنی بر دادهها را در برمیگیرد و صرفاً به تحلیل داده محدود نیست.
علم داده بر خلاف روش غالب در آمار، معمولاً از جنبهی توصیفی و استنتاجی فاصله میگیرد و میکوشد بر اساس دادههای موجود، به پیشبینی و تجویز بپردازد.
بنابراین بهتر است علم داده را به معنای عامتر در نظر بگیریم و فرض کنیم سایر شاخهها (مثل آمار، داده کاوی و یادگیری ماشینی) دستاوردهای خود را در اختیار علم داده قرار میدهند.
@python_easy_learn
🤲🏼سُبْحانَكَ يا لا اِلهَ اِلاّ اَنْتَ الْغَوْثَ الْغَوْثَ خَلِّصْنا مِنَ النّارِ يا رَبِّ🤲🏼
🤲التماس دعا🤲
🤲التماس دعا🤲