کانال علم داده ایران
2.91K subscribers
145 photos
12 videos
12 files
327 links
وبلاگ اجتماعی متخصصان علم داده ایران مرتبط با این کانال است
Dataio.ir
در این وبلاگ اجتماعی افراد متخصص در حوزه علوم داده و یادگیری ماشین می‌توانند تجربیات، مطالعات و تحقیقات خود را با دیگران به اشتراک بگذارند
ارتباط با بنده:
@masoudkaviani
Download Telegram
💻 معرفی پکیج TidyVerse برای دانشمندان علوم داده در زبان R

پکیج TidyVerse یکی از پکیج های مطرح در حوزه داده کاوی در زبان R است. این پکیج مجموعه بزرگی از پکیج های دیگر آماده برای زبان R را جهت پروژه های داده کاوی در خود دارد و به راحتی میتوانید از این پکیج های آماده در پروژه های داده کاوی استفاده کنید. وب سایت مرجع این پکیج:
👉 https://www.tidyverse.org

همچنین یک آموزش بسیار خوب از این پکیج و امکانات مختلف آن در اینجا آمده است:
👉 https://monashbioinformaticsplatform.github.io/r-more/topics/tidyverse.html

یادگیری داده کاوی در @learn_dm
Forwarded from Alireza Akhavan
@CVision
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
آموزشهای مرتبط با تنسرفلو
بینایی ماشین و پردازش تصویر
و ...
📃 منابع رایگان آموزشی چهارچوب Caffe جهت یادگیری عمیق

همان طور که میدانید، Caffe یک چهارچوب بسیار قوی برای یادگیری عمیق(Deep Learning) در علوم کامپیوتر و هوش مصنوعی است. این چهارچوب که در دانشگاه برکلی توسعه داده شده، مورد استفاده بسیاری از دانشمندان علم داده قرار میگیرد. در زیر سعی داریم چندین منبع رایگان و کاربردی جهت یادگیری این چهارچوب قرار دهیم:

» پی دی اف آموزشی از وب سایت دانشگاه Carnegie Mellon:
👉 http://graphics.cs.cmu.edu/courses/16-824/2016_spring/slides/caffe_tutorial.pdf

» پی دی اف که شامل یک آموزش کوتاه و مفید است:
👉 http://3dvision.princeton.edu/courses/COS598/2015sp/slides/Caffe/caffe_tutorial.pdf

» پی دی اف آموزشی که شبکه های عصبی عمیق را همراه با Caffe آموزش می دهد:
👉 http://www.panderson.me/images/Caffe.pdf

» اسلاید های درس شبکه عصبی Convolutional دانشگاه Stanford:
👉 http://vision.stanford.edu/teaching/cs231n/slides/2015/caffe_tutorial.pdf

» و صفحه از وب سایت Adil Moujahid:
👉 http://adilmoujahid.com/posts/2016/06/introduction-deep-learning-python-caffe

منابع آموزش یادگیری عمیق @learn_dm
💻 منبع آموزش متلب و داده کاوی

نرم افزار متلب به همراه پکیج های مختلف و متفاوت، نرم افزاری کاربردی جهت عملیات داده کاوی و یادگیری ماشین است. دو لینک پایین از دانشگاه MIT قرار دادیم که توسط آن متلب و عملیات مختلف داده کاوی در متلب آموزش داده شده است:

👉 http://www.math.mtu.edu/~msgocken/intro/intro.html
👉 http://web.mit.edu/acmath/matlab/course16/16.62x/16.62x_Matlab.pdf

منابع آموزش داده کاوی @learn_dm
Forwarded from Chistio | دروس پیشرفته علوم داده و نرم افزار
⬇️ دانلود رایگان آموزش نصب پایتون anaconda و eclipse در ویندوز یا لینوکس مخصوص متخصصان علوم داده

نرم افزار anaconda در واقع مجموعه ای از کتابخانه های رایگان زبان پایتون مخصوص دانشمندان و متخصصان داده کاوی و یادگیری ماشین است. در این آموزش نحوه نصب و ارتباط این نرم افزار با eclipse آموزش داده شده است تا محققان داده کاوی راحت تر بتوانند عملیات داده کاوی و یادگیری ماشین را انجام دهند.
لینک دانلود:
👉 chistio.ir/?p=492

مرکز مطالعات پیشرفته مهندسی نرم افزار
@chistio
جهت ثبت نام و کسب اطلاعات بیشتر به لینک های زیر مراجعه نمایید.
http://cssbu.ir/

http://conf.sbu.ac.ir/index.php/data/data

@cssbu
Forwarded from Chistio | دروس پیشرفته علوم داده و نرم افزار
📃 با سلام خدمت اساتید و دانشجویان گرامی

مرکز مطالعات و تحقیقات پیشرفته مهندسی نرم افزار و علوم داده، با تمرکز بر مباحث کاربردی تحصیلات تکمیلی، ایجاد شده است
عضویت در کانال:
@chistio
وب سایت:
Chistio.ir
Forwarded from Iman Kermani
برای اطالاعات بیشتر با ما تماس بگیرید.
📃 معرفی الگوریتم CatBoost

الگوریتم CatBoost یکی از الگوریتم های طبقه بندی با قدرت بالا و مناسب برای کار با داده های categorical میباشید. این الگوریتم که توسط yandex ارائه شده است طبق گفته سازندگان، کاربرد فراوانی در بخش های مختلف شرکت yandex روسی دارد
وب سایت رسمی:
👉 https://catboost.yandex

اطلاعات بیشتر و آموزش این الگوریتم در لینک زیر:
👉 https://www.analyticsvidhya.com/blog/2017/08/catboost-automated-categorical-data/

منابع آموزشی داده کاوی @learn_dm
📋 با سلام خدمت اعضای محترم کانال

جهت تجمیع مباحث آموزشی داده کاوی و Big Data کانال آموزش تخصصی @learn_dm تشکیل شده است. رویکرد کلی کانال شامل مباحث زیر است:
» منابع روز یادگیری نرم افزار های داده کاوی و Big Data
» مطالب و دوره های آموزشی از دانشگاه معتبر جهان
» الگوریتم های مختلف و کاربرد آن ها در صنعت داده کاوی و مه داده
» مقالات مختلف و کاربردی مختص پایان نامه دانشجویان ارشد و رساله دکتری

عضویت در کانال:
👉 @learn_dm
💻 کتابخانه و منابع آموزشی گراف کاوی(Graph Mining)

تحلیل گراف و گراف کاوی یکی از زیر مجموعه های بزرگ و بسیار پرکاربرد در علوم داده می باشد. از تحلیل گراف در شبکه های اجتماعی و هر کجا که روابط زیاد ارجحیت داشته باشند استفاده می شود. در زیر چند ابزار و منبع آموزشی برای علاقه مندان این حوزه می آوریم:

» کتاب SMM Book از آقای زعفرانی و همکاران:
👉 http://dmml.asu.edu/smm/book

» کتابخانه NetworkX در زبان پایتون(که آموزش های خوبی هم در وب سایتش موجود هست):
👉 https://networkx.github.io

» کتابخانه IGraph در زبان R که شامل آموزش در وب سایت هست
👉 http://igraph.org/r

» گراف کاوی کاربردی در زبان R به همراه کدها
👉 https://www.csc2.ncsu.edu/faculty/nfsamato/practical-graph-mining-with-R/PracticalGraphMiningWithR.htm

» دو ابزار گراف کاوی در زبان JAVA
👉 https://github.com/ehab-abdelhamid/GraMi
👉 https://github.com/peterrodgers/dover

منابع آموزشی داده کاوی و مه داده @learn_dm
📋 چگونه PyTorch را یادبگیریم؟

کتابخانه PyTorch که در شرکت فیسبوک توسعه یافته است یکی از کتابخانه های قوی جهت پیاده سازی عملیات مربوط به شبکه های عصبی عمیق می باشد. این کتابخانه قادر است بر روی CPU و یا GPU کار کند و یادگیری آن ساده و کاربرد آن بسیار زیاد است. در زیر چند منبع آموزشی جهت یادگیری این کتابخانه را می آوریم:

👉 http://pytorch.org/tutorials/beginner/deep_learning_60min_blitz.html

👉 http://pytorch.org/tutorials/beginner/pytorch_with_examples.html

👉 https://github.com/yunjey/pytorch-tutorial

👉 https://iamtrask.github.io/2017/01/15/pytorch-tutorial/

👉 https://towardsdatascience.com/pytorch-tutorial-distilled-95ce8781a89c

منابع یادگیری عمیق و داده کاوی @learn_dm
📋 کارگاه آموزشی-عملی یادگیری عمیق در محیط تنسورفلو در مرکز تحقیقات مه داده دانشگاه آزاد نجف آباد
روزهای سه شنبه ۳۰آبان و چهارشنبه ۱آذرماه
ساعت ۱۳الی۱۷
اطلاعات بیشتر و ثبت نام:
👉 https://goo.gl/hZWc1W
📒 معرفی کتاب رایگان یادگیری مبتنی بر آمار با زبان برنامه نویسی R

همان طور که میدانید یکی از پایه های علم داده کاوی و یادگیری ماشین، علم آمار و احتمالات است. متاسفانه دانشجویان و فعالان حوزه داده کاوی، مخصوصا آن دسته از دوستان که در رشته هایی غیر از ریاضیات و آمار در دانشگاه تحصیل کرده اند، معمولا با مباحث آماری این حوزه کمتر آشنا هستند.
کتاب زیر یک کتاب رایگان برای این دسته از افراد است که میتواند مبانی آموزش مبتنی بر آمار را به خوبی به دانشجویان تحصیلات تکمیلی و فعالان حوزه داده کاوی آموزشی بدهد. همچنین در این کتاب، کاربردها مبتنی بر زبان R آورده شده است.
این کتاب را میتوانید از لینک زیر دانلود کنید:
👉 http://www-bcf.usc.edu/~gareth/ISL/

منابع تخصصی آموزش داده کاوی @learn_dm
📃 آیا اسپارک باعث نابودی هدوپ خواهد شد؟

هدوپ که ابتدا توسط یاهو جهت امور پردازشی و داده ساخته شده بود، مورد استفاده بسیاری از شرکت های نرم افزاری قرار گرفت. با مرور زمان نقصان های هدوپ مشخص شد و بسیاری از شرکت ها، زیرساخت خود را به آپاچی اسپارک تغییر دادند. اما سوال اینجاست که آیا با شیوع استفاده از اسپارک، این تکنولوژی میتواند کاملا جایگزین هدوپ شود؟
در این مقاله از وب سایت kdnuggets به این مسئله پرداخته شده است
👉 https://www.kdnuggets.com/2017/11/did-spark-really-kill-hadoop.html

منابع آموزشی مه داده @learn_dm
📒 نتایج نظرسنجی محبوبترین زبان های برنامه نویسی در میان متخصصین علوم داده ایران

با شرکت بیش از ۴۰۰نفر از متخصصین و علاقه مندان حوزه علوم داده در ایران

@learn_dm
📒 چرا زبان پایتون در بین متخصصان علوم داده جهان محبوبیت پیدا کرد؟

زبان پایتون در چند سال گذشته دارای سیر صعودی از لحاظ استفاده در بین متخصصین علم داده و یادگیری ماشین در جهان بوده است. احتمالا دلایل زیر باعث محبوبیت این زبان برنامه نویسی جهت استفاده در داده کاوی شده است:

۱. پایتون یک جامعه بسیار فعال برای توسعه دارد که وظیفه توسعه این زبان را با سرعت جلو می برند
۲. پایتون اسپانسرهای قدرتمندی مانند Google دارد، که میتوان بسیار زیاد به آن اطمینان کرد
۳. پایتون کاربرد بسیار زیاد در مه داده و داده کاوی دارد
۴.کتابخانه های بسیار قدرتمند جهت انجام عملیات مختلف داده کاوی و یادگیری ماشین در پایتون موجود است
۵. سرعت، اطمینان و بهینگی این زبان برنامه سازی در اجرای برنامه ها باعث اطمینان برنامه نویس از عملکرد در دنیای واقعی می شود
۶. یادگیری آسان و وجود منابع رایگان فراوان جهت یادگیری این زبان نیز از دیگر دلایل محبوبیت این زبان برنامه نویسی است

منبع:
https://goo.gl/4ANUkQ

آموزش داده کاوی و مه داده @learn_dm
📒 ۱۰ روش که افراد شاغل در یادگیری عمیق بایستی بلد باشند

افرادی که در حوزه یادگیری عمیق کار میکنند(یا علاقه به کار دارند) میبایستی که این ۱۰روش که پایه ای جهت عملیات یادگیری عمیق می باشند را به خوبی یادبگیرند:

۱. پس انتشار خطا - Back Propagation
۲. کاهش گرادیان تصادفی - Stochastic Gradient Descent
۳. زوال نرخ یادگیری - Learning Rate Decay
۴. حذف تصادفی - Dropout
۵. جمع آوری بیشینه - Max Pooling
۶. نرمال سازی گروهی - Batch Normalization
۷. حافظه کوتاه-بلند - Long Short-Term Memmory
۸. روش Skip-Gram
۹. کوله کلمات مداوم - Continiuous Bag Of Words
۱۰. یادگیری انتقالی - Transfer Learning

هر کدام از این روش ها میتواند در برخی از مسائل حل شده توسط یادگیری عمیق استفاده شود. میتوانید با جستجو در اینترنت منابع زیادی جهت یادگیری هر کدام از این روش ها را پیدا کنید.
منبع:
https://goo.gl/7G4XS9

منابع یادگیری علوم داده @learn_dm
📚 عضویت در تیم تخصصی جهت شرکت در مسابقات جهانی داده کاوی

از دانشمندان، محققان و علاقه مندان به حوزه علوم داده و یادگیری ماشین تقاضا می شود در صورت امکان فرم حاضر را جهت عضویت در تیم 'الف' و 'ب' برای شرکت در مسابقات جهانی Kaggle، DataDrive و CrowAI تکمیل نمایند
اطلاعات تکمیلی در فرم درخواست موجود می باشد
لینک فرم درخواست عضویت:

👉 https://docs.google.com/forms/d/e/1FAIpQLSdT6h07aVkEpIJDU_jiW-kMJoDoxTuFGDJXPVeB8aKGt5bY6A/viewform

با تشکر
مسعود کاویانی
@learn_dm
📒 چگونه با هر زبان برنامه نویسی عملیات داده کاوی را انجام دهیم؟

بسیاری از دوستان که به زبان Python و یا Java تسلط و یا آشنایی ندارند و برنامه اصلی آن ها با زبان های دیگری مانند C Sharp یا PHP یا Ruby نوشته شده است، برایشان سوال است که چگونه میتوان عملیات داده کاوی و یادگیری ماشین را در پروژه هایی که مثلا با زبان PHP نوشته شده اند انجام داد؟
یکی از راه حل هایی که زیاد هم جدید نیست، استفاده از معماری میکرو سرویس(Micro Service Architecture) است. در این معماری شما با زبان Python یا Java برنامه خود را نوشته و یک واسط مانند API برای آن تعریف میکنید، به این صورت که شما یک هسته داده کاوی با پایتون یا جاوا خواهید داشت که میتواند عملیات مختلف داده کاوی را بسته به ورودی اجرا کند و نتایج را به نرم افزار دیگر شما برگرداند.
برای اطلاعات بیشتر برای نوشتن این دست برنامه ها، میتوانید به نرم افزار Docker مراجعه کنید

آموزش داده کاوی کاربردی @learn_dm
Forwarded from Trends خبرفارسی
@khabarfarsi_trends

بولتن بررسی تاثیرگذارترین سایت های خبری و اطلاع رسانی
آذرماه 1396

https://goo.gl/SjUXiT