مهندسی و علم داده
4K subscribers
387 photos
174 videos
169 files
112 links
در مورد ادمین کانال :
- محمد عالیشاهی
- دکترای هوش مصنوعی دانشگاه تهران
-نائب رئیس هیات مدیره شرکت فناوران هوش مصنوعی
- مدیر ارشد پروژه های هوش مصنوعی و علم داده
-دبیر شورای حکمرانی داده انجمن هوش مصنوعی ایران
Download Telegram
Forwarded from Programming?
Media is too big
VIEW IN TELEGRAM
💥قسمت اول جلسه نوزدهم آموزش python

#step_19_python
@stepbysteplearn
Forwarded from Programming?
Media is too big
VIEW IN TELEGRAM
💥قسمت دوم جلسه نوزدهم آموزش python

#step_19B_python
@stepbysteplearn
🔆 پيش بيني 7 روند غالب فناوری در سال 2017

مجله فوربس در ماه میلادی گذشته، روندهای غالب فناوری در سال 2017 را به شرح زیر معرفی نموده است:

💡اینترنت اشیا (IOT) و فناوری خانه هوشمند:
تلاش شرکت‎های بزرگی همچون گوگل، آمازون و اپل برای ایجاد تجربه‎ای خوشایند از وسایل خانگی متصل‎به‎هم

💡واقعیت افزوده (AR) و واقعیت مجازی (VR): گسترش دامنه نفوذ این ‎فناوری‎ها به صنایعی فراتر از صنعت بازی و سرگرمی (در سال 2016، بازی پوکمون‎گو، بیش از 100 میلیون بار دانلود شد!)

💡یادگیری ماشین (ML):
استفاده از این فناوری، برای ارائه پیشنهادهای بهتر به مشتریان براساس خریدهای قبلی آن‎ها (تقویت الگوریتم سیستم‎های توصیه‎کننده خرید)

💡اتوماسیون:
اتوماتیک‎سازی فرایندهای بیشتری از سازمان‎ها و به دنبال آن، حذف بخش دیگری از مشاغل سازمانی غیر‎دانش‎بنیان

💡کلان‎داده (Big Data) کیفی:
حرکت از تحلیل‎های کمی و عددی داده به سمت تحلیل‎های کیفی و انسانی

💡یکپارچگی دیجیتالی/ فیزیکی:
تلاش کسب‎و‎کارهای سنتی برای استفاده بیشتر از خدمات دیجیتالی و حرکت کسب‎و‎کارهای دیجیتالی به سمت خدمات فیزیکی

💡همه‎چیز مطابق‎میل (Everything on Demand):
رواج بیشتر هزاران اپلیکیشن موبایل، برای مرتفع‎نمودن درصد بیشتری از خواسته‎های مشتریان، به طریق سهل و خوشايند

Telegram.me/ToseEghtesad
کتاب بسیار زیبا و پر محتوای هادوپ.

در این کتاب که به زبان لاتین هست بصورت کامل و جامع با #هادوپ و متعلقات آن آشنا خواهید شد.
چالشها و خصوصیات کلان داده

حجم داده (Volume): حجم داده های درون سازمان و خارج آن به مدد پدیده اینترنت، دستگاه های الکترونیکی و موبایل ها، زیر ساخت های شبکه و سایر منابع هر ساله رشد نمایی دارد و پیش بینی شده است که تا سال ۲۰۲۰ ما ده زتابایت داده در جهان خواهیم داشت.

نرخ تولید (Velocity): داده ها از طریق برنامه های کاربردی و سنسورهای بسیار زیادی که در محیط وجود دارند با سرعت بسیار زیاد و به صورت بلادرنگ تولید می شوند که اغلب باید در لحظه پردازش و ذخیره شوند.

تنوع (Variety): انواع منابع داده و تنوع در نوع داده بسیار زیاد می باشد که در نتیجه ساختارهای داده ای بسیار زیادی وجود دارد و بیشتر حجم داده دنیا هم بی­ساختار و بسیار متنوع است. بخشی از داده­ها امروزه در بانکهای اطلاعاتی، بخشی در صفحات وب، بخشی به صورت XML و JSON و بقیه نیز در فایلها با قالب های متفاوت ذخیره شده اند که عمل پردازش آنها را پیچیده می­کند.
صحت (Veracity): با توجه به اینکه داده ها از منابع مختلف دریافت میشوند، ممکن است نتوان به همه آنها اعتماد کرد. مثلا در یک شبکه اجتماعی، ممکن است نظرهای زیادی در خصوص یک موضوع خاص ارائه شود. اما اینکه آیا همه آنها صحیح و قابل اطمینان هستند، موضوعی است که نمیتوان به سادگی از کنار آن در حجم بسیار زیادی از اطلاعات گذشت.

اعتبار (Validity): با فرض اینکه دیتا صحیح باشد، ممکن است برای برخی کاربردها مناسب نباشد یا به عبارت دیگر از اعتبار کافی برای استفاده در برخی از کاربردها برخوردار نباشد.
نوسان (Volatility): سرعت تغییر ارزش داده های مختلف در طول زمان میتواند متفاوت باشد. در کاربردهایی نظیر تحلیل ارز و بورس، داده با نوسان زیادی مواجه هستند و داده ها به سرعت ارزش خود را از دست میدهند و مقادیر جدیدی به خود می گیرند. اگرچه نگهداری اطلاعات در زمان طولانی به منظور تحلیل تغییرات و نوسان داده ها حائز اهمیت است. افزایش دوره نگهداری اطلاعات، مسلما هزینه های پیاده سازی زیادی را دربر خواهد داشت که باید در نظر گرفته شود.

نمایش (Visualization): یکی از کارهای مشکل در حوزه کلان داده، نمایش اطلاعات است. اینکه بخواهیم کاری کنیم که حجم عظیم اطلاعات با ارتباطات پیچیده، به خوبی قابل فهم و قابل مطالعه باشد از طریق روش های تحلیلی و بصری سازی مناسب اطلاعات امکان پذیری است.
ارزش (Value): آیا هزینه ای که برای نگهداری داده و پردازش آنها میشود، ارزش آن را از نظر تصمیم گیری دارد یا نه و ارزش و فایده موردنظر را برای یک سازمان خواهند داشت؟