تحلیلگری عظیم‌داده و کسب‌وکار
930 subscribers
42 photos
39 videos
52 files
436 links
📌تحلیلگری عظیم داده و کسب و کار؛

🔎Big Data and Business Analytics

آموزش، پژوهش، اطلاع‌رسانی، ترویج و خدمات مشاوره حوزه تحلیلگری عظیم‌داده

سرپرست کانال: دکتر سعید روحانی، عضو هیأت علمی دانشگاه تهران

وبسایت
www.bdbanalytics.ir

ادمین کانال
@BDBA_UT
Download Telegram
📌📌 معرفی ابزار: Statwing


🖌ابزار Statwing ابزاری ساده برای تحلیل داده‌های آماری است. این تحلیلگر برای عظیم‌داده ساخته شده است. رابط مدرن آن تست‌های آماری را بطور خودکار انتخاب می‌کند. با استفاده از این ابزار می‌توانید داده‌ها را به سرعت و در چند ثانیه کاوش کنید. همچنین این ابزار در پاکسازی داده‌ها، کشف روابط و ایجاد نمودارها با سرعت بالا کمک می‌کند و اجازه می‌دهد نمودارهایی مانند نمودارهای میله‌ای، هیستوگرام‌ها و سایر نمودارهای مهم را به فرمت اکسل یا پاورپوینت ایجاد نموده و نتایج را به انگلیسی ساده ترجمه کنید. بنابراین تحلیلگرانی که با تحلیل‌های آماری ناآشنا هستند مفاهیم را به سادگی متوجه می‌شوند.



متن کامل یادداشت را در لینک زیر بخوانید:

🔗 https://bit.ly/3ffQnIY


#معرفی_ابزار
#Statwing
#مهدی_امیرصادقی

www.bdbanalytics.ir
@BigData_BusinessAnalytics
✍️مصاحبه :
🖌 اهمیت تحلیلگری عظیم داده
دکتر مارک ون ریجمنام بنیانگذار دیتافلوک و سخنران بین المللی و استراتژیست و مشاور در حوزه عظیم داده و بلاکچین و نویسنده چندین کتاب پرفروش است.

مصاحبه ترجمه شده با ایشان در خصوص اهمیت تحلیلگری عظیم داده را در لینک زیر بخوانید:

🔗 https://bit.ly/2Zxk7vi

#مصاحبه
#عظیم_داده
#تحلیلگری
#ترجمه
#Rijmenam
#آرش_قاضی_سعیدی

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیره‌سازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"


📌 بخش بیست و چهارم: مطالعه موردی - Cascading

🔸 آبشار (Cascading) یک کتابخانه جاوای منبع باز و API است که یک لایه انتزاعی برای MapReduce فراهم می‌کند. این برنامه‌نویس‌ها را قادر می‌سازد تا برنامه‌های پیچیده و مهم برای پردازش داده‌ها را که روی خوشه‌های Hadoop اجرا می‌شوند، ایجاد کنند. این فصل از کتاب با مقدمه‌ای بر مفاهیم اصلی Cascading آغاز می‌شود، سپس در یک مطالعه موردی با مروری بر نحوه استفاده ShareThis از Cascading در زیرساخت‌های خود به پایان می‌رسد.

برای خواندن این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/39zdlsE

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_بیست_و_چهارم
#ساینا_رتبه‌ای

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📚 معرفی کتاب
“Mastering Large Datasets with Python"

✍️ نویسنده: John T. Wolohan

✍️ سال انتشار: 2020

✍️انتشارات: Manning Publications

📌راهکارهای مبتنی بر علم داده نیاز به مقیاس‌پذیری دارند. کتاب "خبرگی در مجموعه‌ داده‌های بزرگ توسط Python" به خواننده می‌آموزد تا چگونه یک پروژه کوچک را به گونه‌ای پیاده‌سازی کند تا امکان مقیاس‌پذیری آن میسر شود. نحوه استفاده از ابزارهای زبان برنامه‌نویسی python برای مدیریت مجموعه داده‌های بزرگ، معرفی روش‌های پردازش موازی با عملکرد بالا، آموزش فناوری‌های گسترده نظیر Hadoop و SPARK جهت به کارگیری عظیم‌داده و بررسی رایانش ابری و مدیریت عظیم‌داده توسط AWS و سرویس ذخیره‌سازی S3 بخش‌های اصلی کتاب را تشکیل می‌دهند.

📌برای خواندن ادامه مطلب و دریافت کتاب به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/31aoHPT

#معرفی_کتاب
#عظیم‌_داده
#روزبه_پیرمرادی
📌📌معرفي سرويس

🖌Gravy Analytics

🔸 داده‌های مکانی اطلاعاتی درباره مکان‌هایی است که مشتریان می‌روند و نوعاً از طریق دستگاه‌های موبایل و با استفاده مشتریان از اپلیکیشن‌ها، محصولات و خدمات حاصل می‌گردد و هنگامی که کسب و کاری اقدام به خرید یا جمع‌آوری این اطلاعات می‌نماید، دسترسی به اطلاعات گسترده‌ای پیدا می‌کند که عنصر اصلی آن مکان‌هایی است که کاربران موبایل در بازه زمانی مشخص مورد بازدید قرار داده‌اند. داده‌های خام شامل کدشناسایی موبایل (به صورت ناشناس)، طول و عرض جغرافیایی، برچسب زمانی و اطلاعات دستگاه موبایل می‌باشد.

🔹 بازاریابان نیازمند زمینه‌ای هستند که چرایی قرار گرفتن مشتری در مکان‌های مختلف را درک نمایند. Gravy Analytics با داشتن پایگاه داده بزرگی از رخدادهای محلی و فعالیت‌ها قادر است اطلاعاتی را در این خصوص برای تبلیغات و برندها فراهم نماید. در واقع داده به عنوان سرویس (Data as a Service) بر اساس مجموعه داده‌های مکانی تأیید شده می‌تواند نیازهای خاص کسب و کاری را برآورده سازد. این سرویس شامل مجموعه داده‌های پاکسازی شده و تأیید شده (با استفاده از فیلتر کردن و دسته‌بندی سیگنال‌های غیر دقیق و سیگنال‌های مکانی جعلی) مبتنی بر داده‌های مکانی موبایل می‌باشد.


🔻 براي خواندن اين مطلب به لينك زير مراجعه فرماييد:

🔗 https://bit.ly/33rhCNC

#معرفي_سرويس
#داده‌های_مکانی
#DaaS
#فاطمه_مظفری
📚 فایل ترجمه خلاصه کتاب ”ذخیره‌سازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"

📌 ضمن تشکر بابت همراهی شما با کانال گروه تحلیلگری عظیم داده، فایل کتاب "ذخیره‌سازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ" در قالب یک فایل جمع‌آوری شده است.

برای دریافت این فایل می‌توانید نسبت به تکمیل فرم زیر اقدام نمایید.

🔗 https://goo.gl/forms/4v4YGrI4x5RX5gnC3

لازم به ذکر است افرادی که برای فایلهای قبلی فرم را تکمیل کرده‌اند، نیازی به تکمیل فرم ندارند.

#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ



@BigData_BusinessAnalytics
www.bdbanalytics.ir
📌 معرفی مقالات داغ حوزه عظیم‌داده

“An analysis on new hybrid parameter selection model performance over big data set”


🖋نویسندگان:
Masurah Mohammad-Ali Selamat-Ondrej Krejcar-Hamido Fujita-Tao Wu

🔸انتخاب ویژگی یکی از کارهای دشوار در فرایند تحلیل داده است. انتخاب نادرست ویژگی ممکن است باعث ایجاد ابهام با رخدادی جهت تصمیم‌گیری اشتباه گردد. در فرآیند تحلیل تصمیم، چنانچه تصمیم گیرنده بتواند بهترین مدلی را بیابد که منجر به شناسایی و انتخاب و استفاده از بهترین ویژگی‌های بهینه‌سازی شده کمک می‌کند شود، به یک مزیت دست یافته‌ایم.
این مقاله یک مدل پارامترسازی جایگزین را ارائه می‌دهد که قادر به تولید مجموعه ویژگی بهینه بدون نیاز به صرف هزینه زیاد بوده که بر اساس دو مدل یکپارچه ساخته شده و می‌تواند به عنوان یک مدل جایگزین در یک فرآیند تحلیلگری عظیم‌داده مورد استفاده قرار گیرد.

🔹خلاصه و دریافت مقاله:

🔗 https://bit.ly/33OU1GR


#معرفی_مقاله
#عظیم_داده
#تحلیلگری
#آرش_قاضی_سعیدی



www.bdbanalytics.ir
@BigData_BusinessAnalytics
📌📌 معرفی ابزار: KNIME


🖌 ابزار KNIME که مخفف Konstanz Information Miner است یک ابزار منبع باز می‌باشد که برای گزارش‌دهی، ادغام، تحقیق، مدیریت روابط مشتریان، داده کاوی، تجزیه و تحلیل داده‌ها، استخراج متن و هوش کسب و کار استفاده می‌شود. این برنامه از سیستم عامل‌های لینوکس، OS X و ویندوز پشتیبانی می‌کند. این ابزار می‌تواند به عنوان جایگزین مناسبی برای SAS در نظر گرفته شود.


متن کامل یادداشت را در لینک زیر بخوانید:

🔗 https://bit.ly/2EcLUJr


#معرفی_ابزار
#KNIME
#مهدی_امیرصادقی

www.bdbanalytics.ir
@BigData_BusinessAnalytics
🔎 معرفی تجربه داخلی: شرکت دیتامون (DataMoon)

🔻شرکت دیتامون (هوش داده مهتاب) از سال 1397 سرویس‌های مختلفی را در حوزه هوش مصنوعی ارائه می‌نماید که شامل پالایش هوشمند متن، شناسایی اشیا، تشخیص چهره، حذف پس زمینه، پلاک خوان، پالایش هوشمند تصویر و ... می‌باشد.

🔸 سرویس‌ها در سه دسته پردازش تصویر، پردازش متن و پردازش صوت قرار می‌گیرند که منجر به راه‌حل‌ها و محصولاتی در حوزه تشخیص چهره، کنترل تردد، نظرکاوی در زبان فارسی، پیش‌بینی انتخابات و ... شده است و می‌تواند برای سایت‌های خبری، شبکه‌های اجتماعی، اپلیکیشن‌های موبایل و کلاس‌های مجازی آنلاین مورد استفاده قرار گیرد. همچنین از کاربردهای این سرویس‌ها در تحلیل تصاویر پزشکی برای یافتن بیماری‌ها و تحلیل داده‌های عظیم می‌باشد. در این مطلب برخی از سرویس‌ها و راه‌حل‌های ارائه شده توسط این شرکت را مورد بررسی قرار می‌دهیم.

🔺 برای خواندن این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/3j8rq3R

#تجربه_داخلی
#عظیم_داده
#هوش_مصنوعی
#فاطمه_مظفری

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📚 معرفی کتاب
“Python for Finance: Mastering Data-Driven Finance"

✍️ نویسنده: Yves Hilpisch

✍️ سال انتشار: 2018

✍️انتشارات: O'Reilly Media, Inc

📌 صنعت مالی، اخیرا بطور گسترده ای به استفاده از پایتون روی آورده است. بعضی از بزرگترین سرمایه‌گذاری‌های بانکی به این مورد اختصاص یافته تا سیستم‌های مدیریت ریسک و هسته تجاری آنها را ایجاد کند. این کتاب در حالیکه برای پایتون 3 به روزرسانی گردیده است، به شما کمک می‌نماید تا با یادگیری زبان پایتون و راهنمایی توسعه دهندگان و تحلیلگران کمی از طریق کتابخانه‌ها و ابزارهای پایتون، به ساخت اپلیکیشن‌های مالی و تحلیل‌های مالی بپردازید.
با استفاده از مثال‌های کاربردی در طول کتاب، نویسنده به شما نشان می‌دهد که چگونه یک چارچوب بالغ را برای مشتقات و تحلیل ریسک شبیه‌سازی شده مونت‌کارلو توسعه دهید که یک مورد مطالعه واقعی و در سطح بزرگ می‌باشد.

📌برای دریافت کتاب به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/2GD3wQ5

#معرفی_کتاب
#عظیم‌_داده
#پایتون
#میثم_عسگری

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📚 فایل مطالعه‌های موردی ارائه شده در کانال

📌 ضمن تشکر بابت همراهی شما با کانال گروه تحلیلگری عظیم داده و كسب‌وكار، مطالعه‌های موردی ارائه شده در کانال در قالب یک فایل جمع‌آوری شده است.

برای دریافت این فایل می‌توانید نسبت به تکمیل فرم زیر اقدام نمایید.

🔗https://goo.gl/forms/4v4YGrI4x5RX5gnC3

لازم به ذکر است افرادی که برای فایلهای قبلی فرم را تکمیل کرده‌اند، نیازی به تکمیل فرم ندارند.

#نمونه_موردی

@BigData_BusinessAnalytics
www.bdbanalytics.ir
📌📌 معرفی ابزار: "Apache Cassandra"

🖌 یکی از ابزارهای مطرح عظیم داده در سال 2020 آپاچی کاساندرا بوده که برای مدیریت عظیم داده کاربرد فراوانی داشته و برای کار با داده‌های عظیم طراحی شده است تا کاربران بتوانند این داده‌ها را به راحتی و با سرعت بالا دریافت نمایند.

متن کامل یادداشت را در لینک زیر بخوانید:

🔗 https://bit.ly/3mrI2WG


#معرفی_ابزار
#آپاچی_کاساندرا
#cassandra
#آرش_قاضی_سعیدی

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📚 معرفی کتاب
“Big Data Analytics: Systems, Algorithms, Applications"

✍️ نویسندگان: Prabhu, C.S.R., Sreevallabh Chivukula, A., Mogadala, A., Ghosh, R., Livingston, L.M.J.

✍️ سال انتشار: 2019

✍️انتشارات: Springer

📌پدیده عظیم‌داده با شدت زیادی بر بخش‌های مختلف صنعت و کسب و کار تاثیر گذاشته است و اکوسیستم اطلاعاتی جدیدی را به منصه ظهور رسانده است. کتاب "تحلیل عظیم‌داده، سیستم‌ها، الگوریتم‌ها و کاربردها" بررسی جامعی از تکنیک‌‌ها، فن‌آوری‌ها و کاربردهای عظیم‌داده و تحلیل آن را ارائه داده است.
در حوزه کاربردها، کتاب توضیحات مفصلی را در حوزه‌های متنوع کاربرد تحلیل عظیم‌داده ارائه کرده و در حوزه تکنیک‌، تمامی الگوریتم‌های استاندارد یادگیری معرفی شده است.
همچنین مطالعات موردی از پیاده‌سازی موفق تحلیل عظیم‌داده در شرکت‌های بزرگ فناوری اطلاعات نظیر گوگل، فیس‌بوک، لینکداین، مایکروسافت و شرکت‌های فعال در سایر حوزه‌ها در کتاب گردآوری شده است.

📌برای خواندن ادامه مطلب و دریافت کتاب به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/3mC0Qm8

#معرفی_کتاب
#عظیم‌_داده
#روزبه_پیرمرادی
تابستان‌نامه

ماحصل دوازدهمین فصل از فعالیت‌های گروه تحلیلگری عظیم‌داده و کسب‌وکار، (تابستان99) در پست بعد قابل دریافت می‌باشد.

#فصلنامه_الکترونیک
#تابستان‌نامه
#میثم_عسگری
www.bdbanalytics.ir
@BigData_BusinessAnalytics
This media is not supported in your browser
VIEW IN TELEGRAM
📌📌عظیم‌داده چیست؟

🔹 در این ویدیو به دنبال یادگیری مفاهیمی همچون چیستی عظیم‌داده و داده، انواع داده، مقایسه داده ساختاریافته و بدون ساختار، داده‌های ایجاد شده بوسیله انسان و ماشین خواهیم بود.

🔸 همچنین شما می‌توانید این ویدئو را از لینک زیر تماشا نمایید.

🔗 https://bit.ly/3j0Hox2

#ويدئو
#عظیم_داده
#هادی_صداقت

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"تحلیل عظیم‌داده، سیستم‌ها، الگوریتم‌ها و کاربردها"
"Big Data Analytics: Systems, Algorithms, Applications"


📌 بخش اول: Big Data Analytics

🔸 فصل اول کتاب تحلیل عظیم داده، سیستم‌ها، الگوریتم‌ها و کاربردها، با معرفی اولیه و اهمیت عظیم داده برای کسب و کارها شروع می‌شود و سپس با بررسی تفاوت‌های ایجاد شده در عظیم داده در مقایسه با داده‌های سنتی، ضرورت به کارگیری از پردازش‌های موازی در قالب اکوسیستم هدوپ را مطرح می‌کند تا با معرفی اجزای سازنده اصلی آن در لایه‌های مختلف؛ اطلاعات کلی در مورد هدوپ را در اختیار خوانندگان قرار دهد.

برای خواندن این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/3l43u2f

#کتاب_بخوانیم
#فصل_اول
#علی_محمدی
#تحلیل_عظیم‌داده_سیستم‌ها_الگوریتم‌ها_و_کاربردها

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📌📌معرفي سرويس

🖌ATTOM Data Solutions

🔸 راه‌حل داده به عنوان سرویس (DaaS) شرکت ATTOM یک پلتفرم داده‌های املاک مبتنی بر ابر است که مدیریت داده‌ها را میسر می‌سازد. این راه‌حل به عنوان یکی از اولین ارائه دهندگان داده‌ها در این حوزه محسوب می‌شود و شامل داده‌هایی نظیر شناسایی املاک، مالکیت، آدرس، شرح حقوقی، ارزش‌ها، مالیات‌ها و خصوصیات املاک، ژئوکد، وام‌ها، تاریخچه فروش و اجازه ساخت می‌باشد. استفاده از این داده‌ها می‌تواند در کسب‌وکارهای مرتبط با این حوزه منجر به شفافیت، نوآوری و کارایی گردد.

🔹 داده‌ها بر روی پلتفرم ابری برای بیش از 155 میلیون ملک مسکونی و تجاری در ایالت متحده در انبار داده با حجم 9 ترابایت ذخیره شده و به صورت روزانه به روزرسانی می‌شود. این داده‌ها در فرآیند مدیریت داده با بیش از 20 مرحله، تأیید، استاندارد و غنی شده و به طور مستقیم بر روی پایگاه داده مبتنی بر ابر قابل دسترسی است.


🔻 براي خواندن اين مطلب به لينك زير مراجعه فرماييد:

🔗 https://bit.ly/2GpIggC

#معرفي_سرويس
#داده‌های_املاک
#DaaS
#فاطمه_مظفری
📌📌 معرفی ابزار: Apache HCatalog


🖌 ابزار HCatalog یک لایه مدیریت جداول و ذخیره‌سازی برای هدوپ است که برای کاربران با ابزارهای پردازش داده‌های مختلف مانند Pig و MapReduce امکان خواندن و نوشتن راحت‌تر داده‌ها در شبکه را فراهم می‌کند. توانایی استخراج و تلخیص جداول در HCatalog دیدی رابطه‌ای از داده‌ها را در سیستم فایل توزیع شده هدوپ (HDFS) به کاربران ارائه می‌کند و به مسائل ونگرانی کاربران درباره اینکه داده‌ها از کجا یا در چه قالبی ذخیره می‌شوند - قالب RCFile، فایل‌های متنی، SequenceFiles یا فایل‌های ORC – پاسخ می‌دهد.


متن کامل یادداشت را در لینک زیر بخوانید:

🔗 https://bit.ly/3jOzgAb


#معرفی_ابزار
#HCatalog
#مهدی_امیرصادقی