تحلیلگری عظیم‌داده و کسب‌وکار
951 subscribers
40 photos
36 videos
50 files
416 links
📌تحلیلگری عظیم داده و کسب و کار؛

🔎Big Data and Business Analytics

آموزش، پژوهش، اطلاع‌رسانی، ترویج و خدمات مشاوره حوزه تحلیلگری عظیم‌داده

سرپرست کانال: دکتر سعید روحانی، عضو هیأت علمی دانشگاه تهران

وبسایت
www.bdbanalytics.ir

ادمین کانال
@BDBA_UT
Download Telegram
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"

☑️ بخش ششم: "توسعه برنامه MapReduce"

📌در این فصل به بررسی جنبه‌های عملی توسعه برنامه‌های MapReduce در هدوپ می‌پردازیم.

📌نوشتن یک برنامه در MapReduce یک الگوی مشخص را دنبال می‌کند. ابتدا با نوشتن تابع Map و Reduce شروع می‌شود و با تست آن‌ها از درستی کارکرد آن‌ها اطمینان حاصل خواهد شد. سپس یک برنامه را برای اجرای یک کار بنویسید که می‌تواند توسط IDE و با استفاده از یک زیرمجموعه کوچک از داده‌ها اجرا شود و در صورت اجرا نشدن، می‌توان از IDE برای اشکال‌زدایی آن استفاده کرد.

📌قبل از شروع نوشتن برنامه MapReduce، ما نیاز به تنظیم و پیکربندی محیط توسعه داریم و به همین علت نیاز داریم که اندکی در مورد آن بدانیم.


☑️برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗http://bit.do/eKtrn

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_ششم
#هادی_صداقت
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"

☑️ بخش هفتم: "Map Reduce چگونه کار می‌کند؟"

📌در این فصل، در مورد نحوه کارکرد Map Reduce Job در Hadoop بحث می‌شود و پایه خوبی را جهت نوشتن برنامه‌های پیشرفته‌تر Map Reduce را فراهم می‌کند.

📌شما می‌توانید یک Map Reduce Job را با یک روش واحد اجرا کنید . این بخش گام‌هایی را که Hadoop برای اجرای یک job انجام می‌دهد را مشخص می‌کند و پوشش می‌دهد .

☑️برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗https://bit.ly/2TPgejE

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_هفتم
#پروین_قدمی
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"

☑️ بخش هشتم: "انواع MapReduce و فرمت‌ها"

📌مپ‌ردیوس(MapReduce) یک مدل ساده از پردازش داده‌ها را دارد: ورودی‌ها و خروجی‌ها برایmap و توابع reduce جفت‌های کلید ارزش هستند. این فصل به تفصیل به مدل MapReduce می‌پردازد و به ویژه به اینکه چگونه داده‌ها در فرمت‌های مختلف از متن ساده تا اشیاء باینری ساختارمند می‌توانند با این مدل استفاده شوند.

☑️برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗https://bit.ly/2VCNuIq

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_هشتم
#ساینا_رتبه‌ای

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"

☑️ بخش نهم: "ویژگی‌های MapReduce"

📌در این فصل به برخی قابلیت‌های پیشرفته‌تر MapReduce شامل شمارنده‌ها و مرتب‌سازی (sorting) و به هم پیوستن (joining) دیتاست‌ها پرداخته شده است. همچنین توزیع داده‌های جانبی و کلاس‌های کتابخانه MapReduce معرفی شده‌اند که در ادامه به طور خلاصه به هر یک از آنها می‌پردازیم.

☑️برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗https://bit.ly/2Vs946j

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_نهم
#فاطمه_مظفری

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"

☑️ بخش دهم: "تنظیم کلاستر هدوپ

📌این بخش به توضیح چگونگی تنظیم هدوپ روی کلاستر ماشین‌ها می‌پردازد. اجرای فایل‌سیستم توزیع‌یافته هدوپ، نگاشت کاهشی و یارن بر روی یک ماشین برای یادگیری این سیستم‌ها بسیار عالی است اما برای سودمند بودن، لازم است که بر روی نودهای چدگانه اجرا شوند.

☑️برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗https://bit.ly/2EhDFc5

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_دهم
#میثم_عسگری

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"

☑️ بخش دهم: مدیریت هدوپ

📌در این فصل به دنبال روشی برای اجرای درست کلاستر هستیم و ساختار دایرکتوری namenode و سایر زیرقسمت‌های آن را بررسی خواهیم کرد.

☑️برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗https://bit.ly/2XjiApr

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_یازدهم
#هادی_صداقت

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"

☑️ بخش دوازدهم: مدیریت آورو

📌در این فصل به معرفی آورو پرداخته می شود و پس از معرفی آورو به عنوان استانداردی برای سریال سازی داده مشخص می شود که با در اختیار داشتن چنین استانداردی در تولید فایل امکان استفاده از آن داده ها در زبان های مختلف فراهم می گردد.
.

☑️برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗https://bit.ly/2wPGNI7

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_دوازدهم
#آرش_قاضی_سعیدی

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"

☑️ بخش سیزدهم: Parquet

📌فصل سیزدهم این کتاب به معرفی یک قالب ذخیرهسازی داده به نام Apache Parquet می‌پردازد.

🔸این قالب که یک شیوه ذخیرهسازی ستونی است، می‌تواند برای داده‌های تو در تو (nested) بسیار مناسب باشد. قالب‌های ستونی به این دلیل که بازدهی بهتری از نظر اندازه فایل و کارآیی query دارند، جذاب هستند. از آنجایی که داده‌های موجود در یک ستون، قالبا از یک جنس هستند، کدگذاری آنها (Encoding) آسان است. برای مثال اگر یک ستون شامل داده‌های زمانی با فواصل مشخص باشد، صرفا ذخیرهسازی داده اول و بازه‌ی زمانی بین هر دو سطر، کفایت می‌کند.


☑️برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗https://bit.ly/2LCaGoL

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_سیزدهم
#احسان_نوری

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"


📌 بخش چهاردهم: آپاچی فلوم

🔸در این فصل به معرفی ابزار Apache Flume پرداخته می‌شود که یک راه‌حل قابل اعتماد و توزیع شده برای جمع‌آوری، انباشت و انتقال مجموعه عظیم‌داده‌ است.

برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/2jYrf1V

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_چهاردهم
#آرش_قاضی_سعیدی

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"


📌 بخش پانزدهم: آپاچی اسکوپ

🔸در این فصل به معرفی ابزار Apache Sqoop پرداخته می‌شود. آپاچی اسکوپ یک ابزار متن باز است که به کاربران اجازه استخراج داده‌ها از منبع داده ساختاریافته و وارد کردن آن به هدوپ جهت پردازش‌های بیشتر را می‌دهد. این پردازش می‌تواند توسط MapReduce یا ابزارهای سطح بالاتر دیگر نظیر Hive انجام بگیرد.

برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/2VfFLAF

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_پانزدهم
#فاطمه_مظفری

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"


📌 بخش شانزدهم: آپاچی پیگ (Apache Pig)

🔸در این فصل به معرفی ابزار Apache Pig پرداخته می‌شود. Apache Pig سطح کیفیت پردازش مجموعه عظیم‌داده‌ها را افزایش می دهد. در مورد Pig، ساختار داده‌ها بسیار غنی‌تر است و به طور معمول به صورت چند منظوره و تو در تو قرار دارند و تغییراتی که می‌توانید بر روی داده‌ها اعمال کنید بسیار قدرتمندتر هستند.

برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/2BDfO56

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_شانزدهم
#هادی_صداقت

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"


📌 بخش هفدهم: آپاچی هایو (Apache Hive)

🔸در این فصل به معرفی ابزار Apache Hive پرداخته می‌شود. یكی از بزرگترین اجزا در بستر اطلاعات آپاچی هایو بوده که چارچوبی جهت ذخیره داده‌ها در هدوپ است.
برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/2pRMKV4

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_هفدهم
#آرش_قاضی_سعیدی


www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"


📌 بخش هجدهم: Apache Crunch

🔸در این فصل به معرفی ابزار Apache Crunch پرداخته می‌شود. Apache Crunch یک API با سطح بالاتر برای نوشتن pipelineهای MapReduce است. مهم‌ترین مزایای آن نسبت به MapReduce ساده، تمرکز آن بر روی برنامه‌نویسان انواع جاوا سازگار مانند رشته‌ها و اشیاء ساده قدیمی جاوا، مجموعه‌ای غنی‌تر از عملیات تبدیل داده‌ها و pipelineهای چند مرحله‌ای است.

برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/2Sb4s1t

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_هجدهم
#ساینا_رتبه‌ای


www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"


📌 بخش نوزدهم: Apache Spark

🔸در این فصل به معرفی ابزار Apache Spark پرداخته می‌شود. Apache Spark یک چارچوب محاسباتی خوشه‌ای برای پردازش داده در مقیاس بزرگ است. برخلاف بسیاری از چارچوب‌های پردازش دیگر که در این کتاب مورد بحث قرار گرفته است، Spark از MapReduce به عنوان موتور اجرا استفاده نمی‌کند. در عوض، برای اجرای کار روی یک خوشه از زمان اجرای توزیع شده خود استفاده می‌کند. Spark طوری با Hadoop یکپارچه شده است که می‌تواند YARN را اجرا کند و با فرمت‌های فایل Hadoop و پشتیبان‌های ذخیرهسازی مانند HDFS کار کند.

برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/2R6f8Oi

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_نوزدهم
#ساینا_رتبه‌ای


www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"


📌 بخش بیستم: Apache HBase

🔸در این فصل به معرفی ابزار Apache HBase پرداخته می‌شود. HBase یک پایگاه داده توزیع شده ستونی است که بر روی فایل سیستم هدوپ (HDFS) ایجاد شده است و به عنوان اپلیکیشن هدوپ هنگامی که نیازمند دسترسی تصادفی بلادرنگ برای خواندن/نوشتن در مجموعه داده‌های بسیار بزرگ می‌باشیم، مورد استفاده قرار می‌گیرد. HBase برای حل مسئله مقیاس‌پذیری از رویکرد افزایش مقیاس به صورت خطی با اضافه کردن گره‌ها استفاده می‌کند. این پایگاه داده رابطه‌ای نیست و از SQL پشتیبانی نمی‌نماید اما در فضای مناسب مسئله می‌تواند آنچه را RDBMS قادر به انجام آن نیست انجام دهد که عبارتست از دربرگرفتن جداول بسیار بزرگ و sparse بر روی خوشه‌های سخت‌افزاری.

برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/2UM2EvT

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_بیستم
#HBase
#فاطمه_مظفری


www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"


📌 بخش بیست و یکم: ZooKeeper

🔸تاکنون در این کتاب، به بررسی پردازش داده در مقیاس بزرگ پرداخته شده است. این فصل متفاوت در مورد ساخت برنامه‌های کاربردی توزیع شده عمومی با استفاده از سرویس هماهنگی توزیع شده Hadoop، به نام ZooKeeper است. نوشتن برنامه‌های توزیع شده کار سختی است. این کار در درجه اول به دلیل عدم موفقیت جزئی سخت است. وقتی یک پیام بین دو گره به شبکه ارسال می‌شود و شبکه خراب می شود ، فرستنده نمی‌داند گیرنده پیام را دریافت کرده است یا خیر. ممکن است قبل از اینکه شبکه خراب شود پیام دریافت شود، یا ممکن است دریافت نشده باشد. یا شاید پروسه گیرنده از کار بیافتد. تنها راهی که فرستنده می‌تواند متوجه شود چه اتفاقی افتاده است ، اتصال مجدد به گیرنده و سؤال از آن است. این یک شکست جزئی است: ما حتی نمی‌دانیم که یک عمل انجام نشده است. ZooKeeper نمی‌تواند شکست‌های جزئی را از بین ببرد، زیرا در اصل سیستم‌های توزیع شده هستند. مطمئناً شکست‌های جزئی را نیز پنهان نمی‌کند. اما آنچه ZooKeeper انجام می‌دهد دادن مجموعه‌ای از ابزارها برای ساختن برنامه‌های توزیع شده است که می‌تواند با اطمینان نقص جزئی را بکار بگیرد.

برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/2y0Jnzl

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_بیست_و_یکم
#ساینا_رتبه‌ای


www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"


📌 بخش بیست و دوم: نمونه مطالعاتی - داده‌های ترکیب‌شونده (Composable) در Cerner

🔸فناوری اطلاعات در حوزه سلامت عموما به اتوماسیون فرایندهای موجود محدود می‌شود. این گزاره در حال تغییر است. تقاضای بهبود کیفیت خدمات درمانی و مدیریت هزینه‌ها رو به افزایش است و این امر نیاز به سامانه‌هایی را ایجاد می‌کند که بتوانند این اهداف را بهتر برآورده سازند. این فصل از کتاب به نمونه مطالعاتی شرکت سرنر در استفاده از اکوسیستم هدوپ می‌پردازد.
سرنر یک شرکت فناوری اطلاعات با تمرکز در حوزه انفورماتیک پزشکی است. در سال 2009، شرکت سرنر نیاز داشت تا Search Indexهای رکوردهای پزشکی را بهبود دهد. این ایندکس‌ها باید از مستندات استخراج می‌گردید و ارتباط آن‌ها با سایر عبارات مشخص می‌شد. برای مثال در صورتی که عبارت بیماری قلبی توسط کاربر مورد جست و جو قرار می‌گرفت، مستندات مربوط به سکته قلبی نیز باید به کاربر برگردانده میشد.
ابزار Hadoop برای برآورده کردن یکی از مهم‌ترین‌ نیازها مناسب بود. میلیون‌ها مستند باید به صورت مداوم و در مدت زمان کوتاهی مورد بازپردازش قرار می‌گرفتند. این کار به معنی استفاده از MapReduce و قرار دادن داده‌ها در سرورهای Apache Solr بود. چالش حجم بالای داده و متفاوت بودن منابع داده‌ای باعث شد که سرنر از ابزارهای پیشرفته‌تری برای مدیریت این پیچیدگی استفاده کند.


برای خواندن ادامه این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/3fLZ8LB

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_بیست_و_دوم
#روزبه_پیرمرادی

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"


📌 بخش بیست و سوم: مطالعه موردی - علم داده در علوم زیستی

🔸 این بخش از کتاب به ارائه مطالعه موردی در خصوص به کارگیری علم داده در حوزه علوم زیستی می‌پردازد. پردازش به‌هنگام ژنوم افراد، این اجازه را به پژوهشگران خواهد داد تا مکانیزم‌های ژنتیکی مربوط به بیماری‌ها را درک کرده و این کشف‌ها را به مدل درمانی شخصی‌سازی شده جهت بهبود روند درمان آن بیماران تبدیل نمایند. ADAM پلتفرمی برای تحلیل ژنوم است که بر روی پردازش چندین پتابایت داده کامل ژنوم با پوشش بالا و سریع متمرکز شده است. این پلتفرم مبتنی بر Apache Avro ،Parquet و Spark است.

برای خواندن این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/3fDmYrO

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_بیست_و_سوم
#فاطمه_مظفری

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📖 کتاب بخوانیم؛

"ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"


📌 بخش بیست و چهارم: مطالعه موردی - Cascading

🔸 آبشار (Cascading) یک کتابخانه جاوای منبع باز و API است که یک لایه انتزاعی برای MapReduce فراهم می‌کند. این برنامه‌نویس‌ها را قادر می‌سازد تا برنامه‌های پیچیده و مهم برای پردازش داده‌ها را که روی خوشه‌های Hadoop اجرا می‌شوند، ایجاد کنند. این فصل از کتاب با مقدمه‌ای بر مفاهیم اصلی Cascading آغاز می‌شود، سپس در یک مطالعه موردی با مروری بر نحوه استفاده ShareThis از Cascading در زیرساخت‌های خود به پایان می‌رسد.

برای خواندن این مطلب می‌توانید به لینک زیر مراجعه فرمایید:

🔗 https://bit.ly/39zdlsE

#کتاب_بخوانیم
#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ
#فصل_بیست_و_چهارم
#ساینا_رتبه‌ای

www.bdbanalytics.ir
@BigData_BusinessAnalytics
📚 فایل ترجمه خلاصه کتاب ”ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ"
"Hadoop: The Definitive Guide: Storage and Analysis at Internet Scale"

📌 ضمن تشکر بابت همراهی شما با کانال گروه تحلیلگری عظیم داده، فایل کتاب "ذخیرهسازی و تحلیل در سطح اینترنت" از مجموعه کتب "راهنمای کامل هدوپ" در قالب یک فایل جمع‌آوری شده است.

برای دریافت این فایل می‌توانید نسبت به تکمیل فرم زیر اقدام نمایید.

🔗 https://goo.gl/forms/4v4YGrI4x5RX5gnC3

لازم به ذکر است افرادی که برای فایلهای قبلی فرم را تکمیل کرده‌اند، نیازی به تکمیل فرم ندارند.

#ذخیره‌سازی_و_تحلیل_در_سطح_اینترنت_از_مجموعه_کتب_راهنمای_کامل_هدوپ



@BigData_BusinessAnalytics
www.bdbanalytics.ir