تحلیلگری عظیم‌داده و کسب‌وکار
907 subscribers
44 photos
42 videos
56 files
468 links
📌تحلیلگری عظیم داده و کسب و کار؛

🔎Big Data and Business Analytics

آموزش، پژوهش، اطلاع‌رسانی، ترویج و خدمات مشاوره حوزه تحلیلگری عظیم‌داده

سرپرست کانال: دکتر سعید روحانی، عضو هیأت علمی دانشگاه تهران

وبسایت
www.bdbanalytics.ir

ادمین کانال
@BDBA_UT
Download Telegram
🛠معرفی ابزار Apache Kylin

آپاچی کایلین یک موتور تجزیه و تحلیل توزیع‌شده و متن باز است که برای ارائه رابط SQL و تحلیل چند بعدی (OLAP) بر روی مجموعه‌داده‌های عظیم در پلتفرم‌های عظیم داده طراحی شده است. ابتدا توسط شرکت eBay Inc. توسعه یافت و سپس به پروژه Apache Software Foundation اهدا شد. کایلین به ویژه برای تجزیه و تحلیل تعاملی در مجموعه‌داده‌های عظیم مناسب است و به کاربران امکان تحلیل سریع پرس و جو را بر روی مقادیر داده‌های بسیار زیاد فراهم می‌کند.

✳️ویژگی‌ها و مفاهیم کلیدی آپاچی کایلین عبارتند از:

📌مکعب‌های OLAP: کایلین از مکعب‌های OLAP برای پیش‌محاسبه و ذخیره داده‌ها در یک فرمت چند بعدی استفاده می‌کند که اجازه اجرای سریع پرس و جوها را بر روی داده‌های تجمیعی می‌دهد. کاربران می‌توانند مکعب‌ها را با ابعاد و اندازه‌های مشخص بر اساس نیازهای تحلیلی خود تعریف کنند.

📌پیش‌محاسبه و مکعب‌زنی: کایلین داده‌های تجمیعی را پیش‌محاسبه و در یک روش توزیع‌شده ذخیره می‌کند که اجازه پاسخ دهی به پرس و جوهای زیرثانیه‌ای حتی بر روی مجموعه‌داده‌های عظیم را می‌دهد. مکعب‌زنی به کاربران اجازه می‌دهد تا مکعب‌های OLAP را بر اساس ابعاد و اندازه‌های خاصی تعریف و ساخت کنند.

📌رابط SQL: کایلین رابط SQL برای پرس و جوی مکعب‌های OLAP فراهم می‌کند که به کاربران امکان می‌دهد پرس و جوهای استاندارد SQL را برای تحلیل داده‌ها بکار گیرند. این از سینتکس‌های SQL معروف مانند ANSI SQL پشتیبانی می‌کند و با ابزارها و برنامه‌های BI مختلف ادغام می‌شود.

📌قابلیت مقیاس‌پذیری: کایلین برای مقیاس افقی طراحی شده است و از چارچوب‌های محاسبات توزیع‌شده مانند Apache Hadoop و Apache Spark بهره می‌برد. این می‌تواند با مجموعه‌داده‌هایی به اندازه پتابایت که در سراسر یک خوشه از گره‌ها پخش شده‌اند، کار کند.

📌 ادغام: کایلین با سایر اجزای اکوسیستم هادوپ، مانند Apache Hive، Apache HBase، و Apache Parquet برای ذخیره و پردازش داده ادغام می‌شود. همچنین از منابع مختلف، از جمله پایگاه‌های داده رابطه‌ای، Hadoop Distributed File System (HDFS)، و پلتفرم‌های ذخیره‌سازی ابری پشتیبانی می‌کند.

📌امنیت: کایلین ویژگی‌های امنیتی مانند احراز هویت، مجوزدهی، و رمزنگاری داده را فراهم می‌کند تا محرمانگی و امنیت داده‌ها را در یک محیط توزیع‌شده تضمین کند.

✳️در کل، آپاچی کایلین به سازمان‌ها کمک می‌کند تا تجزیه و تحلیل تعاملی روی مجموعه‌داده‌های عظیم را با استفاده از پرس و جوهای SQL معمولی و تکنیک‌های OLAP انجام دهند. این به سازمان‌ها کمک می‌کند تا از مخزن‌های داده‌ای خود به صورت کارآمد دریافت و تصمیم‌های مبتنی بر داده بگیرند.

📍همچنین می‌توانید این مطلب را در لینک زیر مطالعه فرمایید.

🔗 https://bdbanalytics.ir/6sdi

#معرفی_ابزار
#داده‌های_عظیم
#فاطمه_مصلحی
#Apache_Kylin

@BigData_BusinessAnalytics
www.bdbanalytics.ir