ترکیب چندین ویژوال در یک داشبورد باعث میشه تا تحلیل دادهها به شکل جامعتری انجام شن. برای این کار، میشه از ابزارهای مختلف تبلو مثل Container استفاده کرد تا چند نمودار و جدول رو در یک صفحه قرار داد. همچنین، میشه از Action Filters استفاده کرد تا تغییرات در یک ویژوال، بقیه ویژوالها رو هم تحت تاثیر قرار بده.
استوریها در تبلو این امکان رو میدن تا یک داستان مصور از دادهها بسازین. برای ساخت استوری، باید چند داشبورد و شیت (Sheet) رو به ترتیب منطقی قرار داد و هر صفحه از استوری رو به نحوی طراحی کرد که مفهوم خاصی رو منتقل کنه. این ابزار به شما کمک میکنه تا تحلیلها رو به صورت جذاب و قابل فهم ارائه بدین.
در تبلو، میشه از محاسبات و فرمولهای پیچیده برای تحلیل دادهها استفاده کرد. این محاسبات شامل محاسبات جدولی (Table Calculations)، محاسبات سطح دیتابیس (Level of Detail Expressions) و سایر فرمولهای محاسباتی میشن.
تبلو امکانات گستردهای برای انجام تحلیلهای آماری و تجزیه و تحلیلهای پیشرفته داره. ابزارهایی مثل Trend Lines ، Forecasting و Clustering الگوها و روندهای موجود در دادهها رو شناسایی میکنن.
برای انجام تحلیلهای مکانی، باید دادههای مکانی و جغرافیایی رو به نقشهها اضافه کرد. تبلو از انواع مختلف دادههای مکانی پشتیبانی میکنه و میتونه از منابع مختلفی مثل فایلهای Shape و سرویسهای آنلاین استفاده کنه.
تحلیلهای مکانی پیشرفته شامل تحلیلهای پیچیدهتری مثل تحلیلهای نزدیکترین همسایه (Nearest Neighbor Analysis)، تحلیلهای خوشهبندی مکانی (Spatial Clustering) و تحلیلهای متراکمسازی (Density Analysis) هستن. این تحلیلها به شما کمک میکنن تا با شناسایی الگوهای مکانی، تصمیمات بهتری بگیرین.
فیلترهای دینامیک و تعاملی این امکان رو میدن تا دادهها رو بر اساس نیازهای خاص فیلتر شن. میشه فیلترهای مختلفی ایجاد و از اونها برای نمایش دادههای خاص استفاده کرد. فیلترهای تعاملی به کاربران امکان میدن تا به صورت مستقیم با داشبوردها تعامل داشته باشن و دادههای مورد نیاز خود رو فیلتر کنن.
اکشنها برای ایجاد تعاملات پیچیده در داشبورد استفاده میشن. میشه از اکشنها برای ایجاد تعاملات مختلف مثل هایلایت کردن، فیلتر کردن و تغییر پارامترها استفاده کرد. این ابزارها به شما کمک میکنن تا داشبوردهای تعاملی و پویا ایجاد کنین.
#Data_Analysis
#Data_Visualization_Tools
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👌3👏2👨💻2
❓کوییز شماره ۱۵۳: هدف از استفاده از پارامترها در تبلو چیه؟
Anonymous Quiz
36%
ایجاد گروههای سفارشی از نقاط داده بر اساس معیارهای خاص
21%
سازماندهی دادهها در سطح جزئیات برای تحلیل و بررسی
29%
اجازه دادن به کاربران برای تغییر مقادیر در یک محاسبه به صورت پویا
14%
فیلتر کردن و تمرکز بر نقاط داده خاص در یک ویژوال
😎4❤2👌2👨💻2
از قابلیتهای پیشرفته تبلو LOD (Level of Detail) Expressions هست که امکان انجام محاسبات در سطوح مختلف جزئیات رو فراهم میکنه. با استفاده از این قابلیت، میشه میانگینها، مجموعها و دیگر محاسبات را در سطوح مختلف دادهها اعمال کنید، بدون اینکه بر سایر بخشهای تحلیل تأثیر بگذارد.
قابلیت Table Calculations محاسباتی هستن که در سطح جدول دادهها انجام میشن و معمولاً برای ایجاد معیارهای سفارشی، مثل درصد تغییرات یا مجموع تجمعی، استفاده میشن.
با استفاده از فیلدهای محاسباتی میشه فرمولهای متنوعی شامل توابع ریاضی، منطقی، تاریخی و رشتهای رو به کار گرفت تا فیلدهای جدیدی بر اساس دادههای موجود ایجاد کرد. این قابلیت به شما امکان میده تا تحلیلهای دقیقتر و جامعتری انجام و داشبوردها رو بهبود بخشید.
پارامترها متغیرهایی هستن که میتونن توسط کاربر برای تغییر دینامیک تحلیلها و داشبوردها استفاده شن. با استفاده از پارامترها میتوانید مقادیر رو به صورت تعاملی تغییر داده و نتایج تحلیل رو مشاهده کرد.
یکی از چالشهای بزرگ در تحلیل دادهها، زمان اجرای Queryهاست. در Tableau میشه با استفاده از تکنیکهایی مثل Indexing، Aggregation و Data Extracts، عملکرد Queryها رو بهینهسازی کرد.
ویژگی Extractها نسخههای فشردهای از دادهها هستن که به صورت محلی در Tableau ذخیره میشن و میتونن سرعت بارگذاری و اجرای Queryها رو به طور قابل توجهی افزایش بدن.
روش Data Blending یکی دیگه از روشهای ادغام دادههاست که به شما امکان میده دادههایی که ساختار مشابهی ندارن رو به هم متصل کنین و تحلیلهای ترکیبی انجام بدین.
#Data_Analysis
#Data_Visualization_Tools
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2👌2👨💻1
❓کوییز شماره ۱۵۴: هدف از استفاده از ویژگی Show Me در تبلو چیه؟
Anonymous Quiz
24%
سازماندهی دادهها در سطح جزئیات برای تحلیل و بررسی
24%
ایجاد گروههای سفارشی از نقاط داده بر اساس معیارهای خاص
12%
انجام تحلیلهای آماری پیشرفته
41%
تولید ویژوالهای پیشنهادی بر اساس دادههای انتخاب شده
👍4❤2👨💻2😎2
#Data_Analysis
#Data_Visualization_Tools
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤2👌1👨💻1
نرم افزار Power BI به سازمانها این امکان رو میده که دادههای خام رو از سیستمهای مبتنی بر ابر (SaaS) مختلف دریافت کرده و با استفاده از یک رابط کاربری قدرتمند، تعاملی و آسان، به دادههای قابل استفاده تبدیل کنن. علاوه بر این، این پلتفرم اطلاعات مهم رو جدا کرده و بینشهای ارزشمندی از متریکهای مورد نیاز کاربران ارائه میده.
#Data_Analysis
#Data_Visualization_Tools
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍1👌1👨💻1
❓کوییز شماره ۱۵۵: کاربران چگونه میتونن گزارشها و داشبوردهای Power BI رو با دیگران به اشتراک بگذارن؟
Anonymous Quiz
20%
تهیه خروجی در فرمت PDF یا Excel
68%
با به اشتراک گذاشتن لینکهای گزارشها یا داشبوردها از طریق Power BI Service
10%
با ارسال فایل PBIX از طریق ایمیل
3%
با چاپ و توزیع نسخههای فیزیکی
❤9👍2🤔2
Media is too big
VIEW IN TELEGRAM
رضا شکرزاد توی این ویدئو به طور کامل سرفصلها و محتوای دوره هوش تجاری و تحلیل داده رو توضیح داده، که برای کسانی که به تازگی میخوان این دوره رو شروع کنن یه راهنمای مفیده.
همچنین شما با سرچ #BI توی کانال، میتونین گزارش روند پیشرفت کلاس رو مطالعه کنین.
#Data_Analysis
#Data_Visualization_Tools
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2🔥1👨💻1
در Power BI، در مرحله اول از Power Query برای وارد کردن دادهها از منابع مختلف و انجام تغییرات لازم استفاده میشه. بعد از آمادهسازی دادهها، میشه اونها رو در Power BI مدلسازی و روابط بین جداول مختلف رو تعریف کرد. در نهایت، دادههای مدلسازی شده در Power BI، برای ایجاد گزارشها و داشبوردهای تعاملی استفاده میشه.
به طور خلاصه، Power Query ابزار اصلی برای آمادهسازی و تمیز کردن دادههاست، در حالی که Power BI از این دادههای آماده شده برای مدلسازی، تحلیل و مصورسازی استفاده میکنه. ترکیب این دو ابزار به کاربران امکان میده تا از دادههای خام به اطلاعات ارزشمند و قابل تحلیل برسن.
زبان DAX مخفف Data Analysis Expressions هست که یک زبان فرمولنویسیه و برای تحلیل دادهها و محاسبات در Power BI، Power Pivot و Analysis Services استفاده میشه. این زبان بر پایه توابع و عبارات مشابه اکسل ساخته شده اما قابلیتهای بیشتری برای تحلیل دادهها در مدلهای دادههای بزرگ داره.
TotalSales = SUM(Sales[SalesAmount])
SalesLastYear = CALCULATE(SUM(Sales[SalesAmount]), SAMEPERIODLASTYEAR(Calendar[Date]))
زبان M یک زبان فرمولنویسیه (Power Query Formula Language) که برای انتقال و تبدیل دادهها در Power Query در Power BI و Excel استفاده میشه. این زبان به کاربران اجازه میده تا دادهها رو از منابع مختلف جمعآوری، تمیز، تغییر و بارگذاری کنن.
Date.ToText(DateTime.LocalNow(), "yyyy-MM-dd")
Table.SelectRows(Source, each [Sales] > 1000)
زبان DAX بیشتر برای محاسبات و تحلیلهای داخل مدل دادهها استفاده میشه، در حالی که M برای استخراج، تغییر و بارگذاری دادهها از منابع مختلف و تمیز کردن اونها به کار میره. یادگیری این دو زبان به کاربران Power BI این امکان رو میده تا تحلیلهای پیچیدهتری انجام بدن و دادهها رو به شکلی بهینهتر مدیریت کنن.
#Data_Analysis
#Data_Visualization_Tools
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤4👌2👨💻1
❓کوییز شماره ۱۵۶: کدوم یک از موارد زیر بهترین استفاده از توابع تو در تو در DAX است؟
Anonymous Quiz
71%
ترکیب توابع CALCULATE و FILTER برای ایجاد معیارهای پیچیده
13%
استفاده از تابع SUM به تنهایی
17%
استفاده از تابع IF برای محاسبات ساده
👍5❤2🤔2😎1
SalesAmount = CALCULATE(
SUM(Sales[Amount]),
USERELATIONSHIP(Sales[Date], Dates[Date])
)
در این مثال، تابع USERELATIONSHIP یک رابطه موقتی بین ستونهای Date از جدول Sales و Dates ایجاد میکنه که به شما امکان میده مجموع فروشها رو بر اساس تاریخهای خاص محاسبه کنین.
List.Generate(
() => [Counter = 1, Result = 1],
each [Counter] <= 10,
each [Counter = [Counter] + 1, Result = [Result] * 2],
each [Result]
)
در این مثال، تابع List.Generate یک لیست از اعداد ایجاد میکنه که هر عدد دو برابر عدد قبلیه، و این عملیات تا زمانی که شمارنده به 10 برسد ادامه داره.
#Data_Analysis
#Data_Visualization_Tools
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2👌1👨💻1
#Weekend
#Data_Analysis
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3👏1
#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤3👌2👏1👨💻1
Forwarded from رضا شکرزاد - علمداده و هوش مصنوعی
Media is too big
VIEW IN TELEGRAM
اگه برای ورود به حوزه دیتا ساینس برنامه دارین، دیدن این ویدئو و ثبتنام در وبینار زیر رو بهتون پیشنهاد میکنم.
در آخرین وبینار بهار ۱۴۰۳، درمورد نقشه راه ورود به دیتاساینس و ماشین لرنینگ صحبت میکنیم. این وبینار به شما امکان میده تا با مبانی، ابزارها و مهارتهای لازم برای شروع در این حوزه آشنا شین.
برای مطالعه سرفصلها و دریافت جزئیات بیشتر، روی لینک زیر کلیک کنین.
@DSLanders | دیاسلندرز
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3🔥1👏1
قبل از وارد کردن دیتا به مدل، باید خطاها، نویز، مقادیر گمشده، تکراری یا نادرست مدیریت شن تا خروجی مدل بهینه شه. پاکسازی دادهها مرحلهایه که در اون دادهها از نظر کیفیت بررسی و اصلاح میشن و این کار نتایج تحلیلها رو تحت تأثیر قرار میده. بنابراین، پاکسازی داده به دلایل زیر اهمیت دارد:
- شناسایی و حذف رکوردهای تکراری
- اصلاح خطاهای ورودی (مثلاً غلط املاییها)
- تکمیل دادههای ناقص (مثلاً پر کردن فیلدهای خالی)
- استانداردسازی دادهها (مثلاً یکنواخت کردن فرمت تاریخها)
- تأیید اعتبار دادهها (مثلاً بررسی کدهای پستی)
- همه مراحل Data Cleansing
- تبدیل دادهها به فرمتهای مورد نیاز
- یکپارچهسازی منابع مختلف داده
- حذف دادههای غیرضروری یا بیربط
در کل Data Cleansing بیشتر به اصلاح و حذف خطاهای موجود در دادهها تمرکز داره و Data Cleaning به آماده و یکپارچهسازی کلی دادهها برای استفاده.
#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍5👌2👨💻1
❓کوییز شماره ۱۵۷: کدوم یک از روشهای زیر به عنوان تکنیکی برای تصحیح خطاهای تایپی و استانداردسازی دادههای متنی در فرآیند پاکسازی دادهها به کار میره؟
Anonymous Quiz
24%
Laplace Transform
33%
Hidden Markov Model
29%
Fuzzy Matching Algorithms
14%
Fourier Transform
❤2👌2😎2🤔1
پیش پردازش داده یا Data Preprocessing بهعنوان پاکسازی داده یا data wrangling هم شناخته میشه که نقشی مهمی در تبدیل دادههای خام به قالبی تمیز و ساختاریافته داره، مناسب برای تجزیهوتحلیل داره.
#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍3👌2👨💻1
نرمالسازی نوعی مقیاسبندی ویژگیهاست که دادهها رو به یک مقیاس استاندارد تبدیل میکنه. این تکنیکها برای دادههای با مقیاسهای مختلف و مدلهای مختلف کاربرد دارن. نرمالسازی بیشتر برای دادههای عددی استفاده میشه، اما میتونه در دادههای متنی هم کاربرد داشته باشه.
برای پیشبینی قیمت مسکن با ویژگیهایی مثل متراژ، تعداد اتاقها و فاصله تا سوپرمارکت، نرمالسازی اهمیت داره. بدون نرمالسازی، الگوریتم به ویژگیهایی با مقیاس بزرگتر وزن بیشتری میده، که ممکنه به عملکرد ضعیف مدل منجر شه. نرمالسازی اطمینان میده که هر ویژگی به طور متناسب در فرآیند یادگیری مشارکت داره.
#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤3👌1
Forwarded from رضا شکرزاد - علمداده و هوش مصنوعی
تقریباً دو سال بعد از آغاز موج #هوش_مصنوعی_مولد، حالا اپل آمادهست تا در کنفرانس جهانی توسعهدهندگان اپل (WWDC 2024) از ویژگیهای جدید محصولاتش که بر پایه #هوش_مصنوعی هستن رونمایی کنه. این کنفرانس فردا ساعت ۲۰:۳۰ بهوقت ایران برگزار میشه و ما اون رو کامل پوشش میدیم، اما پیش از اون، میتونین در وبلاگ کافهتدریس پیشبینیها و انتظارات از این کنفرانس رو مطالعه کنین.
#WWDC2024
#AppleEvent
@DSLanders | دیاسلندرز
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4👌1👨💻1
یکی از چالشهای مهم در پیشپردازش دادهها، مدیریت حافظه است و ساده و مؤثرترین روش برای کاهش استفاده از حافظه، استفاده از نمونهگیری از دادههاست. به جای استفاده از تمام دادهها، میشه نمونهای کوچکتر اما نماینده از کل دادهها رو انتخاب کرد. این کار باعث کاهش حجم دادهها و در نتیجه کاهش مصرف حافظه میشه.
نوع دادهها تأثیر زیادی روی میزان حافظه مورد نیاز داره. برای مثال، استفاده از نوع دادههای عدد صحیح (Integer) به جای نوع دادههای اعشاری (Float) باعث کاهش مصرف حافظه میشه. همچنین، استفاده از نوع دادههای کوچکتر (مثلاً
int32
به جای int64
) هم میتونه مفید باشه.به جای بارگذاری و پردازش تمام دادهها به صورت یکجا، میشه دادهها رو به دستههای کوچکتر تقسیم کرد و هر دسته رو جداگانه پردازش کرد. این کار باعث کاهش بار حافظه و افزایش کارایی سیستم میشه.
ابزارها و کتابخانههای مختلفی برای مدیریت حافظه در فرآیند پیشپردازش دادهها وجود دارن که به بهبود کارایی و کاهش مصرف حافظه کمک میکنن.
فایلهای حافظه مجازی روشی برای دسترسی به دادههای بزرگ هستن، بدون اینکه تمام دادهها در حافظه RAM بارگذاری شن. این تکنیک به خصوص برای دادههای بسیار بزرگ مفیده.
پردازش توزیع شده امکان استفاده از چند ماشین یا هسته پردازشی برای پردازش دادهها رو فراهم میکنه. این تکنیک به خصوص برای مجموعه دادههای بزرگ که نمیتونن به طور کامل در حافظه یک ماشین قرار بگیرن، بسیار مفیده.
بهینهسازی کد شامل استفاده از الگوریتمها و روشهای کارآمدتر برای پردازش دادههاست.
ذخیرهسازی موقت دادهها به کاهش مصرف حافظه و افزایش سرعت پردازش کمک میکنه. این تکنیک به خصوص زمانی مفیده که دادهها چند بار قراره استفاده شن.
joblib
برای ذخیرهسازی موقت نتایج محاسباتی.#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5👌2👨💻2❤1