#Data_Analysis
#Data_Visualization_Tools
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤2👌1👨💻1
نرم افزار Power BI به سازمانها این امکان رو میده که دادههای خام رو از سیستمهای مبتنی بر ابر (SaaS) مختلف دریافت کرده و با استفاده از یک رابط کاربری قدرتمند، تعاملی و آسان، به دادههای قابل استفاده تبدیل کنن. علاوه بر این، این پلتفرم اطلاعات مهم رو جدا کرده و بینشهای ارزشمندی از متریکهای مورد نیاز کاربران ارائه میده.
#Data_Analysis
#Data_Visualization_Tools
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍1👌1👨💻1
❓کوییز شماره ۱۵۵: کاربران چگونه میتونن گزارشها و داشبوردهای Power BI رو با دیگران به اشتراک بگذارن؟
Anonymous Quiz
20%
تهیه خروجی در فرمت PDF یا Excel
68%
با به اشتراک گذاشتن لینکهای گزارشها یا داشبوردها از طریق Power BI Service
10%
با ارسال فایل PBIX از طریق ایمیل
3%
با چاپ و توزیع نسخههای فیزیکی
❤9👍2🤔2
Media is too big
VIEW IN TELEGRAM
رضا شکرزاد توی این ویدئو به طور کامل سرفصلها و محتوای دوره هوش تجاری و تحلیل داده رو توضیح داده، که برای کسانی که به تازگی میخوان این دوره رو شروع کنن یه راهنمای مفیده.
همچنین شما با سرچ #BI توی کانال، میتونین گزارش روند پیشرفت کلاس رو مطالعه کنین.
#Data_Analysis
#Data_Visualization_Tools
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2🔥1👨💻1
در Power BI، در مرحله اول از Power Query برای وارد کردن دادهها از منابع مختلف و انجام تغییرات لازم استفاده میشه. بعد از آمادهسازی دادهها، میشه اونها رو در Power BI مدلسازی و روابط بین جداول مختلف رو تعریف کرد. در نهایت، دادههای مدلسازی شده در Power BI، برای ایجاد گزارشها و داشبوردهای تعاملی استفاده میشه.
به طور خلاصه، Power Query ابزار اصلی برای آمادهسازی و تمیز کردن دادههاست، در حالی که Power BI از این دادههای آماده شده برای مدلسازی، تحلیل و مصورسازی استفاده میکنه. ترکیب این دو ابزار به کاربران امکان میده تا از دادههای خام به اطلاعات ارزشمند و قابل تحلیل برسن.
زبان DAX مخفف Data Analysis Expressions هست که یک زبان فرمولنویسیه و برای تحلیل دادهها و محاسبات در Power BI، Power Pivot و Analysis Services استفاده میشه. این زبان بر پایه توابع و عبارات مشابه اکسل ساخته شده اما قابلیتهای بیشتری برای تحلیل دادهها در مدلهای دادههای بزرگ داره.
TotalSales = SUM(Sales[SalesAmount])
SalesLastYear = CALCULATE(SUM(Sales[SalesAmount]), SAMEPERIODLASTYEAR(Calendar[Date]))
زبان M یک زبان فرمولنویسیه (Power Query Formula Language) که برای انتقال و تبدیل دادهها در Power Query در Power BI و Excel استفاده میشه. این زبان به کاربران اجازه میده تا دادهها رو از منابع مختلف جمعآوری، تمیز، تغییر و بارگذاری کنن.
Date.ToText(DateTime.LocalNow(), "yyyy-MM-dd")
Table.SelectRows(Source, each [Sales] > 1000)
زبان DAX بیشتر برای محاسبات و تحلیلهای داخل مدل دادهها استفاده میشه، در حالی که M برای استخراج، تغییر و بارگذاری دادهها از منابع مختلف و تمیز کردن اونها به کار میره. یادگیری این دو زبان به کاربران Power BI این امکان رو میده تا تحلیلهای پیچیدهتری انجام بدن و دادهها رو به شکلی بهینهتر مدیریت کنن.
#Data_Analysis
#Data_Visualization_Tools
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤4👌2👨💻1
❓کوییز شماره ۱۵۶: کدوم یک از موارد زیر بهترین استفاده از توابع تو در تو در DAX است؟
Anonymous Quiz
71%
ترکیب توابع CALCULATE و FILTER برای ایجاد معیارهای پیچیده
13%
استفاده از تابع SUM به تنهایی
17%
استفاده از تابع IF برای محاسبات ساده
👍5❤2🤔2😎1
SalesAmount = CALCULATE(
SUM(Sales[Amount]),
USERELATIONSHIP(Sales[Date], Dates[Date])
)
در این مثال، تابع USERELATIONSHIP یک رابطه موقتی بین ستونهای Date از جدول Sales و Dates ایجاد میکنه که به شما امکان میده مجموع فروشها رو بر اساس تاریخهای خاص محاسبه کنین.
List.Generate(
() => [Counter = 1, Result = 1],
each [Counter] <= 10,
each [Counter = [Counter] + 1, Result = [Result] * 2],
each [Result]
)
در این مثال، تابع List.Generate یک لیست از اعداد ایجاد میکنه که هر عدد دو برابر عدد قبلیه، و این عملیات تا زمانی که شمارنده به 10 برسد ادامه داره.
#Data_Analysis
#Data_Visualization_Tools
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2👌1👨💻1
#Weekend
#Data_Analysis
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3👏1
#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤3👌2👏1👨💻1
Forwarded from رضا شکرزاد - علمداده و هوش مصنوعی
Media is too big
VIEW IN TELEGRAM
اگه برای ورود به حوزه دیتا ساینس برنامه دارین، دیدن این ویدئو و ثبتنام در وبینار زیر رو بهتون پیشنهاد میکنم.
در آخرین وبینار بهار ۱۴۰۳، درمورد نقشه راه ورود به دیتاساینس و ماشین لرنینگ صحبت میکنیم. این وبینار به شما امکان میده تا با مبانی، ابزارها و مهارتهای لازم برای شروع در این حوزه آشنا شین.
برای مطالعه سرفصلها و دریافت جزئیات بیشتر، روی لینک زیر کلیک کنین.
@DSLanders | دیاسلندرز
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3🔥1👏1
قبل از وارد کردن دیتا به مدل، باید خطاها، نویز، مقادیر گمشده، تکراری یا نادرست مدیریت شن تا خروجی مدل بهینه شه. پاکسازی دادهها مرحلهایه که در اون دادهها از نظر کیفیت بررسی و اصلاح میشن و این کار نتایج تحلیلها رو تحت تأثیر قرار میده. بنابراین، پاکسازی داده به دلایل زیر اهمیت دارد:
- شناسایی و حذف رکوردهای تکراری
- اصلاح خطاهای ورودی (مثلاً غلط املاییها)
- تکمیل دادههای ناقص (مثلاً پر کردن فیلدهای خالی)
- استانداردسازی دادهها (مثلاً یکنواخت کردن فرمت تاریخها)
- تأیید اعتبار دادهها (مثلاً بررسی کدهای پستی)
- همه مراحل Data Cleansing
- تبدیل دادهها به فرمتهای مورد نیاز
- یکپارچهسازی منابع مختلف داده
- حذف دادههای غیرضروری یا بیربط
در کل Data Cleansing بیشتر به اصلاح و حذف خطاهای موجود در دادهها تمرکز داره و Data Cleaning به آماده و یکپارچهسازی کلی دادهها برای استفاده.
#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍5👌2👨💻1
❓کوییز شماره ۱۵۷: کدوم یک از روشهای زیر به عنوان تکنیکی برای تصحیح خطاهای تایپی و استانداردسازی دادههای متنی در فرآیند پاکسازی دادهها به کار میره؟
Anonymous Quiz
24%
Laplace Transform
33%
Hidden Markov Model
29%
Fuzzy Matching Algorithms
14%
Fourier Transform
❤2👌2😎2🤔1
پیش پردازش داده یا Data Preprocessing بهعنوان پاکسازی داده یا data wrangling هم شناخته میشه که نقشی مهمی در تبدیل دادههای خام به قالبی تمیز و ساختاریافته داره، مناسب برای تجزیهوتحلیل داره.
#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍3👌2👨💻1
نرمالسازی نوعی مقیاسبندی ویژگیهاست که دادهها رو به یک مقیاس استاندارد تبدیل میکنه. این تکنیکها برای دادههای با مقیاسهای مختلف و مدلهای مختلف کاربرد دارن. نرمالسازی بیشتر برای دادههای عددی استفاده میشه، اما میتونه در دادههای متنی هم کاربرد داشته باشه.
برای پیشبینی قیمت مسکن با ویژگیهایی مثل متراژ، تعداد اتاقها و فاصله تا سوپرمارکت، نرمالسازی اهمیت داره. بدون نرمالسازی، الگوریتم به ویژگیهایی با مقیاس بزرگتر وزن بیشتری میده، که ممکنه به عملکرد ضعیف مدل منجر شه. نرمالسازی اطمینان میده که هر ویژگی به طور متناسب در فرآیند یادگیری مشارکت داره.
#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤3👌1
Forwarded from رضا شکرزاد - علمداده و هوش مصنوعی
تقریباً دو سال بعد از آغاز موج #هوش_مصنوعی_مولد، حالا اپل آمادهست تا در کنفرانس جهانی توسعهدهندگان اپل (WWDC 2024) از ویژگیهای جدید محصولاتش که بر پایه #هوش_مصنوعی هستن رونمایی کنه. این کنفرانس فردا ساعت ۲۰:۳۰ بهوقت ایران برگزار میشه و ما اون رو کامل پوشش میدیم، اما پیش از اون، میتونین در وبلاگ کافهتدریس پیشبینیها و انتظارات از این کنفرانس رو مطالعه کنین.
#WWDC2024
#AppleEvent
@DSLanders | دیاسلندرز
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4👌1👨💻1
یکی از چالشهای مهم در پیشپردازش دادهها، مدیریت حافظه است و ساده و مؤثرترین روش برای کاهش استفاده از حافظه، استفاده از نمونهگیری از دادههاست. به جای استفاده از تمام دادهها، میشه نمونهای کوچکتر اما نماینده از کل دادهها رو انتخاب کرد. این کار باعث کاهش حجم دادهها و در نتیجه کاهش مصرف حافظه میشه.
نوع دادهها تأثیر زیادی روی میزان حافظه مورد نیاز داره. برای مثال، استفاده از نوع دادههای عدد صحیح (Integer) به جای نوع دادههای اعشاری (Float) باعث کاهش مصرف حافظه میشه. همچنین، استفاده از نوع دادههای کوچکتر (مثلاً
int32
به جای int64
) هم میتونه مفید باشه.به جای بارگذاری و پردازش تمام دادهها به صورت یکجا، میشه دادهها رو به دستههای کوچکتر تقسیم کرد و هر دسته رو جداگانه پردازش کرد. این کار باعث کاهش بار حافظه و افزایش کارایی سیستم میشه.
ابزارها و کتابخانههای مختلفی برای مدیریت حافظه در فرآیند پیشپردازش دادهها وجود دارن که به بهبود کارایی و کاهش مصرف حافظه کمک میکنن.
فایلهای حافظه مجازی روشی برای دسترسی به دادههای بزرگ هستن، بدون اینکه تمام دادهها در حافظه RAM بارگذاری شن. این تکنیک به خصوص برای دادههای بسیار بزرگ مفیده.
پردازش توزیع شده امکان استفاده از چند ماشین یا هسته پردازشی برای پردازش دادهها رو فراهم میکنه. این تکنیک به خصوص برای مجموعه دادههای بزرگ که نمیتونن به طور کامل در حافظه یک ماشین قرار بگیرن، بسیار مفیده.
بهینهسازی کد شامل استفاده از الگوریتمها و روشهای کارآمدتر برای پردازش دادههاست.
ذخیرهسازی موقت دادهها به کاهش مصرف حافظه و افزایش سرعت پردازش کمک میکنه. این تکنیک به خصوص زمانی مفیده که دادهها چند بار قراره استفاده شن.
joblib
برای ذخیرهسازی موقت نتایج محاسباتی.#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5👌2👨💻2❤1
❓کوییز شماره ۱۵۸: در زمینه پردازش موازی دادهها، استفاده از تکنیک Memory Pooling به چه معنیه؟
Anonymous Quiz
29%
بارگذاری دادهها در حافظه پنهان (Cache) برای کاهش زمان دسترسی.
14%
اجرای همزمان چند الگوریتم پردازش داده برای افزایش دقت نتایج.
32%
اختصاص دادن یک منطقه مشترک از حافظه به چند پردازشگر برای کاهش مصرف حافظه و افزایش کارایی.
25%
استفاده از چند حافظه پنهان (Cache) برای پردازش دادهها به صورت موازی.
😎4❤2👍1
Forwarded from کافه تدریس | Cafetadris.com
کنفرانس جهانی توسعهدهندگان اپل (WWDC 2024) امشب ساعت ۲۰:۳۰ بهوقت ایران برگزار میشه و بخش چشمگیریش مبتنی بر هوش مصنوعیه.
برای پوشش اخبار رویداد اپل، کانال دیاسلندرز رو دنبال کنین:
@cafetadris | کافهتدریس
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4🔥3👏1👌1
برای مدیریت زمان اجرای مدلهای ماشین لرنینگ یا آنالیز داده و برای بهینهسازی حافظه مورد استفاده هر مدل، تکنیکهای ساده ای وجود داره که کمک میکنه دیتاست یا دیتافریممون رو بهینه ذخیره کنیم.
تو این ویدئو این کار رو که عموما Type Casting هست با پکیج Pandas انجام دادیم. به این ترتیب نشون دادیم که چطور حافظ و زمان رو با تغییرات ساده میتونیم مهندسی کنیم. این کار کمک بزرگی به مدیریت منابع میکنه.
#YouTube
#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
پانداز - بهینه کردن زمان اجرا و حافظه دیتافریم
برای مدیریت زمان اجرای مدلهای ماشین لرنینگی یا آنالیز داده و برای بهینه مموری مورد استفاده هر مدل تکنیکهای ساده ای وجود داره که میتونیم داده ست یا دیتافریم مون رو بهینه ذخیره کنیم. تو این ویدیو این کار رو که عموما تایپ کستینگ هست با پکیج پانداز انجام دادیم.…
❤4🔥2👌1
دادههای پرت یا Outlier به نقاط دادهای گفته میشه که به طور قابل توجهی از بقیه نقاط داده دور هستن. دادههای پرت ممکنه به دلایل مختلفی مثل خطاهای اندازهگیری، وارد کردن نادرست دادهها یا حتی تغییرات واقعی در دادهها به وجود بیاین.
مدیریت دادههای پرت اهمیت زیادی در پیشپردازش دادهها داره چون این دادهها میتونن تاثیر زیادی روی نتایج تحلیلها و مدلهای یادگیری ماشین داشته باشن.
وجود دادههای پرت منجر به تولید نتایج نادرست و گمراهکننده میشه، چون مدلهای یادگیری ماشین ممکنه به جای یادگیری الگوی کلی دادهها، به دادههای پرت واکنش نشون بدن. بنابراین، شناسایی و مدیریت صحیح این دادهها اهمیت زیادی داره.
برای مدیریت این چالش، میشه از روشهای کاهش ابعاد مثل تحلیل مؤلفههای اصلی (PCA) استفاده کرد تا دادهها به فضای کوچکتری نگاشت شن و دادههای پرت بهتر شناسایی شن.
#Data_Analysis
#Data_Preprocessing
@Data_ML | دیتاساینس و ماشین لرنینگ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3👌2
❓کوییز شماره ۱۵۹: کدوم یک از روشهای زیر، با استفاده از تبدیلهای ریاضی نقاط پرت رو کاهش میده؟
Anonymous Quiz
33%
Logarithmic Transformation
14%
Direct Removal
29%
Min-Max Transformation
24%
Regression Method
😎5👍2❤1🤔1