❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_161
🔠 Как проверить нормальность набора данных или признака? (Часть_1)
✔️Ответ: W-тест Шапиро-Уилка:
1. Рассчитывается выборочное среднее и ковариационная матрица выборки;
2. Затем вычисляются статистики заказа (например, i-е наименьшее число в выборке) и ожидаемые значения из статистики заказа, выбранные из стандартного нормального распределения;
3. Наконец, вычисляется W-статистика, которая сравнивается с критическим значением, полученным через моделирование Монте-Карло;
4. Если W-статистика значима, то гипотеза о нормальном распределении данных отвергается, то есть данные, не следуют нормальному распределению;
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
🔠 Как проверить нормальность набора данных или признака? (Часть_1)
✔️Ответ: W-тест Шапиро-Уилка:
1. Рассчитывается выборочное среднее и ковариационная матрица выборки;
2. Затем вычисляются статистики заказа (например, i-е наименьшее число в выборке) и ожидаемые значения из статистики заказа, выбранные из стандартного нормального распределения;
3. Наконец, вычисляется W-статистика, которая сравнивается с критическим значением, полученным через моделирование Монте-Карло;
4. Если W-статистика значима, то гипотеза о нормальном распределении данных отвергается, то есть данные, не следуют нормальному распределению;
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_161
🔠 Как проверить нормальность набора данных или признака? (Часть_2)
✔️Ответ: Тест Мартинеса-Иглевича:
1. Вычисляются квантили выборки;
2. Эти квантили сравниваются с квантилями стандартного нормального распределения;
3. Расстояние между квантилями выборки и стандартного нормального распределения вычисляется для каждого квантиля;
4. Если все расстояния меньше некоторого критического значения, то гипотеза о нормальном распределении данных принимается.
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
🔠 Как проверить нормальность набора данных или признака? (Часть_2)
✔️Ответ: Тест Мартинеса-Иглевича:
1. Вычисляются квантили выборки;
2. Эти квантили сравниваются с квантилями стандартного нормального распределения;
3. Расстояние между квантилями выборки и стандартного нормального распределения вычисляется для каждого квантиля;
4. Если все расстояния меньше некоторого критического значения, то гипотеза о нормальном распределении данных принимается.
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_161
🔠 Как проверить нормальность набора данных или признака? (Часть_3)
✔️Ответ: Тест Д'Агостино
1. Вычисляются эксцесс и асимметрия выборки и эти значения сравниваются с ожидаемыми значениями для нормального распределения;
2. Расстояние между вычисленными и ожидаемыми значениями вычисляется для каждого из них;
3. Если оба расстояния меньше некоторого критического значения, то гипотеза о нормальном распределении данных принимается.
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
🔠 Как проверить нормальность набора данных или признака? (Часть_3)
✔️Ответ: Тест Д'Агостино
1. Вычисляются эксцесс и асимметрия выборки и эти значения сравниваются с ожидаемыми значениями для нормального распределения;
2. Расстояние между вычисленными и ожидаемыми значениями вычисляется для каждого из них;
3. Если оба расстояния меньше некоторого критического значения, то гипотеза о нормальном распределении данных принимается.
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_162
🔠 Что означает термин "Variance Inflation Factor" и как он интерпретируется и есть ли ему аналоги ? (Част ь_1)
✔️Ответ: "Variance Inflation Factor" (VIF) относится к статистическому показателю, используемому для измерения степени мультиколлинеарности в модели линейной регрессии. Мультиколлинеарность происходит, когда две или более независимые переменные в модели сильно коррелируют друг с другом, что может исказить результаты регрессии.
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
🔠 Что означает термин "Variance Inflation Factor" и как он интерпретируется и есть ли ему аналоги ? (Част ь_1)
✔️Ответ: "Variance Inflation Factor" (VIF) относится к статистическому показателю, используемому для измерения степени мультиколлинеарности в модели линейной регрессии. Мультиколлинеарность происходит, когда две или более независимые переменные в модели сильно коррелируют друг с другом, что может исказить результаты регрессии.
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_162
🔠 Что означает термин "Variance Inflation Factor" и как он интерпретируется и есть ли ему аналоги ? (Част ь_2)
✔️Ответ: VIF равен 1, когда вектор предиктора ортогонален каждому столбцу матрицы проектирования для регрессии предиктора на другие ковариаты. В противном случае, если вектор предиктора не ортогонален всем столбцам матрицы проектирования для регрессии предиктора на другие ковариаты, VIF будет больше 1.
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
🔠 Что означает термин "Variance Inflation Factor" и как он интерпретируется и есть ли ему аналоги ? (Част ь_2)
✔️Ответ: VIF равен 1, когда вектор предиктора ортогонален каждому столбцу матрицы проектирования для регрессии предиктора на другие ковариаты. В противном случае, если вектор предиктора не ортогонален всем столбцам матрицы проектирования для регрессии предиктора на другие ковариаты, VIF будет больше 1.
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_162
🔠 Что означает термин "Variance Inflation Factor" и как он интерпретируется и есть ли ему аналоги ? (Часть_3)
Интерпретация VIF следующая: если VIF предиктора равен 5.27 (корень из 5.27 = 2.3), это означает, что стандартная ошибка для коэффициента этого предиктора в 2.3 раза больше, чем если этот предиктор имел бы корреляцию 0 с другими предикторами в модели. VIF измеряет количество завышенных дисперсий, вызванных мультиколлинеарностью.
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
🔠 Что означает термин "Variance Inflation Factor" и как он интерпретируется и есть ли ему аналоги ? (Часть_3)
Интерпретация VIF следующая: если VIF предиктора равен 5.27 (корень из 5.27 = 2.3), это означает, что стандартная ошибка для коэффициента этого предиктора в 2.3 раза больше, чем если этот предиктор имел бы корреляцию 0 с другими предикторами в модели. VIF измеряет количество завышенных дисперсий, вызванных мультиколлинеарностью.
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
❓200 Вопросов по Машинному обучению (Machine Learning) - Вопрос_162
🔠 Что означает термин "Variance Inflation Factor" и как он интерпретируется и есть ли ему аналоги ? (Часть_4)
В качестве аналога VIF можно рассмотреть "Tolerance Index" (TI), который также используется для измерения степени мультиколлинеарности в модели. TI также представляет собой отношение дисперсии оценок параметра к дисперсии модели.
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation
🔠 Что означает термин "Variance Inflation Factor" и как он интерпретируется и есть ли ему аналоги ? (Часть_4)
В качестве аналога VIF можно рассмотреть "Tolerance Index" (TI), который также используется для измерения степени мультиколлинеарности в модели. TI также представляет собой отношение дисперсии оценок параметра к дисперсии модели.
https://boosty.to/denoise_lab/donate - фишки кода, полезные фичи или просто если вы хотите поддержать наш канал.
#DataAnalysis #NormalityTest #SampleMean #CovarianceMatrix #OrderStatistics #StandardNormalDistribution #WStatistic #MonteCarloSimulation