🤔 Почему считается, что случайный лес не переобучается?
Считается, что случайный лес не склонен к переобучению, потому что он усредняет предсказания большого количества деревьев решений, каждое из которых обучается на случайной подвыборке данных и случайных признаках. Этот процесс помогает уменьшить влияние отдельных переобученных деревьев на финальное предсказание. В результате модель становится более устойчивой к ошибкам и шуму в данных. Кроме того, случайный лес не сильно зависит от малозначимых признаков, так как случайные выборки уменьшают их влияние.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
👍1🔥1
🤔 Какой метод используется для определения важности переменных в модели?
Anonymous Quiz
11%
Gini Impurity
9%
ROC-AUC Curve
9%
Cross-Validation
72%
Permutation Feature Importance
🤔 Какая функция используется для создания DataFrame в pandas?
Anonymous Quiz
94%
DataFrame()
2%
create_frame()
2%
make_dataframe()
2%
build_df()
🤔 Почему в картинках используют Standard Scaling вместо MinMax Scaling?
Standard Scaling (z-score normalization) чаще используется для обработки изображений, поскольку:
1. Он центрирует данные вокруг нуля и масштабирует их на основе стандартного отклонения, что улучшает производительность моделей, чувствительных к масштабам.
2. MinMax Scaling, преобразующий значения в диапазон [0, 1], может терять информацию о дисперсии пикселей.
3. Standard Scaling более устойчив к изменению контрастности и яркости изображений.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
1. Он центрирует данные вокруг нуля и масштабирует их на основе стандартного отклонения, что улучшает производительность моделей, чувствительных к масштабам.
2. MinMax Scaling, преобразующий значения в диапазон [0, 1], может терять информацию о дисперсии пикселей.
3. Standard Scaling более устойчив к изменению контрастности и яркости изображений.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🔥1
🤔 Какой метод используется для повышения точности моделей путем создания ансамбля из нескольких моделей?
Anonymous Quiz
91%
Градиентный бустинг
6%
K-means
1%
Линейная регрессия
1%
Логистическая регрессия
🤔 Какой алгоритм используется для обнаружения выбросов в данных?
Anonymous Quiz
9%
K-means
70%
Isolation Forest
2%
Linear Regression
20%
PCA
🤔 Что такое градиентный спуск?
Градиентный спуск — это метод оптимизации, который используется для нахождения минимального значения функции ошибки модели путём итеративного изменения параметров модели (например, весов). На каждом шаге вычисляется градиент функции ошибки по параметрам, и параметры корректируются в направлении, противоположном градиенту. Шаг изменения регулируется параметром скорости обучения (learning rate). Градиентный спуск эффективен для обучения моделей с большим количеством параметров.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
👍2
🤔 Какой метод машинного обучения используется для классификации текстовых данных с учетом частотных характеристик слов?
Anonymous Quiz
89%
TF-IDF
2%
Линейная регрессия
2%
Decision Tree
6%
RNN
🤔 Какой метод используется для выявления скрытых переменных в данных?
Anonymous Quiz
57%
Латентный Дирихле распределение
4%
Кластеризация k-средних
33%
Метод главных компонент
6%
Решающее дерево
🤔 Какой метод оптимизации наиболее эффективен для глубоких нейросетей?
Anonymous Quiz
10%
Градиентный спуск
15%
Стохастический градиентный спуск
3%
Метод моментов Нестерова
73%
Адаптивная оценка момента (Adam)
🤔 Какой алгоритм оптимизации используется в XGBoost?
Anonymous Quiz
25%
Adam
48%
Gradient Descent
20%
L-BFGS
7%
Newton-Raphson
🤔 Какую метрику регрессии используешь для объяснения результатов?
Для объяснения результатов регрессии обычно используются несколько метрик, таких как среднеквадратичная ошибка (MSE), средняя абсолютная ошибка (MAE) и R-квадрат. Выбор зависит от специфики задачи и приоритетов: чувствительности к выбросам, интерпретируемости или доли объясненной дисперсии. Важно учитывать контекст и использовать несколько метрик для полной оценки.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🤔 Какой метод уменьшает смещение в ансамблевом обучении?
Anonymous Quiz
34%
Bagging
48%
Boosting
3%
Gradient Descent
14%
Cross-Validation
💊3
🤔 Какой алгоритм часто используется для прогнозирования временных рядов?
Anonymous Quiz
5%
Линейная регрессия
87%
ARIMA
4%
Случайный лес
4%
K-means
🤔 Какой оптимизатор выбрать для обучения нейронной сети?
Adam часто используется из-за адаптивного шага обучения. SGD предпочтителен для больших данных.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Adam часто используется из-за адаптивного шага обучения. SGD предпочтителен для больших данных.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний