Data Science | Тесты

🤔 Почему считается, что случайный лес не переобучается?

Считается, что случайный лес не склонен к переобучению, потому что он усредняет предсказания большого количества деревьев решений, каждое из которых обучается на случайной подвыборке данных и случайных признаках. Этот процесс помогает уменьшить влияние отдельных переобученных деревьев на финальное предсказание. В результате модель становится более устойчивой к ошибкам и шуму в данных. Кроме того, случайный лес не сильно зависит от малозначимых признаков, так как случайные выборки уменьшают их влияние.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

👍1🔥1

278 views16:01

Data Science | Тесты

🤔 Какой метод используется для определения важности переменных в модели?

Anonymous Quiz

Permutation Feature Importance

93 voters262 views20:01

Data Science | Тесты

🤔 Какая функция используется для создания DataFrame в pandas?

Anonymous Quiz

96 voters239 views09:01

Data Science | Тесты

🤔 Почему в картинках используют Standard Scaling вместо MinMax Scaling?

Standard Scaling (z-score normalization) чаще используется для обработки изображений, поскольку:
1. Он центрирует данные вокруг нуля и масштабирует их на основе стандартного отклонения, что улучшает производительность моделей, чувствительных к масштабам.
2. MinMax Scaling, преобразующий значения в диапазон [0, 1], может терять информацию о дисперсии пикселей.
3. Standard Scaling более устойчив к изменению контрастности и яркости изображений.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

🔥1

244 views16:01

Data Science | Тесты

🤔 Какой метод используется для повышения точности моделей путем создания ансамбля из нескольких моделей?

Anonymous Quiz

Логистическая регрессия

81 voters236 views20:01

Data Science | Тесты

🤔 Какой алгоритм используется для обнаружения выбросов в данных?

Anonymous Quiz

82 voters220 views09:01

Data Science | Тесты

🤔 Что такое градиентный спуск?

Градиентный спуск — это метод оптимизации, который используется для нахождения минимального значения функции ошибки модели путём итеративного изменения параметров модели (например, весов). На каждом шаге вычисляется градиент функции ошибки по параметрам, и параметры корректируются в направлении, противоположном градиенту. Шаг изменения регулируется параметром скорости обучения (learning rate). Градиентный спуск эффективен для обучения моделей с большим количеством параметров.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

👍2

228 views16:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для классификации текстовых данных с учетом частотных характеристик слов?

Anonymous Quiz

95 voters236 views20:01

Data Science | Тесты

🤔 Какой метод используется для выявления скрытых переменных в данных?

Anonymous Quiz

57%

Латентный Дирихле распределение

Кластеризация k-средних

33%

Метод главных компонент

Решающее дерево

70 voters215 views09:01

Data Science | Тесты

🤔 Какой метод оптимизации наиболее эффективен для глубоких нейросетей?

Anonymous Quiz

10%

Градиентный спуск

15%

Стохастический градиентный спуск

Метод моментов Нестерова

73%

Адаптивная оценка момента (Adam)

80 voters215 views20:01

Data Science | Тесты

🤔 Какой алгоритм оптимизации используется в XGBoost?

Anonymous Quiz

75 voters182 views09:01

Data Science | Тесты

🤔 Какую метрику регрессии используешь для объяснения результатов?

Для объяснения результатов регрессии обычно используются несколько метрик, таких как среднеквадратичная ошибка (MSE), средняя абсолютная ошибка (MAE) и R-квадрат. Выбор зависит от специфики задачи и приоритетов: чувствительности к выбросам, интерпретируемости или доли объясненной дисперсии. Важно учитывать контекст и использовать несколько метрик для полной оценки.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

171 views16:02

Data Science | Тесты

🤔 Какой метод уменьшает смещение в ансамблевом обучении?

Anonymous Quiz