Data Science | Тесты

MAP (Mean Average Precision) больше штрафует за недопрогноз (упущенные релевантные элементы), так как метрика ориентирована на точность в верхней части ранжированного списка.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥2

356 views16:01

Data Science | Тесты

🤔 Какой метод используется для масштабирования данных в sklearn?

Anonymous Quiz

💊8

121 voters352 views20:01

Data Science | Тесты

🤔 Какой метод используется для оценки важности признаков в модели случайного леса?

Anonymous Quiz

100 voters330 views09:01

Data Science | Тесты

🤔

В чём смысл Information Value (IV)?

Это метрика, используемая для оценки предсказательной способности признака относительно целевой переменной.
1. Высокое значение IV говорит о сильной связи между признаком и целевой переменной.
2. Часто используется в кредитном скоринге для выбора наиболее значимых признаков.
3. Значения IV помогают определить, какие признаки следует включить в модель, а какие можно исключить.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

337 views16:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для задач регрессии, когда требуется учитывать нелинейные зависимости между признаками?

Anonymous Quiz

Линейная регрессия

60%

Полиномиальная регрессия

💊14

134 voters336 views20:01

Data Science | Тесты

🤔 Какая функция в pandas используется для создания сводных таблиц?

Anonymous Quiz

🔥1

122 voters307 views09:02

Data Science | Тесты

🤔 Что хуже: иметь много ложных срабатываний или ложно-отрицательных срабатываний?

Это зависит от задачи. Ложно-отрицательные срабатывания хуже в задачах, где важно не пропустить критический случай (например, диагностика). Ложные срабатывания могут быть менее критичными, но увеличивают нагрузку на систему.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

286 views16:01

Data Science | Тесты

🤔 Какой метод уменьшает дисперсию, комбинируя деревья решений?

Anonymous Quiz

103 voters278 views20:01

Data Science | Тесты

🤔 Какой метод оптимизации применяется для поиска минимума функции?

Anonymous Quiz

💊21

99 voters269 views09:02

Data Science | Тесты

🤔 Какой функционал оптимизируется в задаче линейной регрессии? Как записать это в векторной записи?

Оптимизируется ошибка между предсказанными и фактическими значениями, минимизируя среднеквадратичное отклонение, что позволяет определить параметры модели.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

268 views16:01

Data Science | Тесты

🤔 Какой метод уменьшает размерность данных, максимизируя вариацию?

Anonymous Quiz

66%

Метод главных компонент (PCA)

14%

Линейная дискриминантная анализа (LDA)

20%

Т-распределенная стохастическая соседская эмуляМетод ближайших соседей (k-NN)ция (t-SNE)

93 voters260 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для классификации текстовых данных с учетом порядка слов?

Anonymous Quiz

Логистическая регрессия

94 voters241 views09:01

Data Science | Тесты

🤔 Что известно о Gradient-boosted trees?

Это ансамблевый метод, строящий модель как последовательность слабых моделей (обычно деревьев), где каждая новая модель корректирует ошибки предыдущей. Он использует градиентный спуск по функции потерь. Обладает высокой точностью и хорошо работает с табличными данными, но чувствителен к гиперпараметрам. Популярные реализации — XGBoost, LightGBM, CatBoost.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

252 views16:01

Data Science | Тесты

🤔 Какой алгоритм используется для классификации на основе теоремы Байеса?

Anonymous Quiz

Логистическая регрессия

Метод опорных векторов

93%

Наивный байесовский классификатор

Случайный лес

94 voters233 views20:01

Data Science | Тесты

🤔 Вопрос: Как называется процесс преобразования категориальных данных в числовые?

Anonymous Quiz

91 voters205 views09:01

Data Science | Тесты

🤔 Какие знаешь рекомендательные модели?

Модели: коллаборативная фильтрация (на основе пользователей или элементов), контентная фильтрация, гибридные подходы и модели с использованием глубокого обучения (например, нейронные сетевые рекомендатели).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

185 views16:01

Data Science | Тесты

🤔 Какой метод уменьшает переобучение с использованием L2 регуляризации?

Anonymous Quiz