Data Science | Тесты
2.5K subscribers
25 photos
345 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод уменьшает дисперсию, изменяя веса слабых моделей на основе их ошибок?
Anonymous Quiz
23%
AdaBoost
51%
Gradient Boosting
17%
Bagging
9%
Stacking
🤔 Как работает MSE?

MSE (Mean Squared Error) — это метрика, используемая для оценки качества модели регрессии, которая измеряет среднее квадратичное отклонение предсказанных значений от фактических. Она рассчитывается как среднее арифметическое квадратов разности между предсказанными и реальными значениями: `MSE = (1/n) * Σ(actual - predicted)^2`, где n — количество наблюдений. MSE чувствительна к большим ошибкам, так как квадраты отклонений увеличивают вес крупных ошибок. Цель модели — минимизировать MSE, чтобы предсказания были как можно ближе к фактическим значениям.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию в модели линейной регрессии?
Anonymous Quiz
24%
Bagging
19%
Boosting
34%
Ridge
23%
Lasso
💊5
🤔 Какой метод оценки модели используется для борьбы с переобучением?
Anonymous Quiz
6%
Grid Search
78%
Cross-validation
6%
Gradient Descent
10%
Stochastic Gradient Descent
🤔 Как представить модель LTV для бизнеса?

Модель LTV для бизнеса следует представить как инструмент для прогнозирования доходов от клиентов на протяжении их жизненного цикла, что позволяет планировать стратегии удержания, маркетинговые усилия и бюджеты. Важно объяснить, как модель использует данные для определения ключевых показателей, таких как частота покупок, средний чек и продолжительность взаимодействия. Модель должна быть легко интерпретируемой для принятия управленческих решений. Основное внимание должно быть уделено практичес

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для обработки категориальных признаков?
Anonymous Quiz
90%
One-hot encoding
5%
PCA
2%
LDA
3%
T-SNE
🤔 Какой метод выделяет важные признаки для случайного леса?
Anonymous Quiz
57%
Recursive Feature Elimination
11%
Boruta
22%
Mutual Information
9%
Chi-Squared Test
🤔 В чем разница между метрикой качества и функцией потери при обучении?

Метрика качества оценивает, насколько хорошо модель работает, сравнивая её предсказания с реальными данными (например, Accuracy, Precision, ROC AUC). Функция потери измеряет ошибку модели и используется во время обучения для минимизации этой ошибки (например, MSE, Cross-Entropy). Метрика качества часто применяется на тестовых данных, а функция потери — на этапе оптимизации модели

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм лучше всего подходит для предсказания категориальных переменных?
Anonymous Quiz
8%
Линейная регрессия
59%
Логистическая регрессия
12%
PCA
21%
K-means
🤔 Какой метод уменьшает смещение и дисперсию, используя наборы данных разного масштаба?
Anonymous Quiz
31%
Bagging
16%
Boosting
14%
Stacking
39%
Batch Normalization
💊2
🤔 В чем преимущество медианы над средним?

Медиана менее чувствительна к выбросам, чем среднее (mean):
- Среднее (Mean) – учитывает все значения, поэтому искажается выбросами.
- Медиана (Median) – просто находит центральное значение в упорядоченном ряду, игнорируя крайние выбросы.
Медиана особенно полезна при распределении доходов, цен, длительностей и других данных с выбросами.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод уменьшает размерность, сохраняя расстояния?
Anonymous Quiz
43%
PCA
18%
LDA
30%
t-SNE
10%
MDS
🤔 Какой метод уменьшения размерности часто используется для визуализации данных?
Anonymous Quiz
48%
PCA
27%
PCA
16%
LDA
8%
NMF
💊21🤔5
🤔 Как работает having?

`HAVING` в SQL используется для фильтрации результатов группировки, которые были созданы с помощью `GROUP BY`. В отличие от `WHERE`, который фильтрует строки до группировки, `HAVING` применяет фильтры уже после того, как данные были агрегированы. Это позволяет отфильтровывать группы на основе агрегатных функций, таких как `COUNT()`, `SUM()` или `AVG()`. Использование `HAVING` удобно, когда требуется отобрать только те группы, которые соответствуют определённым условиям.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает дисперсию предсказаний ансамбля моделей?
Anonymous Quiz
55%
Bagging
31%
Boosting
6%
Stacking
8%
Averaging
🤔 Какой метод уменьшения размерности сохраняет глобальную структуру данных, используя геодезическое расстояние?
Anonymous Quiz
14%
PCA
6%
LDA
70%
Isomap
11%
T-SNE
🤔 Что будет с целевой меткой с предсказаниями, если обучалась на неотрицательной целевой метке?

Модель будет предсказывать только неотрицательные значения, что может ограничивать её применение.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какие методы используются для анализа временных рядов?
Anonymous Quiz
78%
ARIMA
5%
Exponential Smoothing
11%
LSTM
5%
Moving Average
💊8
🤔 Какой метод уменьшения размерности выделяет линейные комбинации признаков, которые лучше всего разделяют классы?
Anonymous Quiz
54%
PCA
24%
LDA
12%
Isomap
10%
T-SNE
🔥1
🤔 У бинарного классификатора разделение данных такое, что 95% в одном классе, 5% в другом — какую метрику следует выбрать?

Лучше использовать F1-score, AUC-ROC или precision-recall, поскольку они учитывают дисбаланс классов и избегают искажений, связанных с accuracy.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊1