Data Science | Тесты
2.51K subscribers
25 photos
347 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Как представить модель LTV для бизнеса?

Модель LTV для бизнеса следует представить как инструмент для прогнозирования доходов от клиентов на протяжении их жизненного цикла, что позволяет планировать стратегии удержания, маркетинговые усилия и бюджеты. Важно объяснить, как модель использует данные для определения ключевых показателей, таких как частота покупок, средний чек и продолжительность взаимодействия. Модель должна быть легко интерпретируемой для принятия управленческих решений. Основное внимание должно быть уделено практичес

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для обработки категориальных признаков?
Anonymous Quiz
90%
One-hot encoding
5%
PCA
2%
LDA
3%
T-SNE
🤔 Какой метод выделяет важные признаки для случайного леса?
Anonymous Quiz
57%
Recursive Feature Elimination
11%
Boruta
22%
Mutual Information
9%
Chi-Squared Test
🤔 В чем разница между метрикой качества и функцией потери при обучении?

Метрика качества оценивает, насколько хорошо модель работает, сравнивая её предсказания с реальными данными (например, Accuracy, Precision, ROC AUC). Функция потери измеряет ошибку модели и используется во время обучения для минимизации этой ошибки (например, MSE, Cross-Entropy). Метрика качества часто применяется на тестовых данных, а функция потери — на этапе оптимизации модели

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм лучше всего подходит для предсказания категориальных переменных?
Anonymous Quiz
8%
Линейная регрессия
59%
Логистическая регрессия
12%
PCA
21%
K-means
🤔 Какой метод уменьшает смещение и дисперсию, используя наборы данных разного масштаба?
Anonymous Quiz
31%
Bagging
16%
Boosting
14%
Stacking
39%
Batch Normalization
💊2
🤔 В чем преимущество медианы над средним?

Медиана менее чувствительна к выбросам, чем среднее (mean):
- Среднее (Mean) – учитывает все значения, поэтому искажается выбросами.
- Медиана (Median) – просто находит центральное значение в упорядоченном ряду, игнорируя крайние выбросы.
Медиана особенно полезна при распределении доходов, цен, длительностей и других данных с выбросами.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод уменьшает размерность, сохраняя расстояния?
Anonymous Quiz
43%
PCA
18%
LDA
30%
t-SNE
10%
MDS
🤔 Какой метод уменьшения размерности часто используется для визуализации данных?
Anonymous Quiz
48%
PCA
27%
PCA
16%
LDA
8%
NMF
💊21🤔5
🤔 Как работает having?

`HAVING` в SQL используется для фильтрации результатов группировки, которые были созданы с помощью `GROUP BY`. В отличие от `WHERE`, который фильтрует строки до группировки, `HAVING` применяет фильтры уже после того, как данные были агрегированы. Это позволяет отфильтровывать группы на основе агрегатных функций, таких как `COUNT()`, `SUM()` или `AVG()`. Использование `HAVING` удобно, когда требуется отобрать только те группы, которые соответствуют определённым условиям.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает дисперсию предсказаний ансамбля моделей?
Anonymous Quiz
55%
Bagging
31%
Boosting
6%
Stacking
8%
Averaging
🤔 Какой метод уменьшения размерности сохраняет глобальную структуру данных, используя геодезическое расстояние?
Anonymous Quiz
14%
PCA
6%
LDA
70%
Isomap
11%
T-SNE
🤔 Что будет с целевой меткой с предсказаниями, если обучалась на неотрицательной целевой метке?

Модель будет предсказывать только неотрицательные значения, что может ограничивать её применение.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какие методы используются для анализа временных рядов?
Anonymous Quiz
78%
ARIMA
5%
Exponential Smoothing
11%
LSTM
5%
Moving Average
💊8
🤔 Какой метод уменьшения размерности выделяет линейные комбинации признаков, которые лучше всего разделяют классы?
Anonymous Quiz
54%
PCA
24%
LDA
12%
Isomap
10%
T-SNE
🔥1
🤔 У бинарного классификатора разделение данных такое, что 95% в одном классе, 5% в другом — какую метрику следует выбрать?

Лучше использовать F1-score, AUC-ROC или precision-recall, поскольку они учитывают дисбаланс классов и избегают искажений, связанных с accuracy.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊1
🤔 Какой метод уменьшения размерности используется для выявления скрытых факторов в данных?
Anonymous Quiz
9%
K-means
68%
LDA (Latent Dirichlet Allocation)
18%
NMF
5%
Decision Tree
🔥1
🤔 Какой метод помогает бороться с мультиколлинеарностью в регрессии?
Anonymous Quiz
69%
Ridge Regression
8%
Gradient Descent
13%
Bootstrap
10%
Holdout Validation
👍1
🤔 Как обучаются линейные модели?

Линейные модели обучаются путём нахождения оптимальных весов, которые минимизируют функцию потери, обычно через градиентный спуск. В случае простых моделей (например, линейной регрессии) может быть использовано аналитическое решение (метод наименьших квадратов). При больших данных или сложных задачах применяется итеративный подход для более эффективной оптимизации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1
🤔 Какой метод используется для создания рекомендаций на основе сходства пользователей?
Anonymous Quiz
27%
K-means
69%
User-Based Collaborative Filtering
1%
Decision Tree
3%
Naive Bayes
👍1