Data Science | Тесты
2.51K subscribers
25 photos
347 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод выделяет важные признаки для случайного леса?
Anonymous Quiz
57%
Recursive Feature Elimination
11%
Boruta
22%
Mutual Information
9%
Chi-Squared Test
🤔 В чем разница между метрикой качества и функцией потери при обучении?

Метрика качества оценивает, насколько хорошо модель работает, сравнивая её предсказания с реальными данными (например, Accuracy, Precision, ROC AUC). Функция потери измеряет ошибку модели и используется во время обучения для минимизации этой ошибки (например, MSE, Cross-Entropy). Метрика качества часто применяется на тестовых данных, а функция потери — на этапе оптимизации модели

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм лучше всего подходит для предсказания категориальных переменных?
Anonymous Quiz
8%
Линейная регрессия
59%
Логистическая регрессия
12%
PCA
21%
K-means
🤔 Какой метод уменьшает смещение и дисперсию, используя наборы данных разного масштаба?
Anonymous Quiz
31%
Bagging
16%
Boosting
14%
Stacking
39%
Batch Normalization
💊2
🤔 В чем преимущество медианы над средним?

Медиана менее чувствительна к выбросам, чем среднее (mean):
- Среднее (Mean) – учитывает все значения, поэтому искажается выбросами.
- Медиана (Median) – просто находит центральное значение в упорядоченном ряду, игнорируя крайние выбросы.
Медиана особенно полезна при распределении доходов, цен, длительностей и других данных с выбросами.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод уменьшает размерность, сохраняя расстояния?
Anonymous Quiz
43%
PCA
18%
LDA
30%
t-SNE
10%
MDS
🤔 Какой метод уменьшения размерности часто используется для визуализации данных?
Anonymous Quiz
48%
PCA
27%
PCA
16%
LDA
8%
NMF
💊21🤔5
🤔 Как работает having?

`HAVING` в SQL используется для фильтрации результатов группировки, которые были созданы с помощью `GROUP BY`. В отличие от `WHERE`, который фильтрует строки до группировки, `HAVING` применяет фильтры уже после того, как данные были агрегированы. Это позволяет отфильтровывать группы на основе агрегатных функций, таких как `COUNT()`, `SUM()` или `AVG()`. Использование `HAVING` удобно, когда требуется отобрать только те группы, которые соответствуют определённым условиям.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает дисперсию предсказаний ансамбля моделей?
Anonymous Quiz
55%
Bagging
31%
Boosting
6%
Stacking
8%
Averaging
🤔 Какой метод уменьшения размерности сохраняет глобальную структуру данных, используя геодезическое расстояние?
Anonymous Quiz
14%
PCA
6%
LDA
70%
Isomap
11%
T-SNE
🤔 Что будет с целевой меткой с предсказаниями, если обучалась на неотрицательной целевой метке?

Модель будет предсказывать только неотрицательные значения, что может ограничивать её применение.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какие методы используются для анализа временных рядов?
Anonymous Quiz
78%
ARIMA
5%
Exponential Smoothing
11%
LSTM
5%
Moving Average
💊8
🤔 Какой метод уменьшения размерности выделяет линейные комбинации признаков, которые лучше всего разделяют классы?
Anonymous Quiz
54%
PCA
24%
LDA
12%
Isomap
10%
T-SNE
🔥1
🤔 У бинарного классификатора разделение данных такое, что 95% в одном классе, 5% в другом — какую метрику следует выбрать?

Лучше использовать F1-score, AUC-ROC или precision-recall, поскольку они учитывают дисбаланс классов и избегают искажений, связанных с accuracy.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊1
🤔 Какой метод уменьшения размерности используется для выявления скрытых факторов в данных?
Anonymous Quiz
9%
K-means
68%
LDA (Latent Dirichlet Allocation)
18%
NMF
5%
Decision Tree
🔥1
🤔 Какой метод помогает бороться с мультиколлинеарностью в регрессии?
Anonymous Quiz
69%
Ridge Regression
8%
Gradient Descent
13%
Bootstrap
10%
Holdout Validation
👍1
🤔 Как обучаются линейные модели?

Линейные модели обучаются путём нахождения оптимальных весов, которые минимизируют функцию потери, обычно через градиентный спуск. В случае простых моделей (например, линейной регрессии) может быть использовано аналитическое решение (метод наименьших квадратов). При больших данных или сложных задачах применяется итеративный подход для более эффективной оптимизации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1
🤔 Какой метод используется для создания рекомендаций на основе сходства пользователей?
Anonymous Quiz
27%
K-means
69%
User-Based Collaborative Filtering
1%
Decision Tree
3%
Naive Bayes
👍1
🤔 Какой метод используется для оценки модели при наличии дисбалансированных данных?
Anonymous Quiz
3%
Точность
59%
F1-score
34%
ROC AUC
4%
Каппа коэффициент
👍1
🤔 Как работает градиентный спуск?

Градиентный спуск работает путём вычисления частных производных функции ошибки по параметрам модели и обновления параметров в направлении, которое уменьшает ошибку. На каждой итерации вычисляется градиент, указывающий, в каком направлении и насколько нужно изменить параметры модели. Если градиент положительный, параметры уменьшаются, а если отрицательный — увеличиваются. Процесс продолжается до тех пор, пока функция ошибки не достигнет локального минимума или не завершится заданное количество шагов.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1