Data Science | Тесты
2.5K subscribers
25 photos
352 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод используется для выбора оптимальных гиперпараметров?
Anonymous Quiz
85%
Grid Search
11%
K-Fold Cross-Validation
1%
Standardization
3%
Bootstrap
🤔 Какими должны быть распределения для t-теста?

Для стандартного t-теста данные должны быть:
1. Нормально распределёнными.
2. Иметь одинаковую дисперсию между группами.
Если эти условия не выполняются, используют его модификации или непараметрические тесты.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какая функция в NumPy используется для создания массива?
Anonymous Quiz
92%
array()
4%
create_array()
3%
make_array()
2%
build_array()
🤔 Какая функция используется для обработки пропущенных данных в pandas?
Anonymous Quiz
78%
fillna()
14%
dropna()
5%
interpolate()
2%
replace()
🤔 Как можно сравнивать два ненормальных распределения?

1. Применить непараметрические тесты, такие как тест Манна-Уитни или Краскела-Уоллиса.
2. Использовать бутстрепинг для создания доверительных интервалов.
3. Рассмотреть преобразование данных для приближения к нормальному виду.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод оценки модели подходит для временных рядов?
Anonymous Quiz
4%
Holdout
8%
K-Fold Cross-Validation
86%
Time Series Split
3%
Leave-One-Out
🤔 Какой метод снижения размерности сохраняет вариативность данных?
Anonymous Quiz
65%
PCA
9%
LDA
18%
t-SNE
8%
SVD
1
🤔 Как работает where?

Функция where возвращает элементы, соответствующие условию:
1. В SQL — фильтрует строки, соответствующие критериям.
2. В NumPy — выбирает элементы массива по условию или заменяет значения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод в sklearn используется для уменьшения размерности?
Anonymous Quiz
82%
PCA
6%
LDA
9%
KMeans
3%
DBSCAN
🤔 Какая функция используется для создания DataFrame в pandas?
Anonymous Quiz
93%
DataFrame()
4%
create_frame()
2%
make_dataframe()
1%
build_df()
🤔 Какой базовый алгоритм чаще всего используется?

Линейная регрессия часто является базовым алгоритмом из-за своей интерпретируемости и простоты. Для классификации популярным выбором может быть логистическая регрессия.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод используется для обнаружения выбросов?
Anonymous Quiz
24%
K-means Clustering
23%
Principal Component Analysis
42%
Isolation Forest
12%
Feature Scaling
🤔 Какой метод увеличивает данные для обучения нейронной сети?
Anonymous Quiz
13%
Batch Normalization
77%
Data Augmentation
8%
Dropout
2%
Early Stopping
👍1
🤔 Как делается прунинг деревьев?

1. Pre-pruning: остановка роста дерева по заранее заданным критериям (глубина, минимальный размер листа).
2. Post-pruning: удаление "слабых" ветвей после построения дерева для улучшения обобщения.
3. Метрики, такие как ошибка на валидационной выборке, помогают оценить, какие ветви обрезать.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию в случайном лесу?
Anonymous Quiz
51%
Bagging
19%
Boosting
10%
Pruning
19%
Cross-Validation
🤔 Какой метод используется для устранения мультиколлинеарности?
Anonymous Quiz
62%
Principal Component Analysis
19%
Cross-Validation
12%
Bootstrap
7%
Holdout Validation
🤔 Как изменится метрика ROC-AUC, если функцию вероятности принадлежности первому классу применить алгоритм?

ROC-AUC останется неизменной, если алгоритм сохраняет порядок вероятностей, так как метрика основывается на ранжировании. При нарушении порядка вероятностей, например, из-за некорректной трансформации, значение ROC-AUC снизится.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для отбора признаков на основе важности?
Anonymous Quiz
22%
Gradient Descent
34%
Forward Selection
34%
Random Forest
10%
Backward Elimination
💊4
🤔 Какой метод уменьшает смещение и дисперсию в модели?
Anonymous Quiz
39%
Ensemble Learning
21%
Gradient Descent
1%
Feature Engineering
39%
Normalization
💊2
🤔 Что хуже: иметь много ложных срабатываний или ложно-отрицательных срабатываний?

Это зависит от задачи. Ложно-отрицательные срабатывания хуже в задачах, где важно не пропустить критический случай (например, диагностика). Ложные срабатывания могут быть менее критичными, но увеличивают нагрузку на систему.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM