Data Science | Тесты
2.51K subscribers
25 photos
351 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Где вообще используются линейные модели?

Линейные модели применяются в задачах с линейной зависимостью, таких как регрессия для предсказания спроса или цен, классификация в кредитных скорингах, а также в задачах с высоким соотношением признаков к данным.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод предотвращает переобучение в моделях градиентного бустинга?
Anonymous Quiz
30%
Dropout
47%
Early Stopping
18%
Batch Normalization
4%
Data Augmentation
💊3
🤔 Какая функция библиотеки NumPy используется для создания массива?
Anonymous Quiz
89%
array
4%
matrix
4%
create_array
3%
new_array
🤔 Как валидировать временные ряды?

Валидация по времени включает разбиение данных на интервалы с учётом временной последовательности. Методы: time series split (скользящее окно), расширяемое окно или кросс-валидация по времени.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какая функция библиотеки sklearn нормализует данные?
Anonymous Quiz
54%
normalize
19%
scale
15%
standardize
12%
transform
🤔 Какой метод уменьшает размерность и сохраняет расстояния?
Anonymous Quiz
58%
PCA
28%
t-SNE
11%
LDA
4%
MDS
🤔 У бинарного классификатора разделение данных такое, что 95% в одном классе, 5% в другом — какую метрику следует выбрать?

Лучше использовать F1-score, AUC-ROC или precision-recall, поскольку они учитывают дисбаланс классов и избегают искажений, связанных с accuracy.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод помогает обнаружить выбросы в данных?
Anonymous Quiz
23%
PCA
65%
Isolation Forest
3%
Linear Regression
9%
SVM
🤔 Какая функция в pandas объединяет два DataFrame?
Anonymous Quiz
54%
merge
37%
concat
7%
join
2%
append
💊2
🤔 Сколько слоёв многослойного перцептрона с линейной функцией активации понадобится для приближения полинома третьей степени?

Одного слоя недостаточно, так как линейные функции не способны моделировать нелинейности. Нужны нелинейные функции активации для успешного приближения.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод помогает обнаружить скрытые зависимости в данных?
Anonymous Quiz
46%
Association Rule Learning
14%
Gradient Boosting
29%
Random Forest
11%
SVM
💊3👍1
🤔 Какой метод оценки моделей устойчив к выбросам в данных?
Anonymous Quiz
31%
Mean Absolute Error
19%
Root Mean Square Error
30%
Median Absolute Deviation
19%
R-Squared
🤔 При свёртке картинки HxW матрицей 3x3, что получится в итоге?

Результирующий размер изображения будет (H−2)×(W−2)(H-2) \times (W-2), если не использовать дополнение, так как свёртка "обрезает" края.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод регуляризации помогает предотвратить переобучение?
Anonymous Quiz
79%
Lasso Regression
6%
Random Forest
9%
K-Means Clustering
6%
Principal Component Analysis
🤔 Какой метод помогает бороться с мультиколлинеарностью в регрессии?
Anonymous Quiz
65%
Ridge Regression
10%
Gradient Descent
18%
Bootstrap
6%
Holdout Validation
👍1
🤔 Какие есть детекторы и архитектуры в CV?

Классические: SIFT, HOG. Современные архитектуры: YOLO, SSD, Faster R-CNN для детекции объектов, U-Net, DeepLab для сегментации.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию в ансамблевом обучении?
Anonymous Quiz
61%
Bagging
19%
Boosting
11%
Gradient Descent
10%
Cross-Validation
🤔 Какой метод оценки модели учитывает дисбаланс классов?
Anonymous Quiz
13%
Accuracy
6%
Precision
6%
Recall
75%
F1-Score
🤔 Какой функционал оптимизируется в задаче линейной регрессии? Как записать это в векторной записи?

Оптимизируется ошибка между предсказанными и фактическими значениями, минимизируя среднеквадратичное отклонение, что позволяет определить параметры модели.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод борьбы с дисбалансом классов создает новые примеры?
Anonymous Quiz
49%
Oversampling
7%
Undersampling
38%
SMOTE
7%
Class Weighing
1