Data Science | Тесты
2.5K subscribers
25 photos
352 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод улучшает интерпретируемость модели?
Anonymous Quiz
34%
Regularization
36%
LIME
11%
Gradient Boosting
20%
Cross-Validation
🤔 Примеры моделей с большим смещением и большой дисперсией?

Модели с большим смещением: упрощённые, например, линейная регрессия на сложных данных. Модели с большой дисперсией: сложные, такие как глубокие деревья или нейросети, особенно при недостатке данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод преобразует нелинейные данные в линейное пространство?
Anonymous Quiz
56%
Kernel PCA
12%
Lasso
28%
SVD
4%
Random Forest
🤔 Какой метод помогает обнаружить выбросы в многомерных данных?
Anonymous Quiz
60%
Isolation Forest
19%
LDA
16%
PCA
5%
Gradient Boosting
🤔 Как определить процент потерянной дисперсии?

Процент потерянной дисперсии можно определить, анализируя долю необъяснённой изменчивости данных моделью. Это измеряется разницей между общей дисперсией и той частью, которую смогла объяснить модель.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
🤔 Какая функция используется для вычисления коэффициента корреляции?
Anonymous Quiz
31%
pearsonr
7%
spearmanr
2%
kendalltau
60%
correlate
🤔 Какой метод sklearn используется для стандартизации данных?
Anonymous Quiz
80%
StandardScaler
10%
MinMaxScaler
1%
RobustScaler
9%
Normalizer
🤔 Какие переменные (типы данных) можно использовать в качестве ключей?

Хэшируемые типы данных, такие как числа, строки, кортежи с неизменяемыми элементами. Это важно, если требуется быстро сопоставить значения в структуре данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какая функция из pandas используется для обработки пропусков в данных?
Anonymous Quiz
20%
dropna()
65%
fillna()
14%
isna()
1%
notna()
🤔 Какую функцию в pandas используют для создания DataFrame?
Anonymous Quiz
96%
pd.DataFrame()
3%
pd.Series()
1%
pd.concat()
0%
pd.merge()
🤔 Как решить задачу, где присутствует одновременно два target - один categorical, другой continuous?

Использовать многозадачное обучение (multi-task learning) или обучить две независимые модели. При связи между таргетами можно учесть общие признаки или использовать архитектуры с разделёнными и общими слоями.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какая функция из библиотеки pandas удаляет пропуски в данных?
Anonymous Quiz
80%
dropna
14%
fillna
2%
replace
4%
drop
🤔 Какой метод оценки модели учитывает дисбаланс классов?
Anonymous Quiz
10%
Accuracy
6%
Precision
8%
Recall
76%
F1-Score
🤔 Где вообще используются линейные модели?

Линейные модели применяются в задачах с линейной зависимостью, таких как регрессия для предсказания спроса или цен, классификация в кредитных скорингах, а также в задачах с высоким соотношением признаков к данным.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод предотвращает переобучение в моделях градиентного бустинга?
Anonymous Quiz
30%
Dropout
47%
Early Stopping
18%
Batch Normalization
4%
Data Augmentation
💊3
🤔 Какая функция библиотеки NumPy используется для создания массива?
Anonymous Quiz
89%
array
4%
matrix
4%
create_array
3%
new_array
🤔 Как валидировать временные ряды?

Валидация по времени включает разбиение данных на интервалы с учётом временной последовательности. Методы: time series split (скользящее окно), расширяемое окно или кросс-валидация по времени.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какая функция библиотеки sklearn нормализует данные?
Anonymous Quiz
54%
normalize
19%
scale
15%
standardize
12%
transform
🤔 Какой метод уменьшает размерность и сохраняет расстояния?
Anonymous Quiz
58%
PCA
28%
t-SNE
11%
LDA
4%
MDS
🤔 У бинарного классификатора разделение данных такое, что 95% в одном классе, 5% в другом — какую метрику следует выбрать?

Лучше использовать F1-score, AUC-ROC или precision-recall, поскольку они учитывают дисбаланс классов и избегают искажений, связанных с accuracy.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2