Data Science | Тесты
2.51K subscribers
25 photos
351 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод в scikit-learn используется для масштабирования данных?
Anonymous Quiz
85%
StandardScaler()
7%
OneHotEncoder()
4%
KMeans()
4%
PCA()
🤔 Какая библиотека в Python используется для работы с массивами?
Anonymous Quiz
87%
NumPy
12%
Pandas
1%
Matplotlib
0%
Seaborn
🤔 Какие известны рекомендательные модели?

1. Content-based модели анализируют характеристики объектов и рекомендуют похожие на те, которые пользователь уже оценил.
2. Collaborative filtering модели используют информацию о предпочтениях других пользователей.
3. Гибридные модели комбинируют эти подходы для повышения точности.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод помогает в выборе наиболее важных признаков?
Anonymous Quiz
39%
Grid Search
31%
Random Forest
13%
Gradient Boosting
17%
Ridge Regression
🤔 Какой метод позволяет уменьшить дисперсию ансамбля моделей?
Anonymous Quiz
61%
Bagging
24%
Boosting
7%
Stacking
7%
Dropout
🤔 Что известно о ML дизайне?

ML-дизайн включает выбор модели, структуры данных, метрик и процесса обучения для конкретной задачи. Важные аспекты:
• Постановка задачи (классификация, регрессия, кластеризация).
• Подготовка данных (очистка, масштабирование, выделение признаков).
• Выбор и настройка модели, а также оптимизация гиперпараметров.
• Оценка результатов (использование метрик качества и валидации).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2👍1
🤔 Какой метод помогает бороться с мультиколлинеарностью?
Anonymous Quiz
14%
Ridge Regression
25%
Lasso Regression
14%
Elastic Net
46%
All of the above
🤔 Какой метод улучшает интерпретируемость модели?
Anonymous Quiz
34%
Regularization
36%
LIME
11%
Gradient Boosting
20%
Cross-Validation
🤔 Примеры моделей с большим смещением и большой дисперсией?

Модели с большим смещением: упрощённые, например, линейная регрессия на сложных данных. Модели с большой дисперсией: сложные, такие как глубокие деревья или нейросети, особенно при недостатке данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод преобразует нелинейные данные в линейное пространство?
Anonymous Quiz
56%
Kernel PCA
12%
Lasso
28%
SVD
4%
Random Forest
🤔 Какой метод помогает обнаружить выбросы в многомерных данных?
Anonymous Quiz
60%
Isolation Forest
19%
LDA
16%
PCA
5%
Gradient Boosting
🤔 Как определить процент потерянной дисперсии?

Процент потерянной дисперсии можно определить, анализируя долю необъяснённой изменчивости данных моделью. Это измеряется разницей между общей дисперсией и той частью, которую смогла объяснить модель.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
🤔 Какая функция используется для вычисления коэффициента корреляции?
Anonymous Quiz
31%
pearsonr
7%
spearmanr
2%
kendalltau
60%
correlate
🤔 Какой метод sklearn используется для стандартизации данных?
Anonymous Quiz
80%
StandardScaler
10%
MinMaxScaler
1%
RobustScaler
9%
Normalizer
🤔 Какие переменные (типы данных) можно использовать в качестве ключей?

Хэшируемые типы данных, такие как числа, строки, кортежи с неизменяемыми элементами. Это важно, если требуется быстро сопоставить значения в структуре данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какая функция из pandas используется для обработки пропусков в данных?
Anonymous Quiz
20%
dropna()
65%
fillna()
14%
isna()
1%
notna()
🤔 Какую функцию в pandas используют для создания DataFrame?
Anonymous Quiz
96%
pd.DataFrame()
3%
pd.Series()
1%
pd.concat()
0%
pd.merge()
🤔 Как решить задачу, где присутствует одновременно два target - один categorical, другой continuous?

Использовать многозадачное обучение (multi-task learning) или обучить две независимые модели. При связи между таргетами можно учесть общие признаки или использовать архитектуры с разделёнными и общими слоями.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какая функция из библиотеки pandas удаляет пропуски в данных?
Anonymous Quiz
80%
dropna
14%
fillna
2%
replace
4%
drop
🤔 Какой метод оценки модели учитывает дисбаланс классов?
Anonymous Quiz
10%
Accuracy
6%
Precision
8%
Recall
76%
F1-Score