Data Science | Тесты
2.51K subscribers
25 photos
349 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Что известно о Gradient-boosted trees?

Это ансамблевый метод, строящий модель как последовательность слабых моделей (обычно деревьев), где каждая новая модель корректирует ошибки предыдущей. Он использует градиентный спуск по функции потерь. Обладает высокой точностью и хорошо работает с табличными данными, но чувствителен к гиперпараметрам. Популярные реализации — XGBoost, LightGBM, CatBoost.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод применяется для балансировки несбалансированных данных?
Anonymous Quiz
67%
SMOTE
12%
РCA
13%
T-SNE
7%
K-means
🤔 Какой метод позволяет уменьшить размерность данных с минимальными потерями информации?
Anonymous Quiz
3%
Линейная регрессия
86%
Метод главных компонент (PCA)
7%
Полиномиальная регрессия
4%
Логистическая регрессия
🤔2
🤔 Какие знаешь рекомендательные модели?

Модели: коллаборативная фильтрация (на основе пользователей или элементов), контентная фильтрация, гибридные подходы и модели с использованием глубокого обучения (например, нейронные сетевые рекомендатели).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
🤔 Какой метод машинного обучения используется для классификации на основе вероятностей?
Anonymous Quiz
6%
Линейная регрессия
6%
K-ближайших соседей
8%
Метод опорных векторов
79%
Наивный байесовский классификатор
🤔 Какой метод уменьшает смещение и дисперсию, добавляя искусственные примеры данных?
Anonymous Quiz
24%
Batch Normalization
5%
Dropout
70%
Data Augmentation
1%
Early Stopping
💊40
🤔 Как работает деревянный регрессор?

Предполагая, что вы имели в виду "дерево решений регрессор" (Decision Tree Regressor), этот метод использует дерево решений для предсказания непрерывной переменной. Дерево строится путем разделения данных на узлы, основываясь на условиях, которые максимально уменьшают дисперсию (или другой критерий разбиения) ответа в узлах. Результат в новом узле представляет собой среднее значение целевой переменной по всем образцам, попавшим в этот узел.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊16🤔2🔥1
🤔 Какой алгоритм решает задачу оптимизации методом имитации отжига?
Anonymous Quiz
19%
Genetic Algorithm
48%
Simulated Annealing
16%
Gradient Descent
18%
Particle Swarm
🤔9💊3
🤔 Какой метод машинного обучения используется для задач классификации, когда данные имеют высокую размерность и мало наблюдений?
Anonymous Quiz
6%
Линейная регрессия
72%
Метод опорных векторов (SVM)
13%
Логистическая регрессия
10%
K-means
🤔 Как изменится метрика ROC-AUC, если функцию вероятности принадлежности первому классу применить алгоритм?

ROC-AUC останется неизменной, если алгоритм сохраняет порядок вероятностей, так как метрика основывается на ранжировании. При нарушении порядка вероятностей, например, из-за некорректной трансформации, значение ROC-AUC снизится.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой алгоритм используется для поиска наиболее близких точек в многомерных данных?
Anonymous Quiz
22%
DBSCAN
33%
K-means
42%
k-NN
3%
PCA
💊7
🤔 Какой метод позволяет оценивать важность признаков?
Anonymous Quiz
41%
PCA
41%
Feature Scaling
13%
Random Forest
5%
Standardization
💊19👍1
🤔 Что будет с целевой меткой с предсказаниями, если обучалась на неотрицательной целевой метке?

Модель будет предсказывать только неотрицательные значения, что может ограничивать её применение.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод обучения уменьшает дисперсию в ансамблевой модели?
Anonymous Quiz
53%
Bagging
27%
Boosting
8%
Stacking
11%
Gradient Descent
👍1
🤔 Какой метод в scikit-learn используется для масштабирования данных?
Anonymous Quiz
86%
StandardScaler()
7%
OneHotEncoder()
1%
KMeans()
6%
PCA()
🤔 Зачем нужен метод dir для объектов?

Метод `dir()` в Python возвращает список атрибутов и методов объекта, что помогает разработчику понять структуру объекта и доступные ему функции.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какая метрика оценки качества модели предпочтительнее всего использовать для несбалансированных классов?
Anonymous Quiz
8%
Accuracy
8%
Precision
9%
Recall
75%
F1-score
🤔 Какой метод уменьшения размерности данных сохраняет глобальную структуру, используя геодезическое расстояние?
Anonymous Quiz
18%
PCA
11%
LDA
28%
T-SNE
43%
Isomap
🤔 Что такое градиентное затухание?

Градиентное затухание (vanishing gradients) — это проблема, когда в глубоких нейросетях градиенты становятся очень малыми при обратном распространении.
Это мешает обновлению весов в начальных слоях, и обучение "замирает".
Чаще всего возникает в RNN и в сетях с плохой инициализацией или неподходящей функцией активации.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
🤔 Какой метод машинного обучения используется для классификации данных, разделенных нелинейной границей?
Anonymous Quiz
1%
Линейная регрессия
16%
Логистическая регрессия
69%
Метод опорных векторов с ядром (SVM)
14%
K-means