Data Science | Тесты
2.51K subscribers
25 photos
349 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод используется для оценки моделей на небольших выборках путем многократного разбиения данных на обучающую и тестовую выборки?
Anonymous Quiz
14%
Decision Tree
4%
Логистическая регрессия
71%
Bootstrap
11%
TF-IDF
💊2
🤔 Какой метод регуляризации используют в Elastic Net?
Anonymous Quiz
6%
L1
6%
L2
78%
L1 и L2
10%
L1 и Dropout
🤔 Какая скорость поиска в хэш-таблице

Скорость поиска в хэш-таблице (например, HashMap) в среднем составляет O(1), так как ключи напрямую отображаются в индекс с помощью хэш-функции. В худшем случае, при коллизиях, время поиска может увеличиваться до O(n), если хэш-таблица не оптимизирована или используется неэффективная стратегия разрешения коллизий. Однако в большинстве случаев эффективные хэш-функции и методы обработки коллизий поддерживают близкую к O(1) скорость.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
🤔 Какая метрика оценивает качество бинарной классификации, учитывая как точность, так и полноту?
Anonymous Quiz
88%
F1-score
2%
Precision
3%
Recall
7%
Accuracy
🤔 Как определить процент потерянной дисперсии?

Процент потерянной дисперсии можно определить, анализируя долю необъяснённой изменчивости данных моделью. Это измеряется разницей между общей дисперсией и той частью, которую смогла объяснить модель.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод используется для уменьшения смещения в ансамблевых моделях?
Anonymous Quiz
13%
Random Forest
13%
AdaBoost
38%
Gradient Boosting
37%
Bagging
🤔 Какой метод часто применяют для поиска скрытых паттернов в данных?
Anonymous Quiz
49%
Факторный анализ
8%
K-means
28%
PCA
16%
SVM
🤔 Какие есть 2 случайности в обучении модели случайного леса?

1. Случайность в выборе подмножества данных: для каждой модели дерева случайный лес использует метод bootstrap, выбирая случайные подмножества обучающего набора.
2. Случайность в выборе признаков: на каждом узле дерева выбирается случайное подмножество признаков для поиска лучшего разбиения.
Эти случайности способствуют снижению переобучения и повышению обобщающей способности модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод часто применяют для обнаружения выбросов в данных?
Anonymous Quiz
66%
Isolation Forest
17%
K-means
15%
PCA
3%
Логистическая регрессия
🤔 Какой метод используется для обработки категориальных признаков путем замены их числовыми значениями на основе частоты встречаемости?
Anonymous Quiz
5%
Decision Tree
2%
Логистическая регрессия
61%
Target Encoding
33%
TF-IDF
💊4
🤔 Примеры моделей с большим смещением и большой дисперсией.

Линейная регрессия имеет высокий bias, а Random Forest – высокий variance. Комбинация моделей помогает сбалансировать эти параметры.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1
🤔 Какой метод машинного обучения используется для обнаружения аномалий путем создания модели на основе нормальных данных и выявления отклонений?
Anonymous Quiz
11%
K-средние
56%
Изолирующий лес
25%
One-Class SVM
8%
Метод ближайших соседей
💊2
🤔 Что хуже: иметь много ложных срабатываний или ложно-отрицательных срабатываний?

Это зависит от задачи. Ложно-отрицательные срабатывания хуже в задачах, где важно не пропустить критический случай (например, диагностика). Ложные срабатывания могут быть менее критичными, но увеличивают нагрузку на систему.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для предсказания вероятностей классов?
Anonymous Quiz
4%
Линейная регрессия
80%
Логистическая регрессия
10%
Метод опорных векторов
6%
K-means
🤔 Какой алгоритм используется для выявления аномалий в данных?
Anonymous Quiz
9%
Random Forest
72%
Isolation Forest
5%
Gradient Boosting
14%
Naive Bayes
🤔 Какая скорость поиска в фреш мэрде?

Вопрос о "скорости поиска в фреш мэрде" не ясен, так как термин "фреш мэрд" не является стандартным в контексте известных алгоритмов или структур данных. Если нужна информация о конкретной технологии или термине, пожалуйста, уточните ваш запрос.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊21🔥2🤔1
🤔 Какой метод используется для выбора оптимального числа кластеров в алгоритмах кластеризации?
Anonymous Quiz
45%
Elbow method
24%
Silhouette method
10%
PCA
21%
K-nearest neighbors
💊1
🤔 Какой метод оценки параметров модели основан на распределении вероятностей?
Anonymous Quiz
8%
K-fold cross-validation
7%
Grid Search
79%
Bayesian Optimization
5%
Random Search