Data Science | Тесты
2.51K subscribers
25 photos
347 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какая метрика оценки модели учитывает как ложные срабатывания, так и пропуски?
Anonymous Quiz
57%
F1-Score
25%
ROC-AUC
10%
Precision
8%
Accuracy
🤔 Какой метод часто применяют для визуализации многомерных данных?
Anonymous Quiz
62%
t-SNE
6%
K-means
31%
PCA
1%
Логистическая регрессия
🤔 Как работает регресс?

Регрессия — это метод машинного обучения, который моделирует зависимость между одной или несколькими независимыми переменными (признаками) и зависимой переменной (предсказываемой величиной). Основная цель регрессии — предсказать значение зависимой переменной на основе новых значений независимых переменных, минимизируя ошибку. В Data Science регрессия широко используется для прогнозирования и анализа взаимосвязей данных, таких как линейная и логистическая регрессии.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊1
🤔 Какой метод используется для повышения устойчивости модели к смещению данных?
Anonymous Quiz
38%
Data Augmentation
9%
Early Stopping
39%
Cross Validation
13%
Gradient Clipping
🤔 Что такое переобучение модели?

Переобучение (overfitting) происходит, когда модель слишком точно запоминает данные обучающей выборки, вместо того чтобы учить общие закономерности. В результате она плохо обобщает знания на новые данные и показывает высокую ошибку на тестовой выборке. Переобучение возникает, если модель слишком сложна или в обучающей выборке присутствует шум. Для борьбы с переобучением применяются методы регуляризации, кросс-валидации и увеличение объёма данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм основан на методе случайного подпространства и решающих деревьев?
Anonymous Quiz
10%
Gradient Boosting
80%
Random Forest
1%
Linear Regression
9%
Decision Tree
🤔 Какой метод проверки модели используется для временных рядов?
Anonymous Quiz
11%
K-Fold Cross-Validation
6%
Holdout Validation
79%
Time Series Split
3%
Bootstrap
🤔 Как градиент бустинг регрессор работает?

Градиент бустинг регрессор строит множество слабых моделей, таких как деревья решений, и комбинирует их для улучшения предсказаний. Модели обучаются последовательно, каждая новая модель пытается скорректировать ошибки предыдущих. На каждом шаге модель минимизирует ошибку, используя градиент функции потерь для обновления предсказаний. Этот процесс продолжается до тех пор, пока не будет достигнута определенная точность или не исчерпаны ресурсы.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для классификации данных на основе вероятностных зависимостей между признаками?
Anonymous Quiz
22%
Логистическая регрессия
10%
K-ближайших соседей
10%
Метод опорных векторов
57%
Наивный байесовский классификатор
🤔 Какой метод машинного обучения часто используется для кластеризации данных?
Anonymous Quiz
86%
K-средних
2%
Случайный лес
5%
Логистическая регрессия
7%
Дерево решений
🤔 Расскажи о Gradient-boosted trees

Gradient-boosted trees — это ансамблевый метод машинного обучения, который строит серию деревьев решений, каждое из которых исправляет ошибки предыдущих. Процесс обучения происходит путем последовательного добавления деревьев, каждое из которых минимизирует ошибку путем градиентного спуска, усиливая правильные прогнозы. Gradient boosting широко используется для задач регрессии и классификации, обеспечивая высокую точность и гибкость в работе с разными типами данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для обнаружения выбросов путем построения гиперплоскостей, отделяющих аномалии от нормальных данных?
Anonymous Quiz
5%
Линейная регрессия
32%
Изолирующий лес
55%
One-Class SVM
8%
Метод ближайших соседей
🤔 Какой метод используется для определения сходства между документами на основе их смысловых представлений?
Anonymous Quiz
2%
Decision Tree
2%
Логистическая регрессия
69%
Doc2Vec
27%
TF-IDF
🤔 Какими должны быть распределения для t-теста?

Для стандартного t-теста данные должны быть:
1. Нормально распределёнными.
2. Иметь одинаковую дисперсию между группами.
Если эти условия не выполняются, используют его модификации или непараметрические тесты.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод часто применяют для обнаружения аномалий в данных?
Anonymous Quiz
63%
LOF
14%
K-means
18%
PCA
4%
Логистическая регрессия
🤔 Какой метод уменьшает дисперсию, изменяя веса слабых моделей на основе их ошибок?
Anonymous Quiz
23%
AdaBoost
51%
Gradient Boosting
17%
Bagging
9%
Stacking
🤔 Как работает MSE?

MSE (Mean Squared Error) — это метрика, используемая для оценки качества модели регрессии, которая измеряет среднее квадратичное отклонение предсказанных значений от фактических. Она рассчитывается как среднее арифметическое квадратов разности между предсказанными и реальными значениями: `MSE = (1/n) * Σ(actual - predicted)^2`, где n — количество наблюдений. MSE чувствительна к большим ошибкам, так как квадраты отклонений увеличивают вес крупных ошибок. Цель модели — минимизировать MSE, чтобы предсказания были как можно ближе к фактическим значениям.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию в модели линейной регрессии?
Anonymous Quiz
24%
Bagging
19%
Boosting
34%
Ridge
23%
Lasso
💊5
🤔 Какой метод оценки модели используется для борьбы с переобучением?
Anonymous Quiz
6%
Grid Search
78%
Cross-validation
6%
Gradient Descent
10%
Stochastic Gradient Descent