Data Science | Тесты
2.51K subscribers
25 photos
348 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод оптимизации используется для минимизации функции потерь путем адаптивного изменения скорости обучения?
Anonymous Quiz
17%
Градиентный спуск
35%
Стохастический градиентный спуск
14%
RMSProp
35%
Адам
💊7
🤔 Какой метод оценки используется для уменьшения выбросов в данных?
Anonymous Quiz
47%
Z-score normalization
18%
RobustScaler
17%
Min-Max Scaling
18%
StandardScaler
👍3🤔1
🤔 Как работает MSE?

MSE (Mean Squared Error) — это метрика, используемая для оценки качества модели регрессии, которая измеряет среднее квадратичное отклонение предсказанных значений от фактических. Она рассчитывается как среднее арифметическое квадратов разности между предсказанными и реальными значениями: `MSE = (1/n) * Σ(actual - predicted)^2`, где n — количество наблюдений. MSE чувствительна к большим ошибкам, так как квадраты отклонений увеличивают вес крупных ошибок. Цель модели — минимизировать MSE, чтобы предсказания были как можно ближе к фактическим значениям.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод преобразует нелинейные данные в линейные?
Anonymous Quiz
24%
One-Hot Encoding
24%
Principal Component Analysis
34%
Kernel Trick
18%
Dimensionality Reduction
🤔 Какой метод машинного обучения оценивает плотность данных?
Anonymous Quiz
3%
Random Forest
23%
K-means Clustering
12%
Support Vector Machine
62%
Kernel Density Estimation
🤔 Когда берём t-критерий, а когда Манна–Уитни?

- t-критерий Стьюдента — применяют, если данные распределены нормально, сравниваются средние двух групп, и желательно равные дисперсии.
- Критерий Манна–Уитни — используется, если нет уверенности в нормальности данных. Это непараметрический тест, сравнивает распределения или медианы.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3💊1
🤔 Какой метод уменьшения размерности используется для визуализации данных в двумерном или трехмерном пространстве, сохраняя локальные структуры?
Anonymous Quiz
38%
PCA
6%
LDA
20%
Isomap
36%
T-SNE
🤔 Какой метод машинного обучения устойчив к выбросам благодаря использованию медианного значения ошибки?
Anonymous Quiz
5%
Линейная регрессия
61%
Медианная регрессия
6%
Логистическая регрессия
28%
Случайный лес
🤔4💊3
🤔 Какие есть проблемы с Batch Norm?

1. Зависимость от мини-батчей: небольшие батчи могут приводить к нестабильной оценке среднего и дисперсии.
2. Сложности с применением в рекуррентных сетях: последовательность данных может вызывать проблемы с нормализацией.
3. Увеличение вычислительных затрат: дополнительные параметры и операции замедляют обучение.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод повышения устойчивости моделей используется в ансамблях?
Anonymous Quiz
18%
Dropout
47%
Boosting
26%
Cross-validation
10%
Gradient Descent
👍1
🤔 Какой метод машинного обучения используется для снижения размерности данных и выделения скрытых структур путем обучения нейронной сети?
Anonymous Quiz
9%
Decision Tree
5%
Логистическая регрессия
58%
Автоэнкодеры
28%
TF-IDF
🤔 Как валидировать временные ряды?

Валидация по времени включает разбиение данных на интервалы с учётом временной последовательности. Методы: time series split (скользящее окно), расширяемое окно или кросс-валидация по времени.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию в случайном лесе?
Anonymous Quiz
13%
Pruning
20%
Boosting
59%
Bagging
9%
Gradient Descent
💊3
🤔 Какой метод уменьшает смещение и дисперсию, нормализуя входные данные?
Anonymous Quiz
84%
Batch Normalization
9%
Dropout
0%
Early Stopping
7%
Data Augmentation
🤔 Какой оптимизатор выбрать для обучения нейронной сети?

Adam часто используется из-за адаптивного шага обучения. SGD предпочтителен для больших данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод оценки моделей устойчив к выбросам в данных?
Anonymous Quiz
28%
Mean Absolute Error
16%
Root Mean Square Error
43%
Median Absolute Deviation
14%
R-Squared
🤔3
🤔 Какой метод уменьшает смещение в модели машинного обучения?
Anonymous Quiz
38%
Регуляризация L1
15%
Градиентный спуск
33%
Бустинг
14%
Кросс-валидация
🤔 В каких случаях логистическая регрессия на задачах классификации будет работать лучше, чем случайный лес?

Логистическая регрессия может работать лучше, чем случайный лес, когда данные линейно разделимы или когда модель должна быть интерпретируемой. Логистическая регрессия проще и менее склонна к переобучению, особенно на небольших и чистых наборах данных. Случайный лес может давать более сложные предсказания, но при этом быть менее интерпретируемым. В задачах, где важна простота и скорость работы модели, логистическая регрессия может быть предпочтительнее.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод оптимизации используется для минимизации функции потерь в нейронных сетях путем обновления весов на основе скользящего среднего градиента?
Anonymous Quiz
14%
Градиентный спуск
36%
Стохастический градиентный спуск
23%
RMSProp
27%
Адам
💊2
🤔 Какой метод кластеризации использует плотностное распределение данных?
Anonymous Quiz
15%
K-means
57%
DBSCAN
12%
Hierarchical Clustering
16%
Gaussian Mixture Models