Data Science | Тесты
2.7K subscribers
29 photos
591 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод используется для обнаружения выбросов?
Anonymous Quiz
17%
K-means Clustering
17%
Principal Component Analysis
55%
Isolation Forest
11%
Feature Scaling
🤔 Какой метод оптимизации применяется для поиска минимума функции?
Anonymous Quiz
64%
SGD
30%
SGD
4%
v3. K-means
3%
DBSCAN
🤔6💊6
🤔 Чему равно p-value для выброса?

Это вероятность получить значение настолько же экстремальное, как наблюдаемое, при условии, что оно принадлежит общему распределению.
Чем меньше p-value, тем выше вероятность, что точка — выброс.
Значение зависит от метода (Grubbs, Dixon, Z-score и др.). Обычно, если p < 0.05, точка может считаться выбросом.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🤔 Какая модель или техника используется для анализа временных рядов в Data Science?
Anonymous Quiz
6%
Линейная регрессия
86%
ARIMA
4%
SVM (Support Vector Machine)
4%
Градиентный бустинг
🤔 Какой алгоритм часто используется для предсказания непрерывных значений?
Anonymous Quiz
18%
Логистическая регрессия
71%
Линейная регрессия
9%
Случайный лес
3%
K-means
🤔 В каких случаях логистическая регрессия на задачах классификации будет работать лучше, чем случайный лес?

Логистическая регрессия может работать лучше, чем случайный лес, когда данные линейно разделимы или когда модель должна быть интерпретируемой. Логистическая регрессия проще и менее склонна к переобучению, особенно на небольших и чистых наборах данных. Случайный лес может давать более сложные предсказания, но при этом быть менее интерпретируемым. В задачах, где важна простота и скорость работы модели, логистическая регрессия может быть предпочтительнее.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🤔 Какой метод помогает обнаружить выбросы в данных?
Anonymous Quiz
20%
PCA
68%
Isolation Forest
3%
Linear Regression
9%
SVM
🤔 Как обучаются линейные модели?

Линейные модели обучаются путём нахождения оптимальных весов, которые минимизируют функцию потери, обычно через градиентный спуск. В случае простых моделей (например, линейной регрессии) может быть использовано аналитическое решение (метод наименьших квадратов). При больших данных или сложных задачах применяется итеративный подход для более эффективной оптимизации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🤔 Какой алгоритм часто используется для прогнозирования временных рядов?
Anonymous Quiz
5%
Линейная регрессия
90%
ARIMA
2%
Случайный лес
3%
K-means
🤔 Какая метрика наиболее устойчива к дисбалансу классов?
Anonymous Quiz
2%
Accuracy
4%
Precision
74%
F1-score
19%
ROC-AUC
💊4
🤔 Какие известны рекомендательные модели?

Content-Based Filtering, Collaborative Filtering, и Hybrid модели. Выбор зависит от задачи и данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🤔 Какой метод оценки модели используется в условиях несбалансированных классов?
Anonymous Quiz
5%
Точность (Accuracy)
2%
Полнота (Recall)
89%
F1-мера (F1-Score)
5%
Коэффициент детерминации (R²)
🤔 Как работает MSE?

MSE (Mean Squared Error) — это метрика, используемая для оценки качества модели регрессии, которая измеряет среднее квадратичное отклонение предсказанных значений от фактических. Она рассчитывается как среднее арифметическое квадратов разности между предсказанными и реальными значениями: `MSE = (1/n) * Σ(actual - predicted)^2`, где n — количество наблюдений. MSE чувствительна к большим ошибкам, так как квадраты отклонений увеличивают вес крупных ошибок. Цель модели — минимизировать MSE, чтобы предсказания были как можно ближе к фактическим значениям.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🤔 Какой метод уменьшает смещение и дисперсию, обучая на подвыборках данных?
Anonymous Quiz
60%
Bagging
24%
Boosting
12%
Stacking
4%
Dropout
🤔 Какой метод используется для оценки качества прогнозирования вероятностных моделей?
Anonymous Quiz
64%
Log Loss
15%
Mean Absolute Error
15%
R-squared
5%
Root Mean Squared Error
🤔 Как систематическая ошибка и дисперсии связаны между собой?

Высокая систематическая ошибка (bias) уменьшает сложность модели, но снижает точность, а высокая дисперсия (variance) приводит к переобучению. Баланс между ними важен для оптимальной работы модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🤔 Какая модель лучше всего подходит для прогнозирования временных рядов?
Anonymous Quiz
4%
Наивный Байес
6%
Сверточные нейронные сети
86%
ARIMA
4%
Случайный лес
🤔 Какой метод машинного обучения используется для классификации изображений на основе их пространственных характеристик?
Anonymous Quiz
7%
K-means
89%
Convolutional Neural Networks (CNN)
3%
Naive Bayes
0%
Decision Tree
🤔 Что можешь сказать про оконные функции?

Оконные функции в SQL и в библиотеках анализа данных, таких как pandas, позволяют выполнять вычисления по подмножествам данных (окнам), которые связаны с текущей строкой. Это включает в себя операции, такие как суммирование, вычисление среднего, и другие статистические функции, применяемые к "окну" данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний