Data Science | Тесты

Это вероятность получить значение настолько же экстремальное, как наблюдаемое, при условии, что оно принадлежит общему распределению.
Чем меньше p-value, тем выше вероятность, что точка — выброс.
Значение зависит от метода (Grubbs, Dixon, Z-score и др.). Обычно, если p < 0.05, точка может считаться выбросом.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

426 views16:01

🤔 Какая модель или техника используется для анализа временных рядов в Data Science?

Anonymous Quiz

Линейная регрессия

86%

ARIMA

SVM (Support Vector Machine)

Градиентный бустинг

140 voters406 views20:01

Data Science | Тесты

🤔 Какой алгоритм часто используется для предсказания непрерывных значений?

Anonymous Quiz

18%

Логистическая регрессия

117 voters392 views10:31

Data Science | Тесты

🤔 В каких случаях логистическая регрессия на задачах классификации будет работать лучше, чем случайный лес?

Логистическая регрессия может работать лучше, чем случайный лес, когда данные линейно разделимы или когда модель должна быть интерпретируемой. Логистическая регрессия проще и менее склонна к переобучению, особенно на небольших и чистых наборах данных. Случайный лес может давать более сложные предсказания, но при этом быть менее интерпретируемым. В задачах, где важна простота и скорость работы модели, логистическая регрессия может быть предпочтительнее.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

419 views16:01

Data Science | Тесты

🤔 Что измеряет метрика F1-score?

Anonymous Quiz

16%

Среднее арифметическое Precision и Recall

70%

Гармоническое среднее Precision и Recall

13%

Отношение Precision к Recall

Произведение Precision и Recall

142 voters417 views20:01

Data Science | Тесты

🤔 Какой метод помогает обнаружить выбросы в данных?

Anonymous Quiz

121 voters402 views09:01

Data Science | Тесты

🤔 Как обучаются линейные модели?

Линейные модели обучаются путём нахождения оптимальных весов, которые минимизируют функцию потери, обычно через градиентный спуск. В случае простых моделей (например, линейной регрессии) может быть использовано аналитическое решение (метод наименьших квадратов). При больших данных или сложных задачах применяется итеративный подход для более эффективной оптимизации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

411 views16:01

Data Science | Тесты

🤔 Какой алгоритм часто используется для прогнозирования временных рядов?

Anonymous Quiz

129 voters413 views20:01

Data Science | Тесты

🤔 Какая метрика наиболее устойчива к дисбалансу классов?

Anonymous Quiz

💊4

124 voters402 views09:01

Data Science | Тесты

🤔 Какие известны рекомендательные модели?

Content-Based Filtering, Collaborative Filtering, и Hybrid модели. Выбор зависит от задачи и данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

398 views16:01

Data Science | Тесты

🤔 Что измеряет метрика ROC AUC?

Anonymous Quiz

Точность модели

96%

Площадь под кривой ROC

Временную сложность алгоритма

Количество ошибок модели

135 voters400 views20:01

Data Science | Тесты

🤔 Какой метод оценки модели используется в условиях несбалансированных классов?

Anonymous Quiz

Коэффициент детерминации (R²)

107 voters354 views09:01

Data Science | Тесты

🤔 Как работает MSE?

MSE (Mean Squared Error) — это метрика, используемая для оценки качества модели регрессии, которая измеряет среднее квадратичное отклонение предсказанных значений от фактических. Она рассчитывается как среднее арифметическое квадратов разности между предсказанными и реальными значениями: `MSE = (1/n) * Σ(actual - predicted)^2`, где n — количество наблюдений. MSE чувствительна к большим ошибкам, так как квадраты отклонений увеличивают вес крупных ошибок. Цель модели — минимизировать MSE, чтобы предсказания были как можно ближе к фактическим значениям.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

387 views16:01

Data Science | Тесты

🤔 Какой метод уменьшает смещение и дисперсию, обучая на подвыборках данных?

Anonymous Quiz

113 voters379 views20:01

Data Science | Тесты

🤔 Какой метод используется для оценки качества прогнозирования вероятностных моделей?

Anonymous Quiz

Root Mean Squared Error

92 voters375 views09:01

Data Science | Тесты

🤔 Как систематическая ошибка и дисперсии связаны между собой?

Высокая систематическая ошибка (bias) уменьшает сложность модели, но снижает точность, а высокая дисперсия (variance) приводит к переобучению. Баланс между ними важен для оптимальной работы модели.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

379 views16:01

Data Science | Тесты

🤔 Какая модель лучше всего подходит для прогнозирования временных рядов?

Anonymous Quiz

Наивный Байес

Сверточные нейронные сети

86%

ARIMA

Случайный лес

120 voters360 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для классификации изображений на основе их пространственных характеристик?

Anonymous Quiz

K-means

89%

Convolutional Neural Networks (CNN)

Naive Bayes

Decision Tree

95 voters360 views09:01

Data Science | Тесты

🤔 Что можешь сказать про оконные функции?

Оконные функции в SQL и в библиотеках анализа данных, таких как pandas, позволяют выполнять вычисления по подмножествам данных (окнам), которые связаны с текущей строкой. Это включает в себя операции, такие как суммирование, вычисление среднего, и другие статистические функции, применяемые к "окну" данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

371 views16:01

About

Blog

Apps

Platform