Data Science | Тесты
2.51K subscribers
25 photos
349 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод машинного обучения используется для предсказания категориальных переменных на основе временных рядов?
Anonymous Quiz
9%
Random Forest
12%
Decision Tree
74%
RNN
6%
K-means
🤔 Какую метрику регрессии используешь для объяснения результатов?

Для объяснения результатов регрессии обычно используются несколько метрик, таких как среднеквадратичная ошибка (MSE), средняя абсолютная ошибка (MAE) и R-квадрат. Выбор зависит от специфики задачи и приоритетов: чувствительности к выбросам, интерпретируемости или доли объясненной дисперсии. Важно учитывать контекст и использовать несколько метрик для полной оценки.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для нормализации данных, приводя их к стандартному нормальному распределению?
Anonymous Quiz
27%
Min-Max Scaling
66%
Z-score Normalization
5%
PCA
3%
LDA
🤔 Какой метод улучшает производительность моделей путем уменьшения смещения?
Anonymous Quiz
23%
Ridge Regression
23%
Lasso Regression
46%
Bagging
7%
PCA
🤔 Как систематическая ошибка и дисперсии связаны между собой?

Высокая систематическая ошибка (bias) уменьшает сложность модели, но снижает точность, а высокая дисперсия (variance) приводит к переобучению. Баланс между ними важен для оптимальной работы модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод машинного обучения используется для обнаружения аномалий, создавая плотностное распределение данных?
Anonymous Quiz
19%
K-средние
41%
Изолирующий лес
13%
Метод ближайших соседей
26%
One-Class SVM
🤔 Какой метод уменьшает переобучение, ограничивая сложность модели?
Anonymous Quiz
6%
Data Augmentation
9%
Gradient Boosting
71%
Regularization
14%
Batch Normalization
👍1
🤔 Как работают несимметрические метрики?

Несимметрические метрики в контексте машинного обучения оценивают модель, акцентируя внимание на одном классе или типе ошибки больше, чем на других. Это особенно полезно в случаях, когда стоимость одного типа ошибки значительно выше другого. Примером несимметричной метрики является F1-score, который более чувствителен к классам с меньшим числом образцов или когда важно сбалансировать точность и полноту.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод оценки модели использует разделение данных на K последовательных блоков и выполнение K экспериментов, в каждом из которых отдельный блок используется как тестовый набор, а оставшиеся данные — как тренировочный набор?
Anonymous Quiz
87%
Cross-validation
6%
Bootstrap
5%
Holdout Method
1%
ROC Curve Analysis
🤔 Какой метод часто применяют для прогнозирования временных рядов?
Anonymous Quiz
79%
ARIMA
5%
K-means
9%
PCA
7%
Логистическая регрессия
🤔 В чем отличия между loc и iloc?

В pandas `loc` используется для доступа по метке (label) индекса, а `iloc` — для доступа по числовому индексу, независимо от того, как промаркированы индексы.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
🤔 Какую функцию в pandas используют для создания DataFrame?
Anonymous Quiz
98%
pd.DataFrame()
2%
pd.Series()
0%
pd.concat()
0%
pd.merge()
🤔8
🤔 Какой метод оценивает важность признаков в случайном лесу?
Anonymous Quiz
21%
Gini Impurity
13%
Random Split
59%
Feature Importance
7%
Bootstrapping
💊4
🤔 Как использовать P-value, когда мы проверяем гипотезу?

P-value показывает вероятность получения текущих результатов при условии, что нулевая гипотеза верна. Если P-value ниже уровня значимости, нулевая гипотеза отвергается.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥1🤔1
🤔 Какой метод уменьшает смещение и дисперсию, использует L1 и L2 регуляризацию?
Anonymous Quiz
21%
Lasso
5%
Ridge
70%
Elastic Net
4%
PCA
🤔 Какой метод снижает переобучение, исключая доли данных?
Anonymous Quiz
57%
Dropout
19%
Batch Normalization
15%
Gradient Clipping
8%
Early Stopping
🤔 Как работает where?

Функция where возвращает элементы, соответствующие условию:
1. В SQL — фильтрует строки, соответствующие критериям.
2. В NumPy — выбирает элементы массива по условию или заменяет значения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔1
🤔 Какой метод оптимизации часто используется для обучения больших нейронных сетей благодаря своей эффективности и адаптивной скорости обучения?
Anonymous Quiz
9%
Метод Ньютона
5%
Линейная регрессия
84%
Адам (Adam)
2%
K-means
🤔1
🤔 Какой метод уменьшает размерность данных, сохраняя значимую информацию?
Anonymous Quiz
8%
Градиентный спуск
82%
Метод главных компонент
8%
Регрессия наименьших квадратов
2%
Метод ближайших соседей
🤔 Что такое Boxplot?

Это статистический график, показывающий распределение данных:
1. Ящик (Box) – показывает межквартильный размах (между Q1 и Q3).
2. Линия внутри ящика – медиана (Q2).
3. "Усы" – представляют диапазон данных без выбросов.
4. Точки за пределами усов – выбросы.
Boxplot полезен для визуализации асимметрии, выбросов и распределения данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM