Data Science | Тесты
2.71K subscribers
29 photos
581 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод используется для определения важности переменных в модели?
Anonymous Quiz
11%
Gini Impurity
9%
ROC-AUC Curve
9%
Cross-Validation
72%
Permutation Feature Importance
🤔 Какая функция используется для создания DataFrame в pandas?
Anonymous Quiz
94%
DataFrame()
2%
create_frame()
2%
make_dataframe()
2%
build_df()
🤔 Почему в картинках используют Standard Scaling вместо MinMax Scaling?

Standard Scaling (z-score normalization) чаще используется для обработки изображений, поскольку:
1. Он центрирует данные вокруг нуля и масштабирует их на основе стандартного отклонения, что улучшает производительность моделей, чувствительных к масштабам.
2. MinMax Scaling, преобразующий значения в диапазон [0, 1], может терять информацию о дисперсии пикселей.
3. Standard Scaling более устойчив к изменению контрастности и яркости изображений.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🔥1
🤔 Какой метод используется для повышения точности моделей путем создания ансамбля из нескольких моделей?
Anonymous Quiz
91%
Градиентный бустинг
6%
K-means
1%
Линейная регрессия
1%
Логистическая регрессия
🤔 Какой алгоритм используется для обнаружения выбросов в данных?
Anonymous Quiz
8%
K-means
70%
Isolation Forest
2%
Linear Regression
19%
PCA
🤔 Что такое градиентный спуск?

Градиентный спуск — это метод оптимизации, который используется для нахождения минимального значения функции ошибки модели путём итеративного изменения параметров модели (например, весов). На каждом шаге вычисляется градиент функции ошибки по параметрам, и параметры корректируются в направлении, противоположном градиенту. Шаг изменения регулируется параметром скорости обучения (learning rate). Градиентный спуск эффективен для обучения моделей с большим количеством параметров.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
👍2
🤔 Какой метод машинного обучения используется для классификации текстовых данных с учетом частотных характеристик слов?
Anonymous Quiz
90%
TF-IDF
2%
Линейная регрессия
2%
Decision Tree
6%
RNN
🤔 Какой метод используется для выявления скрытых переменных в данных?
Anonymous Quiz
58%
Латентный Дирихле распределение
4%
Кластеризация k-средних
32%
Метод главных компонент
6%
Решающее дерево
🤔 Какой метод оптимизации наиболее эффективен для глубоких нейросетей?
Anonymous Quiz
10%
Градиентный спуск
16%
Стохастический градиентный спуск
4%
Метод моментов Нестерова
71%
Адаптивная оценка момента (Adam)
🤔 Какой алгоритм оптимизации используется в XGBoost?
Anonymous Quiz
25%
Adam
47%
Gradient Descent
21%
L-BFGS
7%
Newton-Raphson
🤔 Какую метрику регрессии используешь для объяснения результатов?

Для объяснения результатов регрессии обычно используются несколько метрик, таких как среднеквадратичная ошибка (MSE), средняя абсолютная ошибка (MAE) и R-квадрат. Выбор зависит от специфики задачи и приоритетов: чувствительности к выбросам, интерпретируемости или доли объясненной дисперсии. Важно учитывать контекст и использовать несколько метрик для полной оценки.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🤔 Какой метод уменьшает смещение в ансамблевом обучении?
Anonymous Quiz
34%
Bagging
49%
Boosting
3%
Gradient Descent
13%
Cross-Validation
💊3
🤔 Какой алгоритм часто используется для прогнозирования временных рядов?
Anonymous Quiz
6%
Линейная регрессия
86%
ARIMA
3%
Случайный лес
5%
K-means
🤔 Какой оптимизатор выбрать для обучения нейронной сети?

Adam часто используется из-за адаптивного шага обучения. SGD предпочтителен для больших данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🤔 Какой алгоритм уменьшает размерность данных, сохраняя вариативность?
Anonymous Quiz
10%
Linear Regression
87%
Principal Component Analysis
3%
Decision Tree
0%
Naive Bayes