Data Science | Тесты
2.51K subscribers
25 photos
348 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Как работает where?

Функция where возвращает элементы, соответствующие условию:
1. В SQL — фильтрует строки, соответствующие критериям.
2. В NumPy — выбирает элементы массива по условию или заменяет значения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔1
🤔 Какой метод оптимизации часто используется для обучения больших нейронных сетей благодаря своей эффективности и адаптивной скорости обучения?
Anonymous Quiz
9%
Метод Ньютона
5%
Линейная регрессия
84%
Адам (Adam)
2%
K-means
🤔1
🤔 Какой метод уменьшает размерность данных, сохраняя значимую информацию?
Anonymous Quiz
8%
Градиентный спуск
82%
Метод главных компонент
8%
Регрессия наименьших квадратов
2%
Метод ближайших соседей
🤔 Что такое Boxplot?

Это статистический график, показывающий распределение данных:
1. Ящик (Box) – показывает межквартильный размах (между Q1 и Q3).
2. Линия внутри ящика – медиана (Q2).
3. "Усы" – представляют диапазон данных без выбросов.
4. Точки за пределами усов – выбросы.
Boxplot полезен для визуализации асимметрии, выбросов и распределения данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод оптимизации используется для минимизации функции потерь путем адаптивного изменения скорости обучения?
Anonymous Quiz
17%
Градиентный спуск
35%
Стохастический градиентный спуск
14%
RMSProp
35%
Адам
💊7
🤔 Какой метод оценки используется для уменьшения выбросов в данных?
Anonymous Quiz
47%
Z-score normalization
18%
RobustScaler
17%
Min-Max Scaling
18%
StandardScaler
👍3🤔1
🤔 Как работает MSE?

MSE (Mean Squared Error) — это метрика, используемая для оценки качества модели регрессии, которая измеряет среднее квадратичное отклонение предсказанных значений от фактических. Она рассчитывается как среднее арифметическое квадратов разности между предсказанными и реальными значениями: `MSE = (1/n) * Σ(actual - predicted)^2`, где n — количество наблюдений. MSE чувствительна к большим ошибкам, так как квадраты отклонений увеличивают вес крупных ошибок. Цель модели — минимизировать MSE, чтобы предсказания были как можно ближе к фактическим значениям.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод преобразует нелинейные данные в линейные?
Anonymous Quiz
24%
One-Hot Encoding
24%
Principal Component Analysis
34%
Kernel Trick
18%
Dimensionality Reduction
🤔 Какой метод машинного обучения оценивает плотность данных?
Anonymous Quiz
3%
Random Forest
23%
K-means Clustering
12%
Support Vector Machine
62%
Kernel Density Estimation
🤔 Когда берём t-критерий, а когда Манна–Уитни?

- t-критерий Стьюдента — применяют, если данные распределены нормально, сравниваются средние двух групп, и желательно равные дисперсии.
- Критерий Манна–Уитни — используется, если нет уверенности в нормальности данных. Это непараметрический тест, сравнивает распределения или медианы.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3💊1
🤔 Какой метод уменьшения размерности используется для визуализации данных в двумерном или трехмерном пространстве, сохраняя локальные структуры?
Anonymous Quiz
38%
PCA
6%
LDA
20%
Isomap
36%
T-SNE
🤔 Какой метод машинного обучения устойчив к выбросам благодаря использованию медианного значения ошибки?
Anonymous Quiz
5%
Линейная регрессия
61%
Медианная регрессия
6%
Логистическая регрессия
28%
Случайный лес
🤔4💊3
🤔 Какие есть проблемы с Batch Norm?

1. Зависимость от мини-батчей: небольшие батчи могут приводить к нестабильной оценке среднего и дисперсии.
2. Сложности с применением в рекуррентных сетях: последовательность данных может вызывать проблемы с нормализацией.
3. Увеличение вычислительных затрат: дополнительные параметры и операции замедляют обучение.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод повышения устойчивости моделей используется в ансамблях?
Anonymous Quiz
18%
Dropout
47%
Boosting
26%
Cross-validation
10%
Gradient Descent
👍1
🤔 Какой метод машинного обучения используется для снижения размерности данных и выделения скрытых структур путем обучения нейронной сети?
Anonymous Quiz
9%
Decision Tree
5%
Логистическая регрессия
58%
Автоэнкодеры
28%
TF-IDF
🤔 Как валидировать временные ряды?

Валидация по времени включает разбиение данных на интервалы с учётом временной последовательности. Методы: time series split (скользящее окно), расширяемое окно или кросс-валидация по времени.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию в случайном лесе?
Anonymous Quiz
13%
Pruning
20%
Boosting
59%
Bagging
9%
Gradient Descent
💊3
🤔 Какой метод уменьшает смещение и дисперсию, нормализуя входные данные?
Anonymous Quiz
84%
Batch Normalization
9%
Dropout
0%
Early Stopping
7%
Data Augmentation
🤔 Какой оптимизатор выбрать для обучения нейронной сети?

Adam часто используется из-за адаптивного шага обучения. SGD предпочтителен для больших данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод оценки моделей устойчив к выбросам в данных?
Anonymous Quiz
28%
Mean Absolute Error
16%
Root Mean Square Error
43%
Median Absolute Deviation
14%
R-Squared
🤔3