Data Science | Тесты
2.51K subscribers
25 photos
351 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод уменьшает дисперсию, используя ансамблевое обучение?
Anonymous Quiz
54%
Bagging
10%
Stacking
19%
Boosting
17%
Random Forest
🤔 Что такое Boxplot?

Это статистический график, показывающий распределение данных:
1. Ящик (Box) – показывает межквартильный размах (между Q1 и Q3).
2. Линия внутри ящика – медиана (Q2).
3. "Усы" – представляют диапазон данных без выбросов.
4. Точки за пределами усов – выбросы.
Boxplot полезен для визуализации асимметрии, выбросов и распределения данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод часто применяют для оптимизации гиперпараметров?
Anonymous Quiz
88%
Grid Search
5%
K-means
5%
PCA
1%
Линейная регрессия
🤔 Какой метод часто применяют для борьбы с переобучением моделей?
Anonymous Quiz
91%
Dropout
2%
K-means
6%
PCA
1%
Линейная регрессия
🤔 Как работает Dropout?

Это техника регуляризации в нейросетях, уменьшающая переобучение:
1. На каждой итерации обучения случайно зануляется часть нейронов.
2. Это предотвращает чрезмерную зависимость от отдельных признаков.
3. Во время предсказания Dropout не применяется, а выходы масштабируются.
Dropout делает нейросеть более устойчивой и снижает вероятность переобучения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает дисперсию в глубокой нейронной сети?
Anonymous Quiz
34%
Dropout
51%
Batch Normalization
11%
Gradient Clipping
4%
Data Augmentation
🤔 Какой метод уменьшает смещение и дисперсию в случайном лесе?
Anonymous Quiz
14%
Pruning
59%
Bagging
17%
Boosting
10%
Cross-Validation
🤔 Что такое Median?

Это центральное значение упорядоченного ряда.
- Если количество элементов нечетное, медиана – это средний элемент.
- Если четное, медиана – среднее двух центральных значений.
Медиана менее чувствительна к выбросам, чем среднее (Mean).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1
🤔 Какой метод часто применяют для классификации изображений?
Anonymous Quiz
82%
CNN
9%
K-means
5%
PCA
4%
Логистическая регрессия
🤔 Какой метод часто применяют для обнаружения аномалий в данных?
Anonymous Quiz
78%
LOF
10%
K-means
11%
PCA
1%
Логистическая регрессия
🤔 Как работает HAVING?

HAVING в SQL используется для фильтрации агрегированных значений после GROUP BY:
- WHERE фильтрует строки, а HAVING – группы строк.
- HAVING можно применять к агрегатным функциям (SUM, AVG, COUNT).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥1
🤔 Какой метод уменьшает смещение и дисперсию в градиентном бустинге?
Anonymous Quiz
21%
Learning Rate
38%
Bagging
10%
Pruning
32%
Regularization
🤔 Какой метод уменьшает дисперсию, сохраняя важные признаки?
Anonymous Quiz
24%
Ridge
34%
Lasso
20%
Elastic Net
23%
PCA
🔥1
🤔 Что такое мультиколлинеарность?

Это ситуация, когда признаки сильно коррелируют друг с другом.
- Это вызывает нестабильность линейных моделей, так как коэффициенты могут становиться большими и неинтерпретируемыми.
- Решения: удаление зависимых признаков, PCA, L1-регуляризация (Lasso).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41
🤔 Какой метод часто применяют для предобработки данных перед моделированием?
Anonymous Quiz
83%
Normalization
4%
K-means
11%
PCA
2%
Логистическая регрессия
🤔 Какой метод уменьшает дисперсию, комбинируя слабые модели?
Anonymous Quiz
48%
Bagging
35%
Boosting
6%
Gradient Descent
10%
Cross-Validation
🤔 Что известно про оконные функции?

Это SQL-функции, выполняющиеся по окну строк, но не сворачивающие их в одно значение.
- Используются с OVER().
- Примеры: ROW_NUMBER(), RANK(), LEAD(), LAG(), SUM() OVER(), AVG() OVER().


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает переобучение с использованием L2 регуляризации?
Anonymous Quiz
61%
Ridge Regression
28%
Lasso Regression
7%
Elastic Net
4%
Dropout
🤔 Какой метод часто применяют для оценки качества классификационных моделей?
Anonymous Quiz
88%
ROC-кривая
6%
K-means
4%
PCA
2%
Линейная регрессия
🤔 Что такое бэкпропагейшен (Backpropagation)?

Это алгоритм обновления весов в нейросети путем распространения ошибки от выхода к входу:
1. Прямой проход – данные проходят через сеть, вычисляя предсказания.
2. Вычисление ошибки – разница между предсказанием и истинным значением.
3. Обратное распространение ошибки – градиенты ошибки передаются назад через слои с помощью правила цепочки (chain rule).
4. Обновление весов – веса корректируются методом градиентного спуска.
Бэкпропагейшен – ключевой алгоритм, позволяющий обучать глубокие нейронные сети.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM