Data Science | Тесты
2.6K subscribers
26 photos
1 video
394 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод уменьшает переобучение, используя комбинацию прогнозов нескольких моделей?
Anonymous Quiz
6%
Dropout
11%
Batch Normalization
75%
Boosting
7%
Regularization
💊5
🤔 Назови формулу линейной модели.

Формула линейной модели имеет вид: `y = w0 + w1 * x1 + w2 * x2 + ... + wn * xn`, где `y` — это предсказанная величина, `x1, x2, ..., xn` — входные переменные (признаки), а `w0, w1, ..., wn` — коэффициенты (веса), которые модель подбирает во время обучения. `w0` представляет собой свободный член (смещение или bias). Цель линейной регрессии — найти такие значения весов, которые минимизируют ошибку предсказания.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод уменьшает дисперсию в линейной регрессии?
Anonymous Quiz
35%
Lasso
33%
Ridge
16%
PCA
16%
Elastic Net
💊1
🤔 Какой метод уменьшает дисперсию в модели нейронной сети?
Anonymous Quiz
31%
Dropout
47%
Batch Normalization
13%
Gradient Clipping
8%
Data Augmentation
🤔 Какие реализации бустинга есть?

AdaBoost, Gradient Boosting, XGBoost, CatBoost и LightGBM. Они различаются производительностью и подходами к построению деревьев.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используют для оценки важности переменных в ансамблях?
Anonymous Quiz
5%
Random Sampling
77%
Feature Importances
11%
AdaBoost
8%
Cross-Validation
🤔 Какой метод оценки моделей учитывает как сложность модели, так и ее способность обобщать данные?
Anonymous Quiz
12%
R-squared
31%
Cross-Validation
32%
AIC (Akaike Information Criterion)
25%
F1-Score
🤔 Что известно про оконные функции?

Это SQL-функции, выполняющиеся по окну строк, но не сворачивающие их в одно значение.
- Используются с OVER().
- Примеры: ROW_NUMBER(), RANK(), LEAD(), LAG(), SUM() OVER(), AVG() OVER().


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод регуляризации добавляет сумму абсолютных значений коэффициентов?
Anonymous Quiz
65%
Лассо-регрессия
22%
Ридж-регрессия
10%
SVM
3%
Кросс-валидация
🤔 Какой метод уменьшает размерность и сохраняет расстояния?
Anonymous Quiz
42%
PCA
44%
t-SNE
9%
LDA
6%
MDS
💊1
🤔 Что такое Boxplot?

Это статистический график, показывающий распределение данных:
1. Ящик (Box) – показывает межквартильный размах (между Q1 и Q3).
2. Линия внутри ящика – медиана (Q2).
3. "Усы" – представляют диапазон данных без выбросов.
4. Точки за пределами усов – выбросы.
Boxplot полезен для визуализации асимметрии, выбросов и распределения данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
🤔 Какой метод sklearn используется для стандартизации данных?
Anonymous Quiz
81%
StandardScaler
8%
MinMaxScaler
2%
RobustScaler
9%
Normalizer
🤔 Можно ли тьюнить только Batch Norm?

1. Да, параметры Batch Norm, такие как скорость обучения, моментум и гамма/бета, могут быть настроены для улучшения обучения.
2. Однако тьюнинг только Batch Norm может быть недостаточен без оптимизации других частей модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍1💊1
🤔 Какой алгоритм уменьшает размерность данных, сохраняя важную информацию?
Anonymous Quiz
4%
KNN
80%
PCA
4%
Decision Tree
12%
SVM
🤔1
🤔 Какой метод уменьшает размерность данных, сохраняя вариативность?
Anonymous Quiz
7%
K-средних
27%
Метод опорных векторов (SVM)
64%
Главные компоненты (PCA)
2%
Линейная регрессия
🤔1
Media is too big
VIEW IN TELEGRAM
📺 База 1000+ реальных собеседований

На программиста, тестировщика, аналитика, проджекта и другие IT профы.

Есть собесы от ведущих компаний: Сбер, Яндекс, ВТБ, Тинькофф, Озон, Wildberries и т.д.

🎯 Переходи по ссылке и присоединяйся к базе, чтобы прокачать свои шансы на успешное трудоустройство!
Please open Telegram to view this post
VIEW IN TELEGRAM
Телеграм канал моего друга @RuslanSenatorov – Вся математика для Машинного обучения и Data Science.

Уникальный формат автора, где он выкладывает видео с его студентами по математике и программированию для Data Science. В формате реальных уроков он разбирает ключевые темы по математике для Data Science. Увидите, как проходят занятия, и сможете повторять вместе с ним. Самое главное "математика без страха", он проводит уроке с юмором и позитивом, открывая мир математики с уникальной стороны.

На канале вы найдёте:
- Видео со студентами
- Пошаговый план обучения.
- Рекомендации по литературе и PDF книги
- Прикладной Python для Data Science без не нужной воды, которая нужна программистам.

Канал создан,для популяризации математики и программирования, подписывайтесь и начните прокачивать свои навыки в Data Science уже сегодня! 🚀
👍1🔥1🤔1💊1
🤔 Как работает Dropout?

Это техника регуляризации в нейросетях, уменьшающая переобучение:
1. На каждой итерации обучения случайно зануляется часть нейронов.
2. Это предотвращает чрезмерную зависимость от отдельных признаков.
3. Во время предсказания Dropout не применяется, а выходы масштабируются.
Dropout делает нейросеть более устойчивой и снижает вероятность переобучения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
🤔 Какой метод используется для обучения модели на дисбалансированных данных?
Anonymous Quiz
60%
Undersampling
8%
Grid Search
23%
Feature Scaling
8%
Dropout