Data Science | Тесты
2.51K subscribers
25 photos
347 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод машинного обучения используется для уменьшения размерности данных, сохраняя как можно больше дисперсии?
Anonymous Quiz
70%
PCA
10%
LDA
15%
T-SNE
5%
NMF
🤔 Какой метод машинного обучения используется для обнаружения аномалий путем создания деревьев решений, где аномалии изолируются на верхних уровнях дерева?
Anonymous Quiz
4%
K-средние
88%
Изолирующий лес
5%
One-Class SVM
4%
Метод ближайших соседей
🤔 Где вообще используются линейные модели?

Линейные модели применяются в задачах с линейной зависимостью, таких как регрессия для предсказания спроса или цен, классификация в кредитных скорингах, а также в задачах с высоким соотношением признаков к данным.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой индекс часто используется для оценки качества кластеризации?
Anonymous Quiz
15%
R-squared
63%
Silhouette score
11%
Mean squared error
11%
Cross-entropy loss
🤔 Какой метод машинного обучения используется для повышения точности путем создания мета-модели на основе предсказаний нескольких базовых моделей?
Anonymous Quiz
27%
Бэггинг
65%
Стеккинг
3%
K-means
5%
T-SNE
🤔 Как делается прунинг деревьев?

1. Pre-pruning: остановка роста дерева по заранее заданным критериям (глубина, минимальный размер листа).
2. Post-pruning: удаление "слабых" ветвей после построения дерева для улучшения обобщения.
3. Метрики, такие как ошибка на валидационной выборке, помогают оценить, какие ветви обрезать.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
🤔 Какой метод машинного обучения используется для классификации на основе вероятностей?
Anonymous Quiz
9%
Линейная регрессия
4%
K-ближайших соседей
11%
Метод опорных векторов
76%
Наивный байесовский классификатор
🤔 Какой метод уменьшает смещение и дисперсию в модели?
Anonymous Quiz
39%
Bagging
15%
Gradient Descent
23%
Ensemble Learning
23%
Cross-Validation
💊12
🤔 В чем отличия рэбиэрт от арбитас?

ReBERT оптимизирует обработку текстов с учетом контекста, а ArbitAS – задач диалогов и генерации текста.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊5🔥1
🤔 Какой метод используется для уменьшения мультиколлинеарности в регрессии?
Anonymous Quiz
71%
Lasso
10%
Bagging
10%
Gradient Boosting
9%
Grid Search
🤔 Какой метод уменьшения размерности с сохранением глобальной структуры данных?
Anonymous Quiz
49%
PCA
31%
T-SNE
4%
T-SNE
16%
Isomap
🤔 Как работает having?

`HAVING` в SQL используется для фильтрации результатов группировки, которые были созданы с помощью `GROUP BY`. В отличие от `WHERE`, который фильтрует строки до группировки, `HAVING` применяет фильтры уже после того, как данные были агрегированы. Это позволяет отфильтровывать группы на основе агрегатных функций, таких как `COUNT()`, `SUM()` или `AVG()`. Использование `HAVING` удобно, когда требуется отобрать только те группы, которые соответствуют определённым условиям.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
🤔 Какой метод часто используется для обработки текстовых данных?
Anonymous Quiz
2%
Линейная регрессия
94%
TF-IDF
1%
Логистическая регрессия
3%
K-means
🤔 Какой метод часто применяют для анализа временных рядов?
Anonymous Quiz
86%
ARIMA
5%
K-means
2%
PCA
7%
Линейная регрессия
🤔 Как строится дерево?

Дерево решений строится путем рекурсивного деления данных на подмножества на основе наилучших признаков, которые уменьшают неопределенность (например, с использованием информации энтропии или критерия Джини). Каждый узел в дереве представляет решение на основе одного признака, а ветви — возможные исходы. Процесс деления продолжается до тех пор, пока все данные в узлах не будут однородными или не будет достигнуто ограничение глубины. Листья дерева содержат финальные предсказания для данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для устранения мультиколлинеарности?
Anonymous Quiz
57%
Principal Component Analysis
19%
Cross-Validation
16%
Bootstrap
8%
Holdout Validation
🤔 Какой метод уменьшает переобучение, ограничивая норму градиентов?
Anonymous Quiz
8%
Dropout
35%
Batch Normalization
49%
Gradient Clipping
9%
Early Stopping
🤔 Что известно о ML дизайне?

ML-дизайн включает выбор модели, структуры данных, метрик и процесса обучения для конкретной задачи. Важные аспекты:
• Постановка задачи (классификация, регрессия, кластеризация).
• Подготовка данных (очистка, масштабирование, выделение признаков).
• Выбор и настройка модели, а также оптимизация гиперпараметров.
• Оценка результатов (использование метрик качества и валидации).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
🤔 Какой алгоритм машинного обучения лучше всего подходит для обработки естественного языка?
Anonymous Quiz
2%
Линейная регрессия
3%
K-средних
5%
Случайный лес
90%
LSTM (Long Short-Term Memory)
🤔 Какая функция в pandas возвращает уникальные значения Series?
Anonymous Quiz
75%
unique
13%
nunique
10%
value_counts
2%
drop_duplicates