Data Science | Тесты
2.51K subscribers
25 photos
349 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Почему считается, что случайный лес не переобучается?

Считается, что случайный лес не склонен к переобучению, потому что он усредняет предсказания большого количества деревьев решений, каждое из которых обучается на случайной подвыборке данных и случайных признаках. Этот процесс помогает уменьшить влияние отдельных переобученных деревьев на финальное предсказание. В результате модель становится более устойчивой к ошибкам и шуму в данных. Кроме того, случайный лес не сильно зависит от малозначимых признаков, так как случайные выборки уменьшают их влияние.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод оценивает важность признаков в модели?
Anonymous Quiz
50%
Lasso Regression
2%
k-NN
15%
AdaBoost
33%
PCA
🤔 Какой алгоритм часто используют для сокращения размерности данных?
Anonymous Quiz
93%
PCA (Principal Component Analysis)
2%
Linear Regression
3%
K-Nearest Neighbors
3%
Decision Trees
🤔 Виды метрик машинного обучения.

1. Для классификации:
- Accuracy: доля верных предсказаний.
- Precision: точность предсказаний класса.
- Recall: полнота предсказаний класса.
- F1-score: сбалансированная метрика точности и полноты.
- ROC-AUC: качество модели при разных порогах.
2. Для регрессии:
- MSE: среднеквадратичная ошибка.
- MAE: средняя абсолютная ошибка.
- R²: объясненная доля дисперсии.
3. Для кластеризации:
- Silhouette Score: качество разделения кластеров.
- Dunn Index: компактность и разделенность кластеров.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод машинного обучения используется для анализа временных рядов?
Anonymous Quiz
2%
Logistic Regression
13%
RNN
83%
ARIMA
2%
Naive Bayes
🤔1
🤔 Какой метод уменьшает переобучение, добавляя регуляризацию в деревья решений?
Anonymous Quiz
8%
L1-регуляризация
19%
L2-регуляризация
53%
Обрезка деревьев
19%
Случайные леса
🤔 Какие знаешь рекомендательные модели?

Модели: коллаборативная фильтрация (на основе пользователей или элементов), контентная фильтрация, гибридные подходы и модели с использованием глубокого обучения (например, нейронные сетевые рекомендатели).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности использует разложения матриц?
Anonymous Quiz
55%
PCA
19%
LDA
19%
NMF
7%
T-SNE
🤔 Какая метрика лучше всего подходит для оценки качества модели классификации с несбалансированными классами?
Anonymous Quiz
6%
Accuracy
4%
Precision
8%
Recall
83%
F1-score
🤔 В чем различия между методами apply и applymap?

В pandas `apply` используется для применения функции вдоль оси DataFrame (по строкам или столбцам), в то время как `applymap` применяется к каждому элементу DataFrame индивидуально.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод оптимизации используется для обучения нейронных сетей?
Anonymous Quiz
11%
Метод Ньютона
76%
Градиентный спуск
10%
Метод опорных векторов
3%
K-means
🤔 Какой метод уменьшает смещение, добавляя ансамбль слабых моделей?
Anonymous Quiz
41%
Bagging
43%
Boosting
10%
Stacking
6%
Gradient Descent
👍2
🤔 Как оценивать эффективность работы рекомендательных моделей?

Используются метрики:
1. Precision@K и Recall@K для точности и полноты рекомендаций.
2. NDCG для оценки релевантности на основе позиций элементов.
3. Coverage — доля уникальных рекомендованных элементов.
4. Оценка на основе A/B-тестов или пользовательских метрик, таких как удержание.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности использует разложения матриц?
Anonymous Quiz
55%
PCA
26%
PCA
8%
NMF
10%
T-SNE
💊9
🤔 Какая функция в pandas используется для проверки пропусков?
Anonymous Quiz
86%
isna
10%
dropna
5%
fillna
0%
notna
🤔 Какие магические методы в python знаешь?

Магические методы в Python — это специальные методы, которые начинаются и заканчиваются двойным подчеркиванием. Примеры включают `__init__` (конструктор класса), `__str__` (представление объекта в виде строки), `__len__` (возвращает длину объекта) и `__getitem__` (обращение к элементам по индексу). Также есть методы, такие как `__add__` для перегрузки операторов и `__call__`, позволяющий объекту вести себя как функция. Эти методы позволяют кастомизировать поведение объектов Python.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает переобучение в нейронных сетях?
Anonymous Quiz
69%
Dropout
23%
Batch Normalization
6%
Gradient Clipping
2%
Momentum
💊4
🤔 Какой метод уменьшения размерности используется для визуализации высокоразмерных данных в двумерном или трехмерном пространстве?
Anonymous Quiz
33%
PCA
13%
LDA
27%
Isomap
27%
T-SNE
🤔 Как систематическая ошибка и дисперсии связаны между собой?

Высокая систематическая ошибка (bias) уменьшает сложность модели, но снижает точность, а высокая дисперсия (variance) приводит к переобучению. Баланс между ними важен для оптимальной работы модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
🤔 Какой метод используется для кластеризации данных на основе схожести объектов и их расстояний друг от друга?
Anonymous Quiz
67%
K-means
31%
DBSCAN
0%
Decision Tree
2%
Naive Bayes