Data Science | Тесты
2.51K subscribers
25 photos
348 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 В каких случаях логистическая регрессия на задачах классификации будет работать лучше, чем случайный лес?

Логистическая регрессия может работать лучше, чем случайный лес, когда данные линейно разделимы или когда модель должна быть интерпретируемой. Логистическая регрессия проще и менее склонна к переобучению, особенно на небольших и чистых наборах данных. Случайный лес может давать более сложные предсказания, но при этом быть менее интерпретируемым. В задачах, где важна простота и скорость работы модели, логистическая регрессия может быть предпочтительнее.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для уменьшения размерности данных путем разложения матриц на неотрицательные множители?
Anonymous Quiz
34%
PCA
30%
LDA
17%
LDA
19%
T-SNE
💊15
🤔 Какой метод часто применяют для оценки моделей регрессии?
Anonymous Quiz
87%
MSE
6%
K-means
1%
PCA
6%
Логистическая регрессия
💊2
🤔 Почему считается, что случайный лес не переобучается?

Считается, что случайный лес не склонен к переобучению, потому что он усредняет предсказания большого количества деревьев решений, каждое из которых обучается на случайной подвыборке данных и случайных признаках. Этот процесс помогает уменьшить влияние отдельных переобученных деревьев на финальное предсказание. В результате модель становится более устойчивой к ошибкам и шуму в данных. Кроме того, случайный лес не сильно зависит от малозначимых признаков, так как случайные выборки уменьшают их влияние.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод оценивает важность признаков в модели?
Anonymous Quiz
51%
Lasso Regression
2%
k-NN
15%
AdaBoost
32%
PCA
🤔 Какой алгоритм часто используют для сокращения размерности данных?
Anonymous Quiz
92%
PCA (Principal Component Analysis)
2%
Linear Regression
3%
K-Nearest Neighbors
3%
Decision Trees
🤔 Виды метрик машинного обучения.

1. Для классификации:
- Accuracy: доля верных предсказаний.
- Precision: точность предсказаний класса.
- Recall: полнота предсказаний класса.
- F1-score: сбалансированная метрика точности и полноты.
- ROC-AUC: качество модели при разных порогах.
2. Для регрессии:
- MSE: среднеквадратичная ошибка.
- MAE: средняя абсолютная ошибка.
- R²: объясненная доля дисперсии.
3. Для кластеризации:
- Silhouette Score: качество разделения кластеров.
- Dunn Index: компактность и разделенность кластеров.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод машинного обучения используется для анализа временных рядов?
Anonymous Quiz
2%
Logistic Regression
12%
RNN
83%
ARIMA
2%
Naive Bayes
🤔1
🤔 Какой метод уменьшает переобучение, добавляя регуляризацию в деревья решений?
Anonymous Quiz
9%
L1-регуляризация
19%
L2-регуляризация
53%
Обрезка деревьев
20%
Случайные леса
🤔 Какие знаешь рекомендательные модели?

Модели: коллаборативная фильтрация (на основе пользователей или элементов), контентная фильтрация, гибридные подходы и модели с использованием глубокого обучения (например, нейронные сетевые рекомендатели).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности использует разложения матриц?
Anonymous Quiz
54%
PCA
19%
LDA
19%
NMF
7%
T-SNE
🤔 Какая метрика лучше всего подходит для оценки качества модели классификации с несбалансированными классами?
Anonymous Quiz
5%
Accuracy
4%
Precision
8%
Recall
83%
F1-score
🤔 В чем различия между методами apply и applymap?

В pandas `apply` используется для применения функции вдоль оси DataFrame (по строкам или столбцам), в то время как `applymap` применяется к каждому элементу DataFrame индивидуально.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод оптимизации используется для обучения нейронных сетей?
Anonymous Quiz
11%
Метод Ньютона
76%
Градиентный спуск
10%
Метод опорных векторов
3%
K-means
🤔 Какой метод уменьшает смещение, добавляя ансамбль слабых моделей?
Anonymous Quiz
42%
Bagging
42%
Boosting
10%
Stacking
6%
Gradient Descent
👍2
🤔 Как оценивать эффективность работы рекомендательных моделей?

Используются метрики:
1. Precision@K и Recall@K для точности и полноты рекомендаций.
2. NDCG для оценки релевантности на основе позиций элементов.
3. Coverage — доля уникальных рекомендованных элементов.
4. Оценка на основе A/B-тестов или пользовательских метрик, таких как удержание.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности использует разложения матриц?
Anonymous Quiz
54%
PCA
26%
PCA
9%
NMF
11%
T-SNE
💊6
🤔 Какая функция в pandas используется для проверки пропусков?
Anonymous Quiz
85%
isna
9%
dropna
5%
fillna
0%
notna
🤔 Какие магические методы в python знаешь?

Магические методы в Python — это специальные методы, которые начинаются и заканчиваются двойным подчеркиванием. Примеры включают `__init__` (конструктор класса), `__str__` (представление объекта в виде строки), `__len__` (возвращает длину объекта) и `__getitem__` (обращение к элементам по индексу). Также есть методы, такие как `__add__` для перегрузки операторов и `__call__`, позволяющий объекту вести себя как функция. Эти методы позволяют кастомизировать поведение объектов Python.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает переобучение в нейронных сетях?
Anonymous Quiz
71%
Dropout
22%
Batch Normalization
7%
Gradient Clipping
0%
Momentum
💊1