Data Science | Тесты
2.51K subscribers
25 photos
350 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод уменьшения размерности учитывает только межклассовую дисперсию?
Anonymous Quiz
25%
PCA
32%
LDA
21%
T-SNE
23%
Isomap
🤔 В каких случаях логистическая регрессия на задачах классификации будет работать лучше, чем случайный лес?

Логистическая регрессия может работать лучше, чем случайный лес, когда данные линейно разделимы или когда модель должна быть интерпретируемой. Логистическая регрессия проще и менее склонна к переобучению, особенно на небольших и чистых наборах данных. Случайный лес может давать более сложные предсказания, но при этом быть менее интерпретируемым. В задачах, где важна простота и скорость работы модели, логистическая регрессия может быть предпочтительнее.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для уменьшения размерности данных путем разложения матриц на неотрицательные множители?
Anonymous Quiz
35%
PCA
30%
LDA
17%
LDA
18%
T-SNE
💊15
🤔 Какой метод часто применяют для оценки моделей регрессии?
Anonymous Quiz
86%
MSE
6%
K-means
1%
PCA
7%
Логистическая регрессия
💊2
🤔 Почему считается, что случайный лес не переобучается?

Считается, что случайный лес не склонен к переобучению, потому что он усредняет предсказания большого количества деревьев решений, каждое из которых обучается на случайной подвыборке данных и случайных признаках. Этот процесс помогает уменьшить влияние отдельных переобученных деревьев на финальное предсказание. В результате модель становится более устойчивой к ошибкам и шуму в данных. Кроме того, случайный лес не сильно зависит от малозначимых признаков, так как случайные выборки уменьшают их влияние.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод оценивает важность признаков в модели?
Anonymous Quiz
49%
Lasso Regression
2%
k-NN
16%
AdaBoost
33%
PCA
🤔 Какой алгоритм часто используют для сокращения размерности данных?
Anonymous Quiz
92%
PCA (Principal Component Analysis)
2%
Linear Regression
4%
K-Nearest Neighbors
3%
Decision Trees
🤔 Виды метрик машинного обучения.

1. Для классификации:
- Accuracy: доля верных предсказаний.
- Precision: точность предсказаний класса.
- Recall: полнота предсказаний класса.
- F1-score: сбалансированная метрика точности и полноты.
- ROC-AUC: качество модели при разных порогах.
2. Для регрессии:
- MSE: среднеквадратичная ошибка.
- MAE: средняя абсолютная ошибка.
- R²: объясненная доля дисперсии.
3. Для кластеризации:
- Silhouette Score: качество разделения кластеров.
- Dunn Index: компактность и разделенность кластеров.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод машинного обучения используется для анализа временных рядов?
Anonymous Quiz
2%
Logistic Regression
15%
RNN
81%
ARIMA
2%
Naive Bayes
🤔2
🤔 Какой метод уменьшает переобучение, добавляя регуляризацию в деревья решений?
Anonymous Quiz
8%
L1-регуляризация
19%
L2-регуляризация
53%
Обрезка деревьев
20%
Случайные леса
🤔 Какие знаешь рекомендательные модели?

Модели: коллаборативная фильтрация (на основе пользователей или элементов), контентная фильтрация, гибридные подходы и модели с использованием глубокого обучения (например, нейронные сетевые рекомендатели).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности использует разложения матриц?
Anonymous Quiz
54%
PCA
19%
LDA
18%
NMF
8%
T-SNE
🤔 Какая метрика лучше всего подходит для оценки качества модели классификации с несбалансированными классами?
Anonymous Quiz
6%
Accuracy
4%
Precision
8%
Recall
82%
F1-score
🤔 В чем различия между методами apply и applymap?

В pandas `apply` используется для применения функции вдоль оси DataFrame (по строкам или столбцам), в то время как `applymap` применяется к каждому элементу DataFrame индивидуально.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод оптимизации используется для обучения нейронных сетей?
Anonymous Quiz
11%
Метод Ньютона
76%
Градиентный спуск
10%
Метод опорных векторов
2%
K-means
🤔 Какой метод уменьшает смещение, добавляя ансамбль слабых моделей?
Anonymous Quiz
39%
Bagging
43%
Boosting
11%
Stacking
7%
Gradient Descent
👍2
🤔 Как оценивать эффективность работы рекомендательных моделей?

Используются метрики:
1. Precision@K и Recall@K для точности и полноты рекомендаций.
2. NDCG для оценки релевантности на основе позиций элементов.
3. Coverage — доля уникальных рекомендованных элементов.
4. Оценка на основе A/B-тестов или пользовательских метрик, таких как удержание.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности использует разложения матриц?
Anonymous Quiz
55%
PCA
27%
PCA
8%
NMF
10%
T-SNE
💊10
🤔 Какая функция в pandas используется для проверки пропусков?
Anonymous Quiz
86%
isna
9%
dropna
5%
fillna
0%
notna
🤔 Какие магические методы в python знаешь?

Магические методы в Python — это специальные методы, которые начинаются и заканчиваются двойным подчеркиванием. Примеры включают `__init__` (конструктор класса), `__str__` (представление объекта в виде строки), `__len__` (возвращает длину объекта) и `__getitem__` (обращение к элементам по индексу). Также есть методы, такие как `__add__` для перегрузки операторов и `__call__`, позволяющий объекту вести себя как функция. Эти методы позволяют кастомизировать поведение объектов Python.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1