Data Science | Тесты
2.51K subscribers
25 photos
347 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Что такое градиентный спуск?

Градиентный спуск — это метод оптимизации, который используется для нахождения минимального значения функции ошибки модели путём итеративного изменения параметров модели (например, весов). На каждом шаге вычисляется градиент функции ошибки по параметрам, и параметры корректируются в направлении, противоположном градиенту. Шаг изменения регулируется параметром скорости обучения (learning rate). Градиентный спуск эффективен для обучения моделей с большим количеством параметров.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод машинного обучения используется для оценки важности признаков, устраняя менее важные признаки в итеративном процессе?
Anonymous Quiz
38%
PCA
36%
RFE
8%
K-means
17%
Naive Bayes
🤔 Какой метод уменьшения размерности учитывает только межклассовую дисперсию?
Anonymous Quiz
26%
PCA
30%
LDA
20%
T-SNE
24%
Isomap
🤔 В каких случаях логистическая регрессия на задачах классификации будет работать лучше, чем случайный лес?

Логистическая регрессия может работать лучше, чем случайный лес, когда данные линейно разделимы или когда модель должна быть интерпретируемой. Логистическая регрессия проще и менее склонна к переобучению, особенно на небольших и чистых наборах данных. Случайный лес может давать более сложные предсказания, но при этом быть менее интерпретируемым. В задачах, где важна простота и скорость работы модели, логистическая регрессия может быть предпочтительнее.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для уменьшения размерности данных путем разложения матриц на неотрицательные множители?
Anonymous Quiz
36%
PCA
29%
LDA
18%
LDA
17%
T-SNE
💊14
🤔 Какой метод часто применяют для оценки моделей регрессии?
Anonymous Quiz
87%
MSE
6%
K-means
1%
PCA
6%
Логистическая регрессия
💊2
🤔 Почему считается, что случайный лес не переобучается?

Считается, что случайный лес не склонен к переобучению, потому что он усредняет предсказания большого количества деревьев решений, каждое из которых обучается на случайной подвыборке данных и случайных признаках. Этот процесс помогает уменьшить влияние отдельных переобученных деревьев на финальное предсказание. В результате модель становится более устойчивой к ошибкам и шуму в данных. Кроме того, случайный лес не сильно зависит от малозначимых признаков, так как случайные выборки уменьшают их влияние.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод оценивает важность признаков в модели?
Anonymous Quiz
50%
Lasso Regression
3%
k-NN
16%
AdaBoost
32%
PCA
🤔 Какой алгоритм часто используют для сокращения размерности данных?
Anonymous Quiz
94%
PCA (Principal Component Analysis)
2%
Linear Regression
1%
K-Nearest Neighbors
3%
Decision Trees
🤔 Виды метрик машинного обучения.

1. Для классификации:
- Accuracy: доля верных предсказаний.
- Precision: точность предсказаний класса.
- Recall: полнота предсказаний класса.
- F1-score: сбалансированная метрика точности и полноты.
- ROC-AUC: качество модели при разных порогах.
2. Для регрессии:
- MSE: среднеквадратичная ошибка.
- MAE: средняя абсолютная ошибка.
- R²: объясненная доля дисперсии.
3. Для кластеризации:
- Silhouette Score: качество разделения кластеров.
- Dunn Index: компактность и разделенность кластеров.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод машинного обучения используется для анализа временных рядов?
Anonymous Quiz
2%
Logistic Regression
12%
RNN
85%
ARIMA
2%
Naive Bayes
🤔1
🤔 Какой метод уменьшает переобучение, добавляя регуляризацию в деревья решений?
Anonymous Quiz
8%
L1-регуляризация
17%
L2-регуляризация
54%
Обрезка деревьев
21%
Случайные леса
🤔 Какие знаешь рекомендательные модели?

Модели: коллаборативная фильтрация (на основе пользователей или элементов), контентная фильтрация, гибридные подходы и модели с использованием глубокого обучения (например, нейронные сетевые рекомендатели).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности использует разложения матриц?
Anonymous Quiz
54%
PCA
20%
LDA
19%
NMF
7%
T-SNE
🤔 Какая метрика лучше всего подходит для оценки качества модели классификации с несбалансированными классами?
Anonymous Quiz
5%
Accuracy
1%
Precision
8%
Recall
86%
F1-score
🤔 В чем различия между методами apply и applymap?

В pandas `apply` используется для применения функции вдоль оси DataFrame (по строкам или столбцам), в то время как `applymap` применяется к каждому элементу DataFrame индивидуально.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод оптимизации используется для обучения нейронных сетей?
Anonymous Quiz
13%
Метод Ньютона
76%
Градиентный спуск
9%
Метод опорных векторов
2%
K-means
🤔 Какой метод уменьшает смещение, добавляя ансамбль слабых моделей?
Anonymous Quiz
44%
Bagging
43%
Boosting
10%
Stacking
4%
Gradient Descent
👍2
🤔 Как оценивать эффективность работы рекомендательных моделей?

Используются метрики:
1. Precision@K и Recall@K для точности и полноты рекомендаций.
2. NDCG для оценки релевантности на основе позиций элементов.
3. Coverage — доля уникальных рекомендованных элементов.
4. Оценка на основе A/B-тестов или пользовательских метрик, таких как удержание.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности использует разложения матриц?
Anonymous Quiz
60%
PCA
24%
PCA
9%
NMF
7%
T-SNE
💊2