Data Science | Тесты
2.51K subscribers
25 photos
349 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод машинного обучения используется для задач регрессии с учетом нелинейных зависимостей и взаимодействий между признаками?
Anonymous Quiz
7%
Линейная регрессия
52%
Полиномиальная регрессия
30%
Случайный лес
10%
Логистическая регрессия
🤔 Какой метод классификации использует ансамбли деревьев решений?
Anonymous Quiz
23%
Decision Trees
71%
Random Forest
2%
Logistic Regression
5%
K-Nearest Neighbors
🤔 Как градиент бустинг регрессор работает?

Градиент бустинг регрессор строит множество слабых моделей, таких как деревья решений, и комбинирует их для улучшения предсказаний. Модели обучаются последовательно, каждая новая модель пытается скорректировать ошибки предыдущих. На каждом шаге модель минимизирует ошибку, используя градиент функции потерь для обновления предсказаний. Этот процесс продолжается до тех пор, пока не будет достигнута определенная точность или не исчерпаны ресурсы.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какая модель машинного обучения чаще всего используется для анализа текстовых данных?
Anonymous Quiz
8%
Random Forest
9%
Logistic Regression
35%
Support Vector Machine
48%
Naive Bayes
💊2
🤔 Какой метод машинного обучения используется для классификации с неравномерным распределением классов?
Anonymous Quiz
16%
Метод опорных векторов (SVM)
17%
K-ближайших соседей (KNN)
20%
Случайный лес
46%
Взвешенная логистическая регрессия
🤔 Что такое пи вэлью?

P-value — это вероятность того, что наблюдаемые данные или более экстремальные данные могли бы возникнуть при условии, что нулевая гипотеза верна. В контексте статистических тестов, маленькое значение p-value указывает на то, что нулевая гипотеза может быть отвергнута в пользу альтернативной гипотезы. Обычно порог значимости устанавливается на уровне 0.05, и если p-value меньше этого порога, нулевая гипотеза отвергается. P-value не говорит о размере эффекта, а лишь о степени уверенности в полученных данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
🤔 Какой метод снижает размерность данных и увеличивает объяснимость?
Anonymous Quiz
88%
PCA
5%
K-means
5%
Logistic Regression
2%
Random Forest
🤔 Какой метод оптимизации используется для обучения нейронных сетей?
Anonymous Quiz
8%
Метод Ньютона
81%
Градиентный спуск
10%
Метод опорных векторов
1%
K-means
🤔 Что такое Median?

Это центральное значение упорядоченного ряда.
- Если количество элементов нечетное, медиана – это средний элемент.
- Если четное, медиана – среднее двух центральных значений.
Медиана менее чувствительна к выбросам, чем среднее (Mean).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
🤔 Какой метод машинного обучения используется для создания рекомендации на основе данных о поведении пользователей и товаров?
Anonymous Quiz
20%
Decision Tree
13%
Логистическая регрессия
46%
Matrix Factorization
21%
Автоэнкодеры
🤔 Какая метрика оценки качества модели регрессии представляет собой среднюю абсолютную ошибку предсказания?
Anonymous Quiz
87%
Mean Absolute Error
4%
Root Mean Squared Error
2%
R-squared
7%
Mean Squared Error
🤔 Как объяснить бизнесу метрику машинного обучения?

1. Сфокусируйтесь на бизнес-цели: Объясните, как метрика напрямую влияет на цели компании (например, рост прибыли, снижение ошибок).
2. Избегайте технических терминов: Переведите метрику в понятные термины, например, "точность модели" — это процент правильно принятых решений.
3. Приведите примеры: Покажите, как изменения метрики влияют на реальные сценарии (например, снижение ошибок классификации улучшает качество обслуживания).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2💊2
🤔 Какая функция в NumPy используется для создания массива?
Anonymous Quiz
90%
array()
7%
create_array()
2%
make_array()
1%
build_array()
🤔 Какой метод машинного обучения используется для снижения размерности данных путем разложения тензоров?
Anonymous Quiz
3%
Decision Tree
2%
Логистическая регрессия
87%
Tensor Decomposition
8%
Автоэнкодеры
💊1
🤔 Что такое переобучение модели?

Переобучение (overfitting) происходит, когда модель слишком точно запоминает данные обучающей выборки, вместо того чтобы учить общие закономерности. В результате она плохо обобщает знания на новые данные и показывает высокую ошибку на тестовой выборке. Переобучение возникает, если модель слишком сложна или в обучающей выборке присутствует шум. Для борьбы с переобучением применяются методы регуляризации, кросс-валидации и увеличение объёма данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
🤔 Какой метод используется для выбора лучших признаков модели?
Anonymous Quiz
42%
PCA
27%
RFE
16%
LDA
15%
T-SNE
🤔 В чём разница между методом GMM и K-Means?

1. K-Means:
o Основан на разделении данных по расстояниям до центроидов (жёсткое разделение).
o Каждая точка принадлежит только одному кластеру.
2. GMM (Gaussian Mixture Model):
o Использует вероятностный подход: каждая точка имеет вероятность принадлежности к каждому кластеру (мягкое разделение).
o Кластеры формируются на основе распределений Гаусса, что делает GMM более гибким для сложных данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
🤔 Какой метод уменьшает дисперсию, используя случайное исключение нейронов?
Anonymous Quiz
8%
Bagging
3%
Boosting
80%
Dropout
9%
Batch Normalization
🤔 Какой метод уменьшает смещение и дисперсию в ансамблевых моделях?
Anonymous Quiz
13%
Stacking
48%
Bagging
28%
Boosting
11%
Gradient Descent
💊6🤔2