Data Science | Тесты
2.51K subscribers
25 photos
349 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Что такое precision?

Precision (точность) — это метрика классификации, которая показывает долю правильных положительных предсказаний среди всех предсказанных положительных классов. Она рассчитывается как отношение количества истинно положительных предсказаний к сумме истинно положительных и ложно положительных. Precision важен, когда цена ложноположительных результатов высока. Высокое значение precision указывает на то, что модель почти не ошибается при предсказании положительного класса.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности часто используется для визуализации данных?
Anonymous Quiz
44%
PCA
28%
PCA
20%
LDA
8%
NMF
💊22🤔10
🤔 Вопрос: Что из перечисленного не является типом машинного обучения?
Anonymous Quiz
3%
Обучение с учителем
4%
Обучение без учителя
3%
Обучение с подкреплением
90%
Обучение с опросом
💊6
🤔 Какие проблемы могут возникнуть при прогнозе LTV на полгода вперед?

Основные проблемы при прогнозе LTV (Lifetime Value) на длительный срок включают в себя высокую неопределённость в поведении пользователей, изменение рыночных условий и устаревание данных. Кроме того, прогнозы могут быть неточными из-за сезонных изменений или новых факторов, которые не были учтены в модели. Также возможна недостаточность данных для точного прогнозирования поведения пользователей на долгий срок. Модели могут переоценивать или недооценивать реальные значения LTV.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшения размерности используется для выделения скрытых признаков из данных путем обучения нейронных сетей?
Anonymous Quiz
12%
PCA
14%
LDA
63%
Автоэнкодеры
11%
T-SNE
🤔 Какой метод уменьшает дисперсию и улучшает обобщающую способность модели?
Anonymous Quiz
43%
Bagging
29%
Dropout
23%
Cross-Validation
4%
Early Stopping
💊10
🤔 Чем отличаются str и repr?

str предназначен для отображения понятного текста для пользователя, repr — для отображения точного представления объекта для разработчика.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод кластеризации наиболее устойчив к выбросам?
Anonymous Quiz
25%
K-means
22%
Иерархическая кластеризация
48%
DBSCAN
5%
PCA
🤔 Какой метод используется для прогнозирования временных рядов на основе исторических данных и авторегрессионных моделей?
Anonymous Quiz
88%
ARIMA
6%
Support Vector Machines (SVM)
2%
Random Forest
4%
K-nearest neighbors (KNN)
🤔 Как работает Dropout?

Это техника регуляризации в нейросетях, уменьшающая переобучение:
1. На каждой итерации обучения случайно зануляется часть нейронов.
2. Это предотвращает чрезмерную зависимость от отдельных признаков.
3. Во время предсказания Dropout не применяется, а выходы масштабируются.
Dropout делает нейросеть более устойчивой и снижает вероятность переобучения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для классификации текстовых данных с учетом порядка слов в документе?
Anonymous Quiz
4%
Логистическая регрессия
1%
K-means
45%
Bag-of-Words
50%
Рекуррентные нейронные сети (RNN)
🤔 Какой метод оценивает производительность модели на невидимых данных?
Anonymous Quiz
29%
Grid Search
7%
Bagging
51%
Cross-Validation
13%
Clustering
🤔2
🤔 Как обучается модель?

Процесс обучения модели машинного обучения включает:
1. Предобработку данных – нормализация, удаление выбросов, кодирование категориальных признаков.
2. Выбор модели – линейная регрессия, дерево решений, нейросети и т. д.
3. Разделение данных – обучение (train), валидация (validation), тестирование (test).
4. Оптимизация параметров – подбор коэффициентов с помощью градиентного спуска или других методов.
5. Оценка качества – использование метрик (MSE, Accuracy, ROC-AUC).
Модель обучается за счет минимизации функции потерь и корректировки параметров.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔1
🤔 Какая метрика оценки модели учитывает как ложные срабатывания, так и пропуски?
Anonymous Quiz
57%
F1-Score
25%
ROC-AUC
10%
Precision
8%
Accuracy
🤔 Какой метод часто применяют для визуализации многомерных данных?
Anonymous Quiz
62%
t-SNE
6%
K-means
31%
PCA
1%
Логистическая регрессия
🤔 Как работает регресс?

Регрессия — это метод машинного обучения, который моделирует зависимость между одной или несколькими независимыми переменными (признаками) и зависимой переменной (предсказываемой величиной). Основная цель регрессии — предсказать значение зависимой переменной на основе новых значений независимых переменных, минимизируя ошибку. В Data Science регрессия широко используется для прогнозирования и анализа взаимосвязей данных, таких как линейная и логистическая регрессии.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊1
🤔 Какой метод используется для повышения устойчивости модели к смещению данных?
Anonymous Quiz
38%
Data Augmentation
9%
Early Stopping
39%
Cross Validation
13%
Gradient Clipping
🤔 Что такое переобучение модели?

Переобучение (overfitting) происходит, когда модель слишком точно запоминает данные обучающей выборки, вместо того чтобы учить общие закономерности. В результате она плохо обобщает знания на новые данные и показывает высокую ошибку на тестовой выборке. Переобучение возникает, если модель слишком сложна или в обучающей выборке присутствует шум. Для борьбы с переобучением применяются методы регуляризации, кросс-валидации и увеличение объёма данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм основан на методе случайного подпространства и решающих деревьев?
Anonymous Quiz
10%
Gradient Boosting
80%
Random Forest
1%
Linear Regression
9%
Decision Tree