Data Science | Тесты
2.51K subscribers
25 photos
349 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод позволяет оценивать важность признаков?
Anonymous Quiz
41%
PCA
41%
Feature Scaling
13%
Random Forest
5%
Standardization
💊19👍1
🤔 Что будет с целевой меткой с предсказаниями, если обучалась на неотрицательной целевой метке?

Модель будет предсказывать только неотрицательные значения, что может ограничивать её применение.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод обучения уменьшает дисперсию в ансамблевой модели?
Anonymous Quiz
53%
Bagging
27%
Boosting
8%
Stacking
11%
Gradient Descent
👍1
🤔 Какой метод в scikit-learn используется для масштабирования данных?
Anonymous Quiz
86%
StandardScaler()
7%
OneHotEncoder()
1%
KMeans()
6%
PCA()
🤔 Зачем нужен метод dir для объектов?

Метод `dir()` в Python возвращает список атрибутов и методов объекта, что помогает разработчику понять структуру объекта и доступные ему функции.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какая метрика оценки качества модели предпочтительнее всего использовать для несбалансированных классов?
Anonymous Quiz
8%
Accuracy
8%
Precision
9%
Recall
75%
F1-score
🤔 Какой метод уменьшения размерности данных сохраняет глобальную структуру, используя геодезическое расстояние?
Anonymous Quiz
18%
PCA
11%
LDA
28%
T-SNE
43%
Isomap
🤔 Что такое градиентное затухание?

Градиентное затухание (vanishing gradients) — это проблема, когда в глубоких нейросетях градиенты становятся очень малыми при обратном распространении.
Это мешает обновлению весов в начальных слоях, и обучение "замирает".
Чаще всего возникает в RNN и в сетях с плохой инициализацией или неподходящей функцией активации.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
🤔 Какой метод машинного обучения используется для классификации данных, разделенных нелинейной границей?
Anonymous Quiz
1%
Линейная регрессия
16%
Логистическая регрессия
69%
Метод опорных векторов с ядром (SVM)
14%
K-means
🤔 Какой метод оптимизации используется для обучения нейронных сетей?
Anonymous Quiz
6%
Метод Ньютона
85%
Градиентный спуск
8%
Метод опорных векторов
1%
Метод опорных векторов
🤔7
🤔 Какие известны рекомендательные модели?

Content-Based Filtering, Collaborative Filtering, и Hybrid модели. Выбор зависит от задачи и данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод уменьшает дисперсию в нейронных сетях, временно исключая нейроны?
Anonymous Quiz
16%
Batch Normalization
75%
Dropout
6%
Early Stopping
3%
Data Augmentation
🤔 Какой метод машинного обучения используется для повышения точности путем объединения нескольких моделей и создания мета-модели?
Anonymous Quiz
35%
Бэггинг
62%
Стеккинг
1%
K-means
2%
T-SNE
🤔 Как сгенерировать распределение, исходя из выборок?

1. Использовать метод бутстрепинга для повторного выборочного моделирования.
2. Рассчитать параметры распределения (среднее, дисперсию) и использовать их для генерации данных.
3. Применить библиотеки, например, numpy.random для моделирования нужного распределения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
🤔 Какой метод машинного обучения использует ядровые функции?
Anonymous Quiz
2%
Линейная регрессия
4%
Логистическая регрессия
81%
Метод опорных векторов (SVM)
13%
K-means
🤔 Какой метод уменьшает смещение и дисперсию, используя комбинацию L1 и L2 штрафов?
Anonymous Quiz
14%
Lasso
7%
Ridge
76%
Elastic Net
3%
PCA
🤔 Какие есть усовершенствования бинарной кросс-энтропии?

Бинарную кросс-энтропию можно улучшать в зависимости от задачи:
- С взвешиванием классов — если классы несбалансированы.
- Focal Loss — фокусируется на трудных примерах, уменьшая вклад лёгких.
- Label smoothing — снижает переуверенность модели, заменяя метки вроде 1/0 на 0.9/0.1.
- Dice Loss / Jaccard Loss — используются в задачах сегментации, где важна форма, а не только точность пикселя.
- Combo Loss — сочетание BCE с другими функциями (например, с Dice), чтобы уравновесить разные аспекты задачи.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод машинного обучения используется для обработки данных, когда количество признаков значительно превышает количество наблюдений?
Anonymous Quiz
7%
Линейная регрессия
65%
Метод опорных векторов (SVM)
7%
Логистическая регрессия
21%
K-средние
🤔 Как делать прогноз для новых пользователей?

Для новых пользователей, у которых нет достаточного количества данных, можно использовать методы прогнозирования на основе поведения похожих пользователей (кластеризация, сегментация) или демографических данных. Также можно использовать модели, которые комбинируют поведенческие данные с внешними признаками (например, география или источник трафика). Важным шагом является регулярное обновление модели по мере поступления новых данных о поведении пользователя. Кроме того, можно использовать методы cold-start для работы с новыми пользователями.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1