Data Science | Тесты
2.51K subscribers
25 photos
348 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод оптимизации используется для обучения нейронных сетей?
Anonymous Quiz
6%
Метод Ньютона
85%
Градиентный спуск
8%
Метод опорных векторов
1%
Метод опорных векторов
🤔7
🤔 Какие известны рекомендательные модели?

Content-Based Filtering, Collaborative Filtering, и Hybrid модели. Выбор зависит от задачи и данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод уменьшает дисперсию в нейронных сетях, временно исключая нейроны?
Anonymous Quiz
16%
Batch Normalization
75%
Dropout
6%
Early Stopping
3%
Data Augmentation
🤔 Какой метод машинного обучения используется для повышения точности путем объединения нескольких моделей и создания мета-модели?
Anonymous Quiz
35%
Бэггинг
62%
Стеккинг
1%
K-means
2%
T-SNE
🤔 Как сгенерировать распределение, исходя из выборок?

1. Использовать метод бутстрепинга для повторного выборочного моделирования.
2. Рассчитать параметры распределения (среднее, дисперсию) и использовать их для генерации данных.
3. Применить библиотеки, например, numpy.random для моделирования нужного распределения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
🤔 Какой метод машинного обучения использует ядровые функции?
Anonymous Quiz
2%
Линейная регрессия
4%
Логистическая регрессия
81%
Метод опорных векторов (SVM)
13%
K-means
🤔 Какой метод уменьшает смещение и дисперсию, используя комбинацию L1 и L2 штрафов?
Anonymous Quiz
14%
Lasso
7%
Ridge
76%
Elastic Net
3%
PCA
🤔 Какие есть усовершенствования бинарной кросс-энтропии?

Бинарную кросс-энтропию можно улучшать в зависимости от задачи:
- С взвешиванием классов — если классы несбалансированы.
- Focal Loss — фокусируется на трудных примерах, уменьшая вклад лёгких.
- Label smoothing — снижает переуверенность модели, заменяя метки вроде 1/0 на 0.9/0.1.
- Dice Loss / Jaccard Loss — используются в задачах сегментации, где важна форма, а не только точность пикселя.
- Combo Loss — сочетание BCE с другими функциями (например, с Dice), чтобы уравновесить разные аспекты задачи.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод машинного обучения используется для обработки данных, когда количество признаков значительно превышает количество наблюдений?
Anonymous Quiz
7%
Линейная регрессия
65%
Метод опорных векторов (SVM)
7%
Логистическая регрессия
21%
K-средние
🤔 Как делать прогноз для новых пользователей?

Для новых пользователей, у которых нет достаточного количества данных, можно использовать методы прогнозирования на основе поведения похожих пользователей (кластеризация, сегментация) или демографических данных. Также можно использовать модели, которые комбинируют поведенческие данные с внешними признаками (например, география или источник трафика). Важным шагом является регулярное обновление модели по мере поступления новых данных о поведении пользователя. Кроме того, можно использовать методы cold-start для работы с новыми пользователями.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод уменьшает дисперсию модели, комбинируя несколько слабых моделей?
Anonymous Quiz
43%
Bagging
21%
Boosting
21%
Stacking
15%
Ensembling
💊12🤔2
🤔 Какой метод используется для оценки важности признаков?
Anonymous Quiz
30%
Random Forest
8%
K-Means
13%
Gradient Descent
49%
PCA
💊9
🤔 Как работает градиентный бустинг регрессор?

Это ансамблевый метод, который комбинирует множество слабых моделей (обычно деревьев решений) для улучшения качества предсказаний:
1. Первая модель предсказывает исходные данные, а остатки ошибок передаются следующей.
2. Каждое новое дерево обучается на ошибках предыдущих, уменьшая отклонения.
3. Градиентный спуск минимизирует ошибку, выбирая оптимальные веса.
4. Итоговое предсказание – это взвешенная сумма предсказаний всех деревьев.
Градиентный бустинг хорошо работает с нелинейными зависимостями и устойчив к выбросам.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод машинного обучения используется для выявления скрытых факторов в текстовых данных?
Anonymous Quiz
2%
Логистическая регрессия
7%
Decision Tree
52%
LDA (Latent Dirichlet Allocation)
39%
TF-IDF
🤔 Какой метод борьбы с дисбалансом классов создает новые примеры?
Anonymous Quiz
37%
Oversampling
4%
Undersampling
47%
SMOTE
11%
Class Weighing
💊7
🤔 Какой функционал оптимизируется в задаче линейной регрессии? Как записать это в векторной записи?

Оптимизируется ошибка между предсказанными и фактическими значениями, минимизируя среднеквадратичное отклонение, что позволяет определить параметры модели.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод машинного обучения используется для задач регрессии с учетом нелинейных зависимостей и взаимодействий между признаками?
Anonymous Quiz
4%
Линейная регрессия
53%
Полиномиальная регрессия
34%
Случайный лес
9%
Логистическая регрессия
🤔 Какой метод машинного обучения используется для классификации на основе вероятностных распределений?
Anonymous Quiz
34%
Логистическая регрессия
5%
K-ближайших соседей
5%
Метод опорных векторов
56%
Наивный байесовский классификатор
💊2
🤔 Разница между K-Means и KNN

1. K-Means (кластеризация):
o Используется для группировки данных в кластеры на основе схожести.
o Это алгоритм обучения без учителя.
o Результат — центры кластеров, данные распределяются вокруг них.
2. KNN (K-Nearest Neighbors):
o Алгоритм классификации или регрессии, находящий ближайших соседей для прогнозирования.
o Это алгоритм обучения с учителем.
o Результат зависит от разметки данных (меток классов).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM