Data Science | Тесты
2.7K subscribers
29 photos
595 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод регуляризации добавляет штраф, пропорциональный сумме абсолютных значений весов?
Anonymous Quiz
71%
L1-регуляризация
21%
L2-регуляризация
3%
Dropout
5%
Batch Normalization
🤔 Что известно о ML дизайне?

ML-дизайн включает выбор модели, структуры данных, метрик и процесса обучения для конкретной задачи. Важные аспекты:
• Постановка задачи (классификация, регрессия, кластеризация).
• Подготовка данных (очистка, масштабирование, выделение признаков).
• Выбор и настройка модели, а также оптимизация гиперпараметров.
• Оценка результатов (использование метрик качества и валидации).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод снижает мультиколлинеарность в регрессии?
Anonymous Quiz
33%
Lasso
11%
Ridge
14%
Elastic Net
42%
All of the above
🔥2
🤔 Какой метод оптимизации применяется для поиска минимума функции?
Anonymous Quiz
68%
SGD
24%
SGD
2%
v3. K-means
6%
DBSCAN
💊9
🤔 В каких случаях логистическая регрессия на задачах классификации будет работать лучше, чем случайный лес?

Логистическая регрессия может работать лучше, чем случайный лес, когда данные линейно разделимы или когда модель должна быть интерпретируемой. Логистическая регрессия проще и менее склонна к переобучению, особенно на небольших и чистых наборах данных. Случайный лес может давать более сложные предсказания, но при этом быть менее интерпретируемым. В задачах, где важна простота и скорость работы модели, логистическая регрессия может быть предпочтительнее.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Вопрос: Какой метод уменьшения размерности данных чаще всего используется для визуализации данных в 2D или 3D?
Anonymous Quiz
80%
PCA (метод главных компонент)
18%
SVM (метод опорных векторов)
2%
Линейная регрессия
1%
k-средних
💊6
🤔 Что такое градиентное затухание?

Градиентное затухание (vanishing gradients) — это проблема, когда в глубоких нейросетях градиенты становятся очень малыми при обратном распространении.
Это мешает обновлению весов в начальных слоях, и обучение "замирает".
Чаще всего возникает в RNN и в сетях с плохой инициализацией или неподходящей функцией активации.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод используется для анализа текстовых данных и выявления тематических структур в коллекции документов?
Anonymous Quiz
86%
Latent Dirichlet Allocation (LDA)
5%
Linear Regression
2%
Decision Trees
7%
K-nearest neighbors (KNN)
🤔 Какой метод оценивания используется для сравнения моделей на основе перекрестной проверки?
Anonymous Quiz
2%
Точность
11%
F1-score
10%
ROC AUC
78%
Кросс-валидация
🤔 Какая скорость поиска в хэш-таблице

Скорость поиска в хэш-таблице (например, HashMap) в среднем составляет O(1), так как ключи напрямую отображаются в индекс с помощью хэш-функции. В худшем случае, при коллизиях, время поиска может увеличиваться до O(n), если хэш-таблица не оптимизирована или используется неэффективная стратегия разрешения коллизий. Однако в большинстве случаев эффективные хэш-функции и методы обработки коллизий поддерживают близкую к O(1) скорость.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для классификации на основе вероятностей?
Anonymous Quiz
10%
Линейная регрессия
6%
K-ближайших соседей
4%
Метод опорных векторов
79%
Наивный байесовский классификатор
🤔 Какой метод машинного обучения используется для выявления аномалий в данных путем обучения модели только на нормальных данных?
Anonymous Quiz
7%
Decision Tree
11%
Логистическая регрессия
67%
Isolation Forest
15%
Автоэнкодеры
🤔 Что такое map оценка?

MAP (Mean Average Precision) — это метрика, используемая для оценки качества ранжирования в задачах, где важен порядок релевантных результатов. Она вычисляется как среднее значение Average Precision (AP) для нескольких запросов, где AP измеряет точность на каждой позиции релевантного элемента. MAP часто применяется в системах поиска и рекомендаций для оценки точности ранжированных ответов.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод машинного обучения используется для создания синтетических образцов в несбалансированных данных?
Anonymous Quiz
90%
SMOTE
6%
K-means
1%
Decision Tree
4%
Naive Bayes
👍1
🤔 Какой метод машинного обучения лучше всего подходит для предсказания категориальных переменных?
Anonymous Quiz
4%
Линейная регрессия
61%
Логистическая регрессия
10%
PCA
25%
K-means
🤔1
🤔 Почему в нейронных сетях нельзя инициализировать веса нулями?

1. Симметричность: При инициализации весов нулями все нейроны в слое начинают обучение одинаково, что делает их идентичными.
2. Отсутствие обучения: Градиенты для всех нейронов слоя будут одинаковыми, из-за чего они не смогут различаться и обучаться.
3. Решение: Инициализация случайными значениями разрывает симметрию, позволяя нейронам обучаться независимо друг от друга.
Стандартные методы, такие как He или Xavier инициализация, обеспечивают оптимальный начальный размах весов.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает дисперсию, комбинируя модели с разными обучающими выборками?
Anonymous Quiz
69%
Bagging
13%
Boosting
14%
Stacking
4%
Dropout
💊1
🤔 Какой метод машинного обучения используется для задач классификации, когда данные содержат как числовые, так и категориальные признаки?
Anonymous Quiz
17%
Логистическая регрессия
19%
Метод ближайших соседей
64%
Деревья решений
0%
Линейная регрессия
🤔 Чему равно p-value для выброса?

Это вероятность получить значение настолько же экстремальное, как наблюдаемое, при условии, что оно принадлежит общему распределению.
Чем меньше p-value, тем выше вероятность, что точка — выброс.
Значение зависит от метода (Grubbs, Dixon, Z-score и др.). Обычно, если p < 0.05, точка может считаться выбросом.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает смещение и дисперсию в ансамблях?
Anonymous Quiz
39%
Bagging
35%
Boosting
20%
Stacking
6%
Pruning
💊2