Data Science | Тесты

🤔 Какой метод регуляризации добавляет штраф, пропорциональный сумме абсолютных значений весов?

Anonymous Quiz

71%

117 voters409 views09:02

Data Science | Тесты

🤔

Что известно о ML дизайне?

ML-дизайн включает выбор модели, структуры данных, метрик и процесса обучения для конкретной задачи. Важные аспекты:
• Постановка задачи (классификация, регрессия, кластеризация).
• Подготовка данных (очистка, масштабирование, выделение признаков).
• Выбор и настройка модели, а также оптимизация гиперпараметров.
• Оценка результатов (использование метрик качества и валидации).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

440 views16:01

Data Science | Тесты

🤔 Какой метод снижает мультиколлинеарность в регрессии?

Anonymous Quiz

🔥2

125 voters421 views20:01

Data Science | Тесты

🤔 Какой метод оптимизации применяется для поиска минимума функции?

Anonymous Quiz

💊9

111 voters395 views09:02

Data Science | Тесты

🤔 В каких случаях логистическая регрессия на задачах классификации будет работать лучше, чем случайный лес?

Логистическая регрессия может работать лучше, чем случайный лес, когда данные линейно разделимы или когда модель должна быть интерпретируемой. Логистическая регрессия проще и менее склонна к переобучению, особенно на небольших и чистых наборах данных. Случайный лес может давать более сложные предсказания, но при этом быть менее интерпретируемым. В задачах, где важна простота и скорость работы модели, логистическая регрессия может быть предпочтительнее.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

402 views16:01

Data Science | Тесты

🤔 Вопрос: Какой метод уменьшения размерности данных чаще всего используется для визуализации данных в 2D или 3D?

Anonymous Quiz

80%

PCA (метод главных компонент)

18%

SVM (метод опорных векторов)

Линейная регрессия

k-средних

💊6

113 voters403 views20:01

Data Science | Тесты

🤔Что такое out-of-bag (OOB) оценка в случайном лесе?

Anonymous Quiz

13%

Метод нормализации данных

66%

Внутренний метод проверки модели

Алгоритм кластеризации

17%

Способ уменьшения размерности

111 voters396 views09:02

Data Science | Тесты

🤔 Что такое градиентное затухание?

Градиентное затухание (vanishing gradients) — это проблема, когда в глубоких нейросетях градиенты становятся очень малыми при обратном распространении.
Это мешает обновлению весов в начальных слоях, и обучение "замирает".
Чаще всего возникает в RNN и в сетях с плохой инициализацией или неподходящей функцией активации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

420 views16:01

Data Science | Тесты

🤔 Какой метод используется для анализа текстовых данных и выявления тематических структур в коллекции документов?

Anonymous Quiz

86%

Latent Dirichlet Allocation (LDA)

Linear Regression

Decision Trees

K-nearest neighbors (KNN)

103 voters429 views20:01

Data Science | Тесты

🤔 Какой метод оценивания используется для сравнения моделей на основе перекрестной проверки?

Anonymous Quiz

120 voters406 views09:01

Data Science | Тесты

🤔 Какая скорость поиска в хэш-таблице

Скорость поиска в хэш-таблице (например, HashMap) в среднем составляет O(1), так как ключи напрямую отображаются в индекс с помощью хэш-функции. В худшем случае, при коллизиях, время поиска может увеличиваться до O(n), если хэш-таблица не оптимизирована или используется неэффективная стратегия разрешения коллизий. Однако в большинстве случаев эффективные хэш-функции и методы обработки коллизий поддерживают близкую к O(1) скорость.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

425 views16:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для классификации на основе вероятностей?

Anonymous Quiz

10%

Линейная регрессия

K-ближайших соседей

Метод опорных векторов

79%

Наивный байесовский классификатор

125 voters419 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для выявления аномалий в данных путем обучения модели только на нормальных данных?

Anonymous Quiz

Decision Tree

11%

Логистическая регрессия

117 voters414 views09:02

Data Science | Тесты

🤔

Что такое map оценка?

MAP (Mean Average Precision) — это метрика, используемая для оценки качества ранжирования в задачах, где важен порядок релевантных результатов. Она вычисляется как среднее значение Average Precision (AP) для нескольких запросов, где AP измеряет точность на каждой позиции релевантного элемента. MAP часто применяется в системах поиска и рекомендаций для оценки точности ранжированных ответов.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

422 views16:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для создания синтетических образцов в несбалансированных данных?

Anonymous Quiz

👍1

125 voters419 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения лучше всего подходит для предсказания категориальных переменных?

Anonymous Quiz

Линейная регрессия

61%

Логистическая регрессия

🤔1

124 voters402 views09:01

Data Science | Тесты

🤔

Почему в нейронных сетях нельзя инициализировать веса нулями?

1. Симметричность: При инициализации весов нулями все нейроны в слое начинают обучение одинаково, что делает их идентичными.
2. Отсутствие обучения: Градиенты для всех нейронов слоя будут одинаковыми, из-за чего они не смогут различаться и обучаться.
3. Решение: Инициализация случайными значениями разрывает симметрию, позволяя нейронам обучаться независимо друг от друга.
Стандартные методы, такие как He или Xavier инициализация, обеспечивают оптимальный начальный размах весов.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

421 views16:01

Data Science | Тесты

🤔 Какой метод уменьшает дисперсию, комбинируя модели с разными обучающими выборками?

Anonymous Quiz

💊1

117 voters423 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для задач классификации, когда данные содержат как числовые, так и категориальные признаки?

Anonymous Quiz

17%

Логистическая регрессия

19%

Метод ближайших соседей

64%

Деревья решений

Линейная регрессия

121 voters436 views09:02

Data Science | Тесты

🤔 Чему равно p-value для выброса?

Это вероятность получить значение настолько же экстремальное, как наблюдаемое, при условии, что оно принадлежит общему распределению.
Чем меньше p-value, тем выше вероятность, что точка — выброс.
Значение зависит от метода (Grubbs, Dixon, Z-score и др.). Обычно, если p < 0.05, точка может считаться выбросом.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

458 views16:01

Data Science | Тесты

🤔 Какой метод уменьшает смещение и дисперсию в ансамблях?

Anonymous Quiz