Data Science | Тесты

Хэшируемые типы данных, такие как числа, строки, кортежи с неизменяемыми элементами. Это важно, если требуется быстро сопоставить значения в структуре данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

576 views16:01

Data Science | Тесты

🤔 Что такое перекрестная энтропия?

Anonymous Quiz

Метод кластеризации

76%

Функция потерь для классификационных задач

Метод уменьшения размерности

10%

Способ нормализации данных

163 voters578 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения применяется для уменьшения мультиколлинеарности?

Anonymous Quiz

Линейная регрессия

Логистическая регрессия

86%

Регрессия с L1-регуляризацией

K-means

175 voters579 views09:01

Data Science | Тесты

🤔 В чем разница между командами DELETE и TRUNCATE?

`DELETE` удаляет строки из таблицы на основе указанного условия и записывает каждое удаление в журнал транзакций, что позволяет выполнить откат операции. `TRUNCATE` быстро удаляет все строки из таблицы, не записывая в журнал отдельные удаления, что делает эту операцию быстрой, но необратимой.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

614 views16:01

Data Science | Тесты

🤔 Какой метод оптимизации используется для обучения больших нейронных сетей?

Anonymous Quiz

208 voters602 views20:01

Data Science | Тесты

🤔 Какие алгоритмы наиболее подходят для обработки текста?

Anonymous Quiz

Сверточные нейронные сети

29%

RNN (Рекуррентные нейронные сети)

62%

Трансформеры

Скрытые марковские модели

💊2

208 voters563 views09:02

Data Science | Тесты

🤔 Почему нельзя использовать дерево, если переменная непредобработана?

Деревья принимают решения на основе пороговых значений, и непредобработанные переменные могут привести к неверным или неэффективным разбиениям.
1. Категориальные переменные без кодирования (например, текст) не могут быть обработаны деревьями.
2. Пропущенные или масштабно несбалансированные данные могут искажать результаты.
Предобработка помогает улучшить качество разбиений и повысить производительность модели.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

💊6

612 views16:02

Data Science | Тесты

🤔 Какой метод используют для оценки важности признаков в модели случайного леса?

Anonymous Quiz

186 voters612 views20:01

Data Science | Тесты

🤔 Какой метод уменьшает дисперсию в ансамблевом обучении?

Anonymous Quiz

167 voters562 views09:01

Data Science | Тесты

🤔

Почему нейронные сети усложняют добавлением слоёв, а не количеством нейронов в слое?

1. Добавление слоёв увеличивает глубину: Это позволяет моделировать более сложные зависимости и иерархические признаки (например, в изображениях).
2. Слишком много нейронов в одном слое приводит к избыточности: Сеть может переобучаться или не быть эффективной.
3. Слои способствуют обучению на разных уровнях абстракции: Например, начальные слои выделяют простые признаки (линии, края), а более глубокие — сложные (объекты).
4. Увеличение количества нейронов вместо слоёв может повысить вычислительную сложность без значительного увеличения эффективности.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

💊4

626 views16:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для задач регрессии с учетом нелинейных зависимостей и взаимодействий между признаками?

Anonymous Quiz

Линейная регрессия

52%

Полиномиальная регрессия

30%

Случайный лес

10%

Логистическая регрессия

183 voters573 views20:01

Data Science | Тесты

🤔 Какой метод классификации использует ансамбли деревьев решений?

Anonymous Quiz

172 voters551 views09:01

Data Science | Тесты

🤔

Как градиент бустинг регрессор работает?

Градиент бустинг регрессор строит множество слабых моделей, таких как деревья решений, и комбинирует их для улучшения предсказаний. Модели обучаются последовательно, каждая новая модель пытается скорректировать ошибки предыдущих. На каждом шаге модель минимизирует ошибку, используя градиент функции потерь для обновления предсказаний. Этот процесс продолжается до тех пор, пока не будет достигнута определенная точность или не исчерпаны ресурсы.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

592 views16:01

Data Science | Тесты

🤔 Какая модель машинного обучения чаще всего используется для анализа текстовых данных?

Anonymous Quiz

Random Forest

Logistic Regression

35%

Support Vector Machine

48%

Naive Bayes

💊2

185 voters576 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для классификации с неравномерным распределением классов?

Anonymous Quiz

16%

Метод опорных векторов (SVM)

17%

K-ближайших соседей (KNN)

20%

Случайный лес

46%

Взвешенная логистическая регрессия

167 voters556 views09:01

Data Science | Тесты

🤔

Что такое пи вэлью?

P-value — это вероятность того, что наблюдаемые данные или более экстремальные данные могли бы возникнуть при условии, что нулевая гипотеза верна. В контексте статистических тестов, маленькое значение p-value указывает на то, что нулевая гипотеза может быть отвергнута в пользу альтернативной гипотезы. Обычно порог значимости устанавливается на уровне 0.05, и если p-value меньше этого порога, нулевая гипотеза отвергается. P-value не говорит о размере эффекта, а лишь о степени уверенности в полученных данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5

593 views16:02

Data Science | Тесты

🤔 Какой метод снижает размерность данных и увеличивает объяснимость?

Anonymous Quiz