Data Science | Тесты
2.51K subscribers
25 photos
347 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
Какой метод используется для уменьшения размерности данных?
Anonymous Quiz
11%
Support Vector Machines (SVM)
3%
Random Forest
6%
K-Nearest Neighbors (KNN)
81%
Principal Component Analysis (PCA)
🤔 Какой метод используется для выявления скрытых факторов в данных путем анализа зависимостей между наблюдениями и переменными?
Anonymous Quiz
49%
Factor Analysis
16%
Principal Component Analysis (PCA)
16%
Linear Discriminant Analysis (LDA)
20%
Independent Component Analysis (ICA)
💊12
🤔 Какие переменные (типы данных) можно использовать в качестве ключей?

Хэшируемые типы данных, такие как числа, строки, кортежи с неизменяемыми элементами. Это важно, если требуется быстро сопоставить значения в структуре данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения применяется для уменьшения мультиколлинеарности?
Anonymous Quiz
3%
Линейная регрессия
6%
Логистическая регрессия
86%
Регрессия с L1-регуляризацией
5%
K-means
🤔 В чем разница между командами DELETE и TRUNCATE?

`DELETE` удаляет строки из таблицы на основе указанного условия и записывает каждое удаление в журнал транзакций, что позволяет выполнить откат операции. `TRUNCATE` быстро удаляет все строки из таблицы, не записывая в журнал отдельные удаления, что делает эту операцию быстрой, но необратимой.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод оптимизации используется для обучения больших нейронных сетей?
Anonymous Quiz
4%
Метод Ньютона
29%
Градиентный спуск
65%
Адам (Adam)
1%
K-means
🤔 Почему нельзя использовать дерево, если переменная непредобработана?

Деревья принимают решения на основе пороговых значений, и непредобработанные переменные могут привести к неверным или неэффективным разбиениям.
1. Категориальные переменные без кодирования (например, текст) не могут быть обработаны деревьями.
2. Пропущенные или масштабно несбалансированные данные могут искажать результаты.
Предобработка помогает улучшить качество разбиений и повысить производительность модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊6
🤔 Какой метод используют для оценки важности признаков в модели случайного леса?
Anonymous Quiz
11%
Градиентный бустинг
16%
Бэггинг
65%
Gini Importance
9%
Lasso
🤔 Какой метод уменьшает дисперсию в ансамблевом обучении?
Anonymous Quiz
54%
Bagging
28%
Boosting
8%
Gradient Descent
11%
Cross-Validation
🤔 Почему нейронные сети усложняют добавлением слоёв, а не количеством нейронов в слое?

1. Добавление слоёв увеличивает глубину: Это позволяет моделировать более сложные зависимости и иерархические признаки (например, в изображениях).
2. Слишком много нейронов в одном слое приводит к избыточности: Сеть может переобучаться или не быть эффективной.
3. Слои способствуют обучению на разных уровнях абстракции: Например, начальные слои выделяют простые признаки (линии, края), а более глубокие — сложные (объекты).
4. Увеличение количества нейронов вместо слоёв может повысить вычислительную сложность без значительного увеличения эффективности.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊4
🤔 Какой метод машинного обучения используется для задач регрессии с учетом нелинейных зависимостей и взаимодействий между признаками?
Anonymous Quiz
7%
Линейная регрессия
52%
Полиномиальная регрессия
30%
Случайный лес
10%
Логистическая регрессия
🤔 Какой метод классификации использует ансамбли деревьев решений?
Anonymous Quiz
23%
Decision Trees
71%
Random Forest
2%
Logistic Regression
5%
K-Nearest Neighbors
🤔 Как градиент бустинг регрессор работает?

Градиент бустинг регрессор строит множество слабых моделей, таких как деревья решений, и комбинирует их для улучшения предсказаний. Модели обучаются последовательно, каждая новая модель пытается скорректировать ошибки предыдущих. На каждом шаге модель минимизирует ошибку, используя градиент функции потерь для обновления предсказаний. Этот процесс продолжается до тех пор, пока не будет достигнута определенная точность или не исчерпаны ресурсы.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какая модель машинного обучения чаще всего используется для анализа текстовых данных?
Anonymous Quiz
8%
Random Forest
9%
Logistic Regression
35%
Support Vector Machine
48%
Naive Bayes
💊2
🤔 Какой метод машинного обучения используется для классификации с неравномерным распределением классов?
Anonymous Quiz
16%
Метод опорных векторов (SVM)
17%
K-ближайших соседей (KNN)
20%
Случайный лес
46%
Взвешенная логистическая регрессия
🤔 Что такое пи вэлью?

P-value — это вероятность того, что наблюдаемые данные или более экстремальные данные могли бы возникнуть при условии, что нулевая гипотеза верна. В контексте статистических тестов, маленькое значение p-value указывает на то, что нулевая гипотеза может быть отвергнута в пользу альтернативной гипотезы. Обычно порог значимости устанавливается на уровне 0.05, и если p-value меньше этого порога, нулевая гипотеза отвергается. P-value не говорит о размере эффекта, а лишь о степени уверенности в полученных данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
🤔 Какой метод снижает размерность данных и увеличивает объяснимость?
Anonymous Quiz
88%
PCA
5%
K-means
5%
Logistic Regression
2%
Random Forest
🤔 Какой метод оптимизации используется для обучения нейронных сетей?
Anonymous Quiz
8%
Метод Ньютона
81%
Градиентный спуск
10%
Метод опорных векторов
1%
K-means