Data Science | Тесты
2.51K subscribers
25 photos
347 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Как работает having?

`HAVING` в SQL используется для фильтрации результатов группировки, которые были созданы с помощью `GROUP BY`. В отличие от `WHERE`, который фильтрует строки до группировки, `HAVING` применяет фильтры уже после того, как данные были агрегированы. Это позволяет отфильтровывать группы на основе агрегатных функций, таких как `COUNT()`, `SUM()` или `AVG()`. Использование `HAVING` удобно, когда требуется отобрать только те группы, которые соответствуют определённым условиям.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает дисперсию предсказаний ансамбля моделей?
Anonymous Quiz
55%
Bagging
31%
Boosting
6%
Stacking
8%
Averaging
🤔 Какой метод уменьшения размерности сохраняет глобальную структуру данных, используя геодезическое расстояние?
Anonymous Quiz
14%
PCA
6%
LDA
70%
Isomap
11%
T-SNE
🤔 Что будет с целевой меткой с предсказаниями, если обучалась на неотрицательной целевой метке?

Модель будет предсказывать только неотрицательные значения, что может ограничивать её применение.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какие методы используются для анализа временных рядов?
Anonymous Quiz
78%
ARIMA
5%
Exponential Smoothing
11%
LSTM
5%
Moving Average
💊8
🤔 Какой метод уменьшения размерности выделяет линейные комбинации признаков, которые лучше всего разделяют классы?
Anonymous Quiz
54%
PCA
24%
LDA
12%
Isomap
10%
T-SNE
🔥1
🤔 У бинарного классификатора разделение данных такое, что 95% в одном классе, 5% в другом — какую метрику следует выбрать?

Лучше использовать F1-score, AUC-ROC или precision-recall, поскольку они учитывают дисбаланс классов и избегают искажений, связанных с accuracy.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊1
🤔 Какой метод уменьшения размерности используется для выявления скрытых факторов в данных?
Anonymous Quiz
9%
K-means
68%
LDA (Latent Dirichlet Allocation)
18%
NMF
5%
Decision Tree
🔥1
🤔 Какой метод помогает бороться с мультиколлинеарностью в регрессии?
Anonymous Quiz
69%
Ridge Regression
8%
Gradient Descent
13%
Bootstrap
10%
Holdout Validation
👍1
🤔 Как обучаются линейные модели?

Линейные модели обучаются путём нахождения оптимальных весов, которые минимизируют функцию потери, обычно через градиентный спуск. В случае простых моделей (например, линейной регрессии) может быть использовано аналитическое решение (метод наименьших квадратов). При больших данных или сложных задачах применяется итеративный подход для более эффективной оптимизации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1
🤔 Какой метод используется для создания рекомендаций на основе сходства пользователей?
Anonymous Quiz
27%
K-means
69%
User-Based Collaborative Filtering
1%
Decision Tree
3%
Naive Bayes
👍1
🤔 Какой метод используется для оценки модели при наличии дисбалансированных данных?
Anonymous Quiz
3%
Точность
59%
F1-score
34%
ROC AUC
4%
Каппа коэффициент
👍1
🤔 Как работает градиентный спуск?

Градиентный спуск работает путём вычисления частных производных функции ошибки по параметрам модели и обновления параметров в направлении, которое уменьшает ошибку. На каждой итерации вычисляется градиент, указывающий, в каком направлении и насколько нужно изменить параметры модели. Если градиент положительный, параметры уменьшаются, а если отрицательный — увеличиваются. Процесс продолжается до тех пор, пока функция ошибки не достигнет локального минимума или не завершится заданное количество шагов.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какая метрика наиболее подходит для оценки качества кластеризации, если известны истинные кластерные метки?
Anonymous Quiz
47%
Silhouette Score
20%
Adjusted Rand Index
22%
Elbow Method
11%
Calinski-Harabasz Index
🤔 Какой метод часто применяют для оценки качества моделей классификации?
Anonymous Quiz
83%
F1-мера
8%
K-means
3%
PCA
7%
Логистическая регрессия
👍1
🤔 Какие известны рекомендательные модели?

Content-Based Filtering, Collaborative Filtering, и Hybrid модели. Выбор зависит от задачи и данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод оптимизации часто используется для обучения больших нейронных сетей?
Anonymous Quiz
4%
Метод Ньютона
7%
Линейная регрессия
86%
Адам (Adam)
3%
K-means
👍1
🤔 Какой алгоритм оптимизации используется в методе Adam?
Anonymous Quiz
28%
SGD (Stochastic Gradient Descent)
37%
Adagrad
12%
RMSprop
23%
Momentum
💊7🔥1
🤔 Почему в картинках используют Standard Scaling вместо MinMax Scaling?

Standard Scaling (z-score normalization) чаще используется для обработки изображений, поскольку:
1. Он центрирует данные вокруг нуля и масштабирует их на основе стандартного отклонения, что улучшает производительность моделей, чувствительных к масштабам.
2. MinMax Scaling, преобразующий значения в диапазон [0, 1], может терять информацию о дисперсии пикселей.
3. Standard Scaling более устойчив к изменению контрастности и яркости изображений.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM