Data Science | Тесты
2.51K subscribers
25 photos
346 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод уменьшения размерности используется для выделения скрытых признаков из данных путем обучения нейронных сетей?
Anonymous Quiz
12%
PCA
14%
LDA
63%
Автоэнкодеры
11%
T-SNE
🤔 Какой метод уменьшает дисперсию и улучшает обобщающую способность модели?
Anonymous Quiz
43%
Bagging
29%
Dropout
23%
Cross-Validation
4%
Early Stopping
💊10
🤔 Чем отличаются str и repr?

str предназначен для отображения понятного текста для пользователя, repr — для отображения точного представления объекта для разработчика.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод кластеризации наиболее устойчив к выбросам?
Anonymous Quiz
25%
K-means
22%
Иерархическая кластеризация
48%
DBSCAN
5%
PCA
🤔 Какой метод используется для прогнозирования временных рядов на основе исторических данных и авторегрессионных моделей?
Anonymous Quiz
88%
ARIMA
6%
Support Vector Machines (SVM)
2%
Random Forest
4%
K-nearest neighbors (KNN)
🤔 Как работает Dropout?

Это техника регуляризации в нейросетях, уменьшающая переобучение:
1. На каждой итерации обучения случайно зануляется часть нейронов.
2. Это предотвращает чрезмерную зависимость от отдельных признаков.
3. Во время предсказания Dropout не применяется, а выходы масштабируются.
Dropout делает нейросеть более устойчивой и снижает вероятность переобучения.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для классификации текстовых данных с учетом порядка слов в документе?
Anonymous Quiz
4%
Логистическая регрессия
1%
K-means
45%
Bag-of-Words
50%
Рекуррентные нейронные сети (RNN)
🤔 Какой метод оценивает производительность модели на невидимых данных?
Anonymous Quiz
29%
Grid Search
7%
Bagging
51%
Cross-Validation
13%
Clustering
🤔2
🤔 Как обучается модель?

Процесс обучения модели машинного обучения включает:
1. Предобработку данных – нормализация, удаление выбросов, кодирование категориальных признаков.
2. Выбор модели – линейная регрессия, дерево решений, нейросети и т. д.
3. Разделение данных – обучение (train), валидация (validation), тестирование (test).
4. Оптимизация параметров – подбор коэффициентов с помощью градиентного спуска или других методов.
5. Оценка качества – использование метрик (MSE, Accuracy, ROC-AUC).
Модель обучается за счет минимизации функции потерь и корректировки параметров.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔1
🤔 Какая метрика оценки модели учитывает как ложные срабатывания, так и пропуски?
Anonymous Quiz
57%
F1-Score
25%
ROC-AUC
10%
Precision
8%
Accuracy
🤔 Какой метод часто применяют для визуализации многомерных данных?
Anonymous Quiz
62%
t-SNE
6%
K-means
31%
PCA
1%
Логистическая регрессия
🤔 Как работает регресс?

Регрессия — это метод машинного обучения, который моделирует зависимость между одной или несколькими независимыми переменными (признаками) и зависимой переменной (предсказываемой величиной). Основная цель регрессии — предсказать значение зависимой переменной на основе новых значений независимых переменных, минимизируя ошибку. В Data Science регрессия широко используется для прогнозирования и анализа взаимосвязей данных, таких как линейная и логистическая регрессии.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊1
🤔 Какой метод используется для повышения устойчивости модели к смещению данных?
Anonymous Quiz
38%
Data Augmentation
9%
Early Stopping
39%
Cross Validation
13%
Gradient Clipping
🤔 Что такое переобучение модели?

Переобучение (overfitting) происходит, когда модель слишком точно запоминает данные обучающей выборки, вместо того чтобы учить общие закономерности. В результате она плохо обобщает знания на новые данные и показывает высокую ошибку на тестовой выборке. Переобучение возникает, если модель слишком сложна или в обучающей выборке присутствует шум. Для борьбы с переобучением применяются методы регуляризации, кросс-валидации и увеличение объёма данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой алгоритм основан на методе случайного подпространства и решающих деревьев?
Anonymous Quiz
10%
Gradient Boosting
80%
Random Forest
1%
Linear Regression
9%
Decision Tree
🤔 Какой метод проверки модели используется для временных рядов?
Anonymous Quiz
11%
K-Fold Cross-Validation
6%
Holdout Validation
79%
Time Series Split
3%
Bootstrap
🤔 Как градиент бустинг регрессор работает?

Градиент бустинг регрессор строит множество слабых моделей, таких как деревья решений, и комбинирует их для улучшения предсказаний. Модели обучаются последовательно, каждая новая модель пытается скорректировать ошибки предыдущих. На каждом шаге модель минимизирует ошибку, используя градиент функции потерь для обновления предсказаний. Этот процесс продолжается до тех пор, пока не будет достигнута определенная точность или не исчерпаны ресурсы.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения используется для классификации данных на основе вероятностных зависимостей между признаками?
Anonymous Quiz
22%
Логистическая регрессия
10%
K-ближайших соседей
10%
Метод опорных векторов
57%
Наивный байесовский классификатор
🤔 Какой метод машинного обучения часто используется для кластеризации данных?
Anonymous Quiz
86%
K-средних
2%
Случайный лес
5%
Логистическая регрессия
7%
Дерево решений