Data Science | Тесты
2.51K subscribers
25 photos
350 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой алгоритм классификации известен своей способностью работать как с линейно разделимыми, так и с нелинейными данными?
Anonymous Quiz
7%
Linear Regression
41%
Decision Tree
41%
Support Vector Machine (SVM)
10%
K-means Clustering
🤔2💊1
🤔 Как обучается модель?

Процесс обучения модели машинного обучения включает:
1. Предобработку данных – нормализация, удаление выбросов, кодирование категориальных признаков.
2. Выбор модели – линейная регрессия, дерево решений, нейросети и т. д.
3. Разделение данных – обучение (train), валидация (validation), тестирование (test).
4. Оптимизация параметров – подбор коэффициентов с помощью градиентного спуска или других методов.
5. Оценка качества – использование метрик (MSE, Accuracy, ROC-AUC).
Модель обучается за счет минимизации функции потерь и корректировки параметров.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод уменьшения размерности используется для выделения линейных комбинаций признаков, которые лучше всего разделяют классы?
Anonymous Quiz
51%
PCA
23%
LDA
10%
Isomap
15%
T-SNE
🤔 Какой метод используется для выбора лучших признаков модели?
Anonymous Quiz
47%
PCA
29%
RFE
7%
LDA
16%
T-SNE
💊3
🤔 Чем функция __init__ в классе отличается от функции __new__

В Python __new__ отвечает за создание нового объекта класса и вызывается перед __init__, принимая первый аргумент cls вместо self. __new__ полезен, когда нужно контролировать создание объекта, например, при наследовании от неизменяемых типов (например, int или str). __init__ инициализирует уже созданный объект, устанавливая его начальные значения и атрибуты.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Какой метод используется для уменьшения размерности данных?
Anonymous Quiz
11%
Support Vector Machines (SVM)
3%
Random Forest
6%
K-Nearest Neighbors (KNN)
81%
Principal Component Analysis (PCA)
🤔 Какой метод используется для выявления скрытых факторов в данных путем анализа зависимостей между наблюдениями и переменными?
Anonymous Quiz
49%
Factor Analysis
16%
Principal Component Analysis (PCA)
16%
Linear Discriminant Analysis (LDA)
20%
Independent Component Analysis (ICA)
💊12
🤔 Какие переменные (типы данных) можно использовать в качестве ключей?

Хэшируемые типы данных, такие как числа, строки, кортежи с неизменяемыми элементами. Это важно, если требуется быстро сопоставить значения в структуре данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения применяется для уменьшения мультиколлинеарности?
Anonymous Quiz
3%
Линейная регрессия
6%
Логистическая регрессия
86%
Регрессия с L1-регуляризацией
5%
K-means
🤔 В чем разница между командами DELETE и TRUNCATE?

`DELETE` удаляет строки из таблицы на основе указанного условия и записывает каждое удаление в журнал транзакций, что позволяет выполнить откат операции. `TRUNCATE` быстро удаляет все строки из таблицы, не записывая в журнал отдельные удаления, что делает эту операцию быстрой, но необратимой.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод оптимизации используется для обучения больших нейронных сетей?
Anonymous Quiz
4%
Метод Ньютона
29%
Градиентный спуск
65%
Адам (Adam)
1%
K-means
🤔 Почему нельзя использовать дерево, если переменная непредобработана?

Деревья принимают решения на основе пороговых значений, и непредобработанные переменные могут привести к неверным или неэффективным разбиениям.
1. Категориальные переменные без кодирования (например, текст) не могут быть обработаны деревьями.
2. Пропущенные или масштабно несбалансированные данные могут искажать результаты.
Предобработка помогает улучшить качество разбиений и повысить производительность модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊6
🤔 Какой метод используют для оценки важности признаков в модели случайного леса?
Anonymous Quiz
11%
Градиентный бустинг
16%
Бэггинг
65%
Gini Importance
9%
Lasso
🤔 Какой метод уменьшает дисперсию в ансамблевом обучении?
Anonymous Quiz
54%
Bagging
28%
Boosting
8%
Gradient Descent
11%
Cross-Validation
🤔 Почему нейронные сети усложняют добавлением слоёв, а не количеством нейронов в слое?

1. Добавление слоёв увеличивает глубину: Это позволяет моделировать более сложные зависимости и иерархические признаки (например, в изображениях).
2. Слишком много нейронов в одном слое приводит к избыточности: Сеть может переобучаться или не быть эффективной.
3. Слои способствуют обучению на разных уровнях абстракции: Например, начальные слои выделяют простые признаки (линии, края), а более глубокие — сложные (объекты).
4. Увеличение количества нейронов вместо слоёв может повысить вычислительную сложность без значительного увеличения эффективности.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊4
🤔 Какой метод машинного обучения используется для задач регрессии с учетом нелинейных зависимостей и взаимодействий между признаками?
Anonymous Quiz
7%
Линейная регрессия
52%
Полиномиальная регрессия
30%
Случайный лес
10%
Логистическая регрессия
🤔 Какой метод классификации использует ансамбли деревьев решений?
Anonymous Quiz
23%
Decision Trees
71%
Random Forest
2%
Logistic Regression
5%
K-Nearest Neighbors