Data Science | Тесты
2.51K subscribers
25 photos
349 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод уменьшения размерности используется для выделения наиболее значимых признаков путем итеративного удаления наименее важных?
Anonymous Quiz
37%
PCA
8%
LDA
31%
Регрессия с L1-регуляризацией
24%
RFE
💊2
🤔 Что знаешь про early stopping?

Early stopping — это техника регуляризации, которая завершает обучение модели, если метрика качества на валидационном наборе перестаёт улучшаться. Это предотвращает переобучение, позволяя сохранить оптимальные параметры до ухудшения обобщающей способности. Метод основан на мониторинге функции ошибки или качества модели во время каждой итерации обучения.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
🤔 Какой алгоритм классификации известен своей способностью работать как с линейно разделимыми, так и с нелинейными данными?
Anonymous Quiz
7%
Linear Regression
41%
Decision Tree
41%
Support Vector Machine (SVM)
10%
K-means Clustering
🤔2💊1
🤔 Как обучается модель?

Процесс обучения модели машинного обучения включает:
1. Предобработку данных – нормализация, удаление выбросов, кодирование категориальных признаков.
2. Выбор модели – линейная регрессия, дерево решений, нейросети и т. д.
3. Разделение данных – обучение (train), валидация (validation), тестирование (test).
4. Оптимизация параметров – подбор коэффициентов с помощью градиентного спуска или других методов.
5. Оценка качества – использование метрик (MSE, Accuracy, ROC-AUC).
Модель обучается за счет минимизации функции потерь и корректировки параметров.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод уменьшения размерности используется для выделения линейных комбинаций признаков, которые лучше всего разделяют классы?
Anonymous Quiz
51%
PCA
23%
LDA
10%
Isomap
15%
T-SNE
🤔 Какой метод используется для выбора лучших признаков модели?
Anonymous Quiz
47%
PCA
29%
RFE
7%
LDA
16%
T-SNE
💊3
🤔 Чем функция __init__ в классе отличается от функции __new__

В Python __new__ отвечает за создание нового объекта класса и вызывается перед __init__, принимая первый аргумент cls вместо self. __new__ полезен, когда нужно контролировать создание объекта, например, при наследовании от неизменяемых типов (например, int или str). __init__ инициализирует уже созданный объект, устанавливая его начальные значения и атрибуты.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Какой метод используется для уменьшения размерности данных?
Anonymous Quiz
11%
Support Vector Machines (SVM)
3%
Random Forest
6%
K-Nearest Neighbors (KNN)
81%
Principal Component Analysis (PCA)
🤔 Какой метод используется для выявления скрытых факторов в данных путем анализа зависимостей между наблюдениями и переменными?
Anonymous Quiz
49%
Factor Analysis
16%
Principal Component Analysis (PCA)
16%
Linear Discriminant Analysis (LDA)
20%
Independent Component Analysis (ICA)
💊12
🤔 Какие переменные (типы данных) можно использовать в качестве ключей?

Хэшируемые типы данных, такие как числа, строки, кортежи с неизменяемыми элементами. Это важно, если требуется быстро сопоставить значения в структуре данных.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод машинного обучения применяется для уменьшения мультиколлинеарности?
Anonymous Quiz
3%
Линейная регрессия
6%
Логистическая регрессия
86%
Регрессия с L1-регуляризацией
5%
K-means
🤔 В чем разница между командами DELETE и TRUNCATE?

`DELETE` удаляет строки из таблицы на основе указанного условия и записывает каждое удаление в журнал транзакций, что позволяет выполнить откат операции. `TRUNCATE` быстро удаляет все строки из таблицы, не записывая в журнал отдельные удаления, что делает эту операцию быстрой, но необратимой.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
🤔 Какой метод оптимизации используется для обучения больших нейронных сетей?
Anonymous Quiz
4%
Метод Ньютона
29%
Градиентный спуск
65%
Адам (Adam)
1%
K-means
🤔 Почему нельзя использовать дерево, если переменная непредобработана?

Деревья принимают решения на основе пороговых значений, и непредобработанные переменные могут привести к неверным или неэффективным разбиениям.
1. Категориальные переменные без кодирования (например, текст) не могут быть обработаны деревьями.
2. Пропущенные или масштабно несбалансированные данные могут искажать результаты.
Предобработка помогает улучшить качество разбиений и повысить производительность модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊6
🤔 Какой метод используют для оценки важности признаков в модели случайного леса?
Anonymous Quiz
11%
Градиентный бустинг
16%
Бэггинг
65%
Gini Importance
9%
Lasso
🤔 Какой метод уменьшает дисперсию в ансамблевом обучении?
Anonymous Quiz
54%
Bagging
28%
Boosting
8%
Gradient Descent
11%
Cross-Validation
🤔 Почему нейронные сети усложняют добавлением слоёв, а не количеством нейронов в слое?

1. Добавление слоёв увеличивает глубину: Это позволяет моделировать более сложные зависимости и иерархические признаки (например, в изображениях).
2. Слишком много нейронов в одном слое приводит к избыточности: Сеть может переобучаться или не быть эффективной.
3. Слои способствуют обучению на разных уровнях абстракции: Например, начальные слои выделяют простые признаки (линии, края), а более глубокие — сложные (объекты).
4. Увеличение количества нейронов вместо слоёв может повысить вычислительную сложность без значительного увеличения эффективности.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊4