Data Science | Тесты
2.51K subscribers
25 photos
351 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Почему в картинках используют StandardScaling вместо MinMaxScaling?

StandardScaling сохраняет распределение данных, что важно для моделей, чувствительных к стандартному отклонению, тогда как MinMaxScaling может искажать распределение.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
3
🤔 Какой метод используется для выявления скрытых факторов в данных путем факторизации матриц?
Anonymous Quiz
3%
Decision Tree
2%
Логистическая регрессия
88%
Matrix Factorization
7%
TF-IDF
😁20👀2🤯1
🤔 Какой алгоритм машинного обучения лучше всего подходит для обработки данных с высокими степенями полиномиальности?
Anonymous Quiz
7%
Линейная регрессия
4%
Логистическая регрессия
74%
Полиномиальная регрессия
15%
Случайный лес
😁12
🤔 Почему в нейронных сетях нельзя инициализировать веса нулями?

1. Симметричность: При инициализации весов нулями все нейроны в слое начинают обучение одинаково, что делает их идентичными.
2. Отсутствие обучения: Градиенты для всех нейронов слоя будут одинаковыми, из-за чего они не смогут различаться и обучаться.
3. Решение: Инициализация случайными значениями разрывает симметрию, позволяя нейронам обучаться независимо друг от друга.
Стандартные методы, такие как He или Xavier инициализация, обеспечивают оптимальный начальный размах весов.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥3
🤔 Какой метод используется для создания рекомендаций на основе сходства элементов?
Anonymous Quiz
6%
Decision Tree
78%
Item-Based Collaborative Filtering
8%
Автоэнкодеры
8%
TF-IDF
😁4👀2
🤔 Какой метод машинного обучения используется для классификации текстов с использованием пре-тренированных словарей?
Anonymous Quiz
7%
Decision Tree
4%
Логистическая регрессия
69%
Word2Vec
20%
TF-IDF
🤔 Как работает градиентный спуск?

Градиентный спуск работает путём вычисления частных производных функции ошибки по параметрам модели и обновления параметров в направлении, которое уменьшает ошибку. На каждой итерации вычисляется градиент, указывающий, в каком направлении и насколько нужно изменить параметры модели. Если градиент положительный, параметры уменьшаются, а если отрицательный — увеличиваются. Процесс продолжается до тех пор, пока функция ошибки не достигнет локального минимума или не завершится заданное количество шагов.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61
🤔 Какой метод борьбы с мультиколлинеарностью объединяет L1 и L2 штрафы?
Anonymous Quiz
6%
Ridge Regression
11%
Lasso Regression
76%
Elastic Net
7%
Dropout
😁1
🤔 В чем разница между L1 и L2 регуляризацией?

L1-регуляризация (Lasso) добавляет сумму модулей весов к функции потери, склоняя веса к нулю, что способствует разреженности. L2-регуляризация (Ridge) добавляет сумму квадратов весов, уменьшая их величину, но не зануляя. L1 эффективна для отбора признаков, а L2 — для стабилизации модели и борьбы с переобучением.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
🤔 Какой метод часто применяют для уменьшения дисперсии модели?
Anonymous Quiz
68%
Бэггинг
6%
K-means
20%
PCA
6%
Логистическая регрессия
💊3
🤔 Какой метод машинного обучения используется для обработки временных рядов?
Anonymous Quiz
7%
Случайный лес
70%
RNN
19%
Линейная регрессия
5%
K-means
🤔 Какими должны быть распределения для t-теста?

Для стандартного t-теста данные должны быть:
1. Нормально распределёнными.
2. Иметь одинаковую дисперсию между группами.
Если эти условия не выполняются, используют его модификации или непараметрические тесты.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
😁2
🤔 Какой метод используется для классификации текстовых данных с учетом порядка слов?
Anonymous Quiz
80%
RNN
8%
K-means
8%
Decision Tree
4%
Logistic Regression
🤔 Какой метод уменьшения размерности сохраняет глобальную структуру данных, используя геодезическое расстояние?
Anonymous Quiz
25%
PCA
10%
LDA
43%
Isomap
22%
T-SNE
🤔 В чем разница между pivot и pivot_table?

`pivot` может создавать новый производный DataFrame, переформатируя исходный DataFrame. Он не поддерживает агрегацию данных. `pivot_table` делает то же самое, что и `pivot`, но также поддерживает агрегацию данных, позволяя использовать функции агрегирования, такие как суммирование, среднее и т.д.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥71
🤔 Зачем нужен self super?

self указывает на текущий экземпляр класса, а super позволяет обращаться к методам родительского класса, избегая дублирования кода.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
🤔 Какой метод машинного обучения используется для прогнозирования последовательностей данных, таких как текст или временные ряды?
Anonymous Quiz
8%
Линейная регрессия
1%
Случайный лес
84%
Рекуррентные нейронные сети (RNN)
7%
Метод опорных векторов (SVM)
👍3