🤔 Что такое градиентный спуск?
Градиентный спуск — это метод оптимизации, который используется для нахождения минимального значения функции ошибки модели путём итеративного изменения параметров модели (например, весов). На каждом шаге вычисляется градиент функции ошибки по параметрам, и параметры корректируются в направлении, противоположном градиенту. Шаг изменения регулируется параметром скорости обучения (learning rate). Градиентный спуск эффективен для обучения моделей с большим количеством параметров.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
👍2
🤔 Какой метод машинного обучения используется для классификации текстовых данных с учетом частотных характеристик слов?
Anonymous Quiz
89%
TF-IDF
2%
Линейная регрессия
2%
Decision Tree
7%
RNN
🤔 Какой метод используется для выявления скрытых переменных в данных?
Anonymous Quiz
58%
Латентный Дирихле распределение
4%
Кластеризация k-средних
33%
Метод главных компонент
5%
Решающее дерево
🤔 Какой метод оптимизации наиболее эффективен для глубоких нейросетей?
Anonymous Quiz
10%
Градиентный спуск
16%
Стохастический градиентный спуск
3%
Метод моментов Нестерова
70%
Адаптивная оценка момента (Adam)
🤔 Какой алгоритм оптимизации используется в XGBoost?
Anonymous Quiz
26%
Adam
46%
Gradient Descent
21%
L-BFGS
7%
Newton-Raphson
🤔 Какую метрику регрессии используешь для объяснения результатов?
Для объяснения результатов регрессии обычно используются несколько метрик, таких как среднеквадратичная ошибка (MSE), средняя абсолютная ошибка (MAE) и R-квадрат. Выбор зависит от специфики задачи и приоритетов: чувствительности к выбросам, интерпретируемости или доли объясненной дисперсии. Важно учитывать контекст и использовать несколько метрик для полной оценки.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🤔 Какой метод уменьшает смещение в ансамблевом обучении?
Anonymous Quiz
31%
Bagging
51%
Boosting
6%
Gradient Descent
12%
Cross-Validation
💊3
🤔 Какой алгоритм часто используется для прогнозирования временных рядов?
Anonymous Quiz
6%
Линейная регрессия
86%
ARIMA
3%
Случайный лес
5%
K-means
🤔 Какой оптимизатор выбрать для обучения нейронной сети?
Adam часто используется из-за адаптивного шага обучения. SGD предпочтителен для больших данных.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Adam часто используется из-за адаптивного шага обучения. SGD предпочтителен для больших данных.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🔥1
🤔 Какой алгоритм уменьшает размерность данных, сохраняя вариативность?
Anonymous Quiz
6%
Linear Regression
87%
Principal Component Analysis
6%
Decision Tree
0%
Naive Bayes
🤔 Какой метод уменьшает дисперсию, комбинируя несколько моделей с заменой?
Anonymous Quiz
43%
Bagging
21%
Boosting
33%
Stacking
3%
Gradient Descent
🤔 Как избегают коллизии в хеш-таблице
Для предотвращения коллизий в хэш-таблице используются методы, такие как цепочки (связывание элементов в списки) и открытая адресация (перенос коллизий в другие доступные ячейки). Метод цепочек добавляет все значения с одинаковым хэшом в связанный список, что позволяет хранить несколько элементов в одной ячейке. В открытой адресации при коллизии выполняется последовательный поиск следующей свободной ячейки.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
👍1
🤔 Какой метод машинного обучения используется для анализа временных рядов и прогнозирования будущих значений?
Anonymous Quiz
4%
Линейная регрессия
4%
Decision Tree
82%
ARIMA
11%
RNN
💊1
🤔 Какой метод машинного обучения используется для повышения устойчивости модели к выбросам?
Anonymous Quiz
8%
Линейная регрессия
38%
Градиентный бустинг
43%
Медианная регрессия
11%
K-means
🤔1
🤔 Что такое recall?
Recall (полнота) — это метрика, показывающая, какая доля истинных положительных случаев была правильно предсказана моделью. Она рассчитывается как отношение количества истинно положительных предсказаний к сумме истинно положительных и ложно отрицательных. Recall важен, когда важно минимизировать количество пропущенных положительных случаев. Высокий recall означает, что модель почти не пропускает положительные случаи.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🤔 Какой метод машинного обучения используется для классификации текста?
Anonymous Quiz
71%
LSTM
6%
KMeans
22%
Naive Bayes
1%
PCA
💊1
Стажировки и вакансии Data Science и ML
- Вакансии которых нет на джоб-агрегаторах
- Только прямые контакты HR в Telegram
👉 @jobs_ds_ml
🤖 ML & DS 👩💻 DevOps
👨✈️ ИБ & OSINT 👣 Go
👩💻 Mobile 👩💻 C#
👩💻 Node.js 👩💻 Python
🔎QA 👩💻 Java
👩💻 UX/UI 👩💻 Frontend
🖼️ PHP 📋 Analyst
💼 1C 🖥 SQL
👩💻 IT HR
Пока другие листают джоб-сайты — ты уже пишешь HR в Telegram.
- Вакансии которых нет на джоб-агрегаторах
- Только прямые контакты HR в Telegram
👉 @jobs_ds_ml
🔎
Пока другие листают джоб-сайты — ты уже пишешь HR в Telegram.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какая функция из библиотеки pandas удаляет пропуски в данных?
Anonymous Quiz
84%
dropna
12%
fillna
1%
replace
3%
drop
🤔 Какая скорость поиска в хэш-таблице
Скорость поиска в хэш-таблице (например, HashMap) в среднем составляет O(1), так как ключи напрямую отображаются в индекс с помощью хэш-функции. В худшем случае, при коллизиях, время поиска может увеличиваться до O(n), если хэш-таблица не оптимизирована или используется неэффективная стратегия разрешения коллизий. Однако в большинстве случаев эффективные хэш-функции и методы обработки коллизий поддерживают близкую к O(1) скорость.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
🤔 Какой метод обработки данных учитывает корреляции между признаками?
Anonymous Quiz
55%
PCA
11%
Random Forest
14%
K-means
20%
DBSCAN
🤔 Какой метод уменьшает дисперсию модели, объединяя прогнозы многих слабых моделей?
Anonymous Quiz
7%
K-means
4%
DBSCAN
84%
Bagging
4%
SVM