Data Science | Тесты
2.51K subscribers
25 photos
350 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Какой метод машинного обучения используется для обработки временных рядов?
Anonymous Quiz
7%
Случайный лес
70%
RNN
19%
Линейная регрессия
5%
K-means
🤔 Какими должны быть распределения для t-теста?

Для стандартного t-теста данные должны быть:
1. Нормально распределёнными.
2. Иметь одинаковую дисперсию между группами.
Если эти условия не выполняются, используют его модификации или непараметрические тесты.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
😁2
🤔 Какой метод используется для классификации текстовых данных с учетом порядка слов?
Anonymous Quiz
80%
RNN
8%
K-means
8%
Decision Tree
4%
Logistic Regression
🤔 Какой метод уменьшения размерности сохраняет глобальную структуру данных, используя геодезическое расстояние?
Anonymous Quiz
25%
PCA
10%
LDA
43%
Isomap
22%
T-SNE
🤔 В чем разница между pivot и pivot_table?

`pivot` может создавать новый производный DataFrame, переформатируя исходный DataFrame. Он не поддерживает агрегацию данных. `pivot_table` делает то же самое, что и `pivot`, но также поддерживает агрегацию данных, позволяя использовать функции агрегирования, такие как суммирование, среднее и т.д.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥71
🤔 Зачем нужен self super?

self указывает на текущий экземпляр класса, а super позволяет обращаться к методам родительского класса, избегая дублирования кода.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
🤔 Какой метод машинного обучения используется для прогнозирования последовательностей данных, таких как текст или временные ряды?
Anonymous Quiz
8%
Линейная регрессия
1%
Случайный лес
84%
Рекуррентные нейронные сети (RNN)
7%
Метод опорных векторов (SVM)
👍3
🤔 Какой метод машинного обучения используется для классификации данных, разделенных нелинейной границей?
Anonymous Quiz
2%
Линейная регрессия
16%
Логистическая регрессия
63%
Метод опорных векторов с ядром (SVM)
20%
K-means
🤔 В чем разница между листом и кортежем?

В Python список (list) — это изменяемая коллекция объектов, тогда как кортеж (tuple) — неизменяемая. Это значит, что после создания кортежа его нельзя изменить (добавлять элементы, удалять элементы, изменять существующие элементы).

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4😁1
🤔 Какой метод часто применяют для уменьшения дисперсии модели?
Anonymous Quiz
74%
Бэггинг
6%
K-means
18%
PCA
2%
Логистическая регрессия
👍1
🤔 Какой метод используется для классификации текстовых данных на основе частотных характеристик слов?
Anonymous Quiz
2%
Линейная регрессия
6%
K-means
88%
TF-IDF
4%
Логистическая регрессия
🤔 Как можно сравнивать два ненормальных распределения?

1. Применить непараметрические тесты, такие как тест Манна-Уитни или Краскела-Уоллиса.
2. Использовать бутстрепинг для создания доверительных интервалов.
3. Рассмотреть преобразование данных для приближения к нормальному виду.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1
🤔 Какой метод уменьшения размерности часто используется для визуализации данных?
Anonymous Quiz
53%
PCA
26%
PCA
15%
LDA
6%
NMF
😁46🤯11💊8🤔6
🤔 Какой алгоритм используется для анализа категориальных признаков?
Anonymous Quiz
4%
Линейная регрессия
23%
Логистическая регрессия
13%
Метод опорных векторов
59%
One-hot encoding
💊20😁3🤔1
🤔 Как избегают коллизии в хеш мапе?

В хеш-мапах коллизии избегаются несколькими способами:
1. Цепочки: каждый элемент хеш-таблицы содержит список (или другую структуру данных), который может хранить несколько элементов с одинаковым хешем.
2. Открытая адресация: при коллизии происходит последовательный поиск следующей свободной ячейки по определенному алгоритму (линейное пробирование, квадратичное пробирование, двойное хеширование).
3. Перехеширование: при высоком уровне заполненности хеш-таблицы, таблица может быть перестроена с новым размером и новой хеш-функцией для уменьшения количества коллизий.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод машинного обучения подходит для решения задачи классификации с несколькими классами и большим количеством признаков?
Anonymous Quiz
12%
Логистическая регрессия
42%
Деревья решений
33%
Градиентный бустинг
14%
Наивный Байес
💊23👍1
🤔 При свёртке картинки HxW матрицей 3x3, что получится в итоге?

Результирующий размер изображения будет (H−2)×(W−2)(H-2) \times (W-2), если не использовать дополнение, так как свёртка "обрезает" края.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1