Data Science | Тесты – Telegram

Data Science | Тесты

2.51K subscribers

25 photos

347 links

Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy

Download Telegram

About

Blog

Apps

Platform

Data Science | Тесты

2.51K subscribers

Data Science | Тесты

🤔 Что можешь сказать про оконные функции?

Оконные функции в SQL и в библиотеках анализа данных, таких как pandas, позволяют выполнять вычисления по подмножествам данных (окнам), которые связаны с текущей строкой. Это включает в себя операции, такие как суммирование, вычисление среднего, и другие статистические функции, применяемые к "окну" данных.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

576 views16:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для выявления аномалий путем создания модели на основе нормальных данных?

Anonymous Quiz

Логистическая регрессия

Автоэнкодеры

🤔1

173 voters574 views20:01

Data Science | Тесты

🤔 Какой метод машинного обучения используется для создания синтетических образцов в несбалансированных данных?

Anonymous Quiz

167 voters553 views09:01

Data Science | Тесты

🤔 У бинарного классификатора разделение данных такое, что 95% в одном классе, 5% в другом — какую метрику следует выбрать?

Лучше использовать F1-score, AUC-ROC или precision-recall, поскольку они учитывают дисбаланс классов и избегают искажений, связанных с accuracy.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

566 views16:01

Data Science | Тесты

🤔 Какой метод машинного обучения использует ядровые функции для работы с нелинейными данными?

Anonymous Quiz

Линейная регрессия

Логистическая регрессия

Метод опорных векторов (SVM)

167 voters560 views20:01

Data Science | Тесты

🤔 Какой метод используется для нормализации данных, приводя их к стандартному нормальному распределению?

Anonymous Quiz

Min-Max Scaling

Z-score Normalization

170 voters525 views09:01

Data Science | Тесты

🤔

Почему хорошо работает случайный лес?

Случайный лес работает хорошо, потому что он сочетает предсказания множества независимых деревьев решений, что снижает вероятность переобучения и увеличивает общую точность модели. Каждое дерево строится на случайной подвыборке данных и случайных признаках, что обеспечивает разнообразие моделей. За счёт этого случайный лес становится устойчивым к шуму и переобучению, предоставляя более стабильные и обобщающие предсказания. Модель также устойчива к выбросам и может эффективно работать с большим количеством признаков.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2🔥1

575 views16:01

Data Science | Тесты

🤔 Какой метод используется для выбора лучших признаков модели?

Anonymous Quiz

💊3

168 voters538 views20:01

Data Science | Тесты

🤔 Какой метод уменьшает смещение и дисперсию в линейной регрессии?

Anonymous Quiz

153 voters509 views09:01

Data Science | Тесты

🤔 Сравнение архитектуры RNN, CNN, трансформера?

RNN обрабатывает данные последовательно и хорошо работает с временными рядами или текстами, но страдает от проблем с градиентами и плохо масштабируется. CNN извлекает локальные признаки через свёртки, изначально предназначен для изображений, но может применяться к тексту. Трансформер использует механизм внимания, обрабатывает всё параллельно и учитывает контекст целиком, что делает его эффективным в работе с языком и последовательностями.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥1

530 views16:01

Data Science | Тесты

🤔 Какой метод оценки моделей учитывает как сложность модели, так и ее способность обобщать данные?

Anonymous Quiz

Cross-Validation

AIC (Akaike Information Criterion)

158 voters535 views20:01

Data Science | Тесты

🤔 Какой метод уменьшает дисперсию, сохраняя важные признаки?

Anonymous Quiz

💊4🤔3

176 voters539 views09:01

Data Science | Тесты

🤔 Какие есть детекторы и архитектуры в CV?

Классические: SIFT, HOG. Современные архитектуры: YOLO, SSD, Faster R-CNN для детекции объектов, U-Net, DeepLab для сегментации.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

559 views16:01

Data Science | Тесты

🤔 Какой метод машинного обучения подходит для задачи предсказания категории текстовых документов?

Anonymous Quiz

Support Vector Machine (SVM)

Recurrent Neural Network (RNN)

Latent Dirichlet Allocation (LDA)

166 voters567 views20:01

Data Science | Тесты

🤔 Какой метод использует энтропию для разбиения узлов в деревьях решений?

Anonymous Quiz

Information Gain

156 voters556 views09:02

Data Science | Тесты

🤔 Что такое метод максимизации правдоподобия?

Метод максимизации правдоподобия — это статистический метод, используемый для оценки параметров вероятностной модели. Он основан на максимизации функции правдоподобия, которая измеряет, как хорошо параметры модели соответствуют наблюдаемым данным.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2💊1

577 views16:02

Data Science | Тесты

🤔 Какую задачу решает метод главных компонент (PCA)?

Anonymous Quiz

Кластеризация

Регрессия

Уменьшение размерности

Классификация

216 voters575 views20:01

Data Science | Тесты

🤔 Какой метод уменьшает дисперсию в модели, уменьшая переобучение?

Anonymous Quiz

Cross-Validation

💊1

169 voters547 views09:02

Data Science | Тесты

🤔 Чем отличается итератор от генератора?

Итератор — это объект с методами iter и next, позволяющий поочерёдно перебирать элементы. Генератор — это удобная форма итератора, создаваемая функцией с использованием yield, которая сохраняет своё состояние между вызовами. Итераторы требуют ручной реализации, а генераторы упрощают создание итераций.

Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1🔥1🤔1

568 views16:01

Data Science | Тесты

🤔 Какой алгоритм используется для анализа текстовых данных и определения схожести между документами?

Anonymous Quiz

K-ближайших соседей

Линейная регрессия

184 voters536 views20:01