Data Science | Тесты
2.51K subscribers
25 photos
351 links
Cайт easyoffer.ru
Реклама @easyoffer_adv
ВП @easyoffer_vp

Вопросы собесов t.me/+RQVnIJT__Z42ZWUy
Вакансии t.me/+Ir52wMvyEgo5YWIy
Download Telegram
🤔 Как объяснить бизнесу метрику машинного обучения?

1. Сфокусируйтесь на бизнес-цели: Объясните, как метрика напрямую влияет на цели компании (например, рост прибыли, снижение ошибок).
2. Избегайте технических терминов: Переведите метрику в понятные термины, например, "точность модели" — это процент правильно принятых решений.
3. Приведите примеры: Покажите, как изменения метрики влияют на реальные сценарии (например, снижение ошибок классификации улучшает качество обслуживания).


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Какой метод уменьшает дисперсию в ансамблевом обучении?
Anonymous Quiz
58%
Bagging
19%
Boosting
10%
Gradient Descent
13%
Cross-Validation
🤔 Какой метод обнаруживает выбросы в многомерных данных?
Anonymous Quiz
17%
PCA
61%
Isolation Forest
10%
K-Means Clustering
12%
SVM
🤔 Виды метрик машинного обучения.

1. Для классификации:
- Accuracy: доля верных предсказаний.
- Precision: точность предсказаний класса.
- Recall: полнота предсказаний класса.
- F1-score: сбалансированная метрика точности и полноты.
- ROC-AUC: качество модели при разных порогах.
2. Для регрессии:
- MSE: среднеквадратичная ошибка.
- MAE: средняя абсолютная ошибка.
- R²: объясненная доля дисперсии.
3. Для кластеризации:
- Silhouette Score: качество разделения кластеров.
- Dunn Index: компактность и разделенность кластеров.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод уменьшает смещение при обработке несбалансированных данных?
Anonymous Quiz
44%
SMOTE
14%
Oversampling
8%
Undersampling
35%
Class Weighing
🤔 Какой метод используется для оценки влияния каждой переменной на модель?
Anonymous Quiz
22%
Gradient Descent
17%
Forward Selection
56%
Permutation Importance
6%
Backpropagation
🤔 Как работают несимметрические метрики?

Несимметрические метрики, такие как Precision и Recall, оценивают разные аспекты работы модели, учитывая несбалансированные классы. Precision показывает долю истинно положительных среди всех предсказанных положительных, а Recall – долю найденных положительных объектов среди всех существующих.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
2
🤔 Какой метод улучшает интерпретируемость сложных моделей?
Anonymous Quiz
60%
LIME
8%
Dropout
19%
Cross-Validation
13%
Random Forest
💊3
🤔 Какой метод обнаруживает аномалии в данных?
Anonymous Quiz
69%
Isolation Forest
9%
Bagging
15%
PCA
8%
Ridge Regression
💊2
🤔 Чем отличаются str и repr?

str возвращает строковое представление объекта для пользователей, а repr – детализированное представление для разработчиков, предназначенное для отладки. Например, repr может вернуть полные данные, чтобы восстановить объект.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍1
🤔 Какой метод уменьшает размерность, сохраняя расстояния?
Anonymous Quiz
55%
PCA
13%
LDA
26%
t-SNE
6%
MDS
👀2
Forwarded from easyoffer
Привет, ребята!
1,5 года я учился на программиста, а сайт easyoffer.ru стал моим пет-проектом. Я создавал его, потому что:
а) нужно было добавить хоть какой-нибудь проект в резюме
б) подготовиться к прохождению собесов

И всё получилось! Благодаря еasyoffer я успешно прошёл собеседование и устроился Python Junior-разработчиком на удаленку с зарплатой 115 тысяч рублей.

Однако ещё во время разработки я понял, что у этого проекта есть потенциал. Казалось, что сайт может стать популярным и, возможно, превратиться в стартап.

По-этому я с самого начала заложил в проект минимальную бизнес-модель, на случай, если сайт начнёт набирать трафик. Я предложил пользователям полный доступ к сайту в обмен на подписку на Telegram-каналы. Это позволяло развивать аудиторию, а в будущем — зарабатывать на рекламе.

Результат превзошёл ожидания!
С момента запуска easyoffer посетило 400 тысяч человек. А когда доход с рекламы превысил мою зарплату программиста, я принял решение уйти с работы и полностью посвятить себя разработке новой версии сайта.

Вот так, зайдя в IT, через 4 месяца вышел через свой же пет-проект. Мне очень повезло

Уже год я работаю над easyoffer 2.0.
Это будет более масштабный и качественной новый проект:
– Появится тренажер
– Появятся задачи из собесов
– Фильтрация контента по грейдам
и еще очень много фич, о которых я расскажу позже.

Хочу, довести easyoffer до ума, чтобы сайт стал настоящим помощником для всех, кто готовится к собеседованиям.
По этому в ближайшее время я объявлю о старте краудфандинговой кампании, чтобы ускорить разработку и я готов щедро отблагодарить всех, кто поддержит проект.

А те, кто поддержат проект первыми, получат специальные лимитированные выгодные вознаграждения. Следите за этим телеграм каналом, если хотите стать первыми сапортерами.
🔥4🤯31
🤔 Какой метод часто применяют для предобработки категориальных данных?
Anonymous Quiz
87%
One-hot encoding
3%
K-means
5%
PCA
4%
Логистическая регрессия
😁2👍1
🤔 В чем различия между методами apply и applymap?

apply применяется к строкам или столбцам DataFrame, а applymap – к каждому элементу DataFrame. apply универсальнее и может обрабатывать как строки, так и столбцы.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
🤔 Какая метрика часто применяют для оценки регрессионных моделей?
Anonymous Quiz
84%
R2
6%
K-means
3%
PCA
7%
Логистическая регрессия
🔥1
🤔 Какой метод уменьшает смещение и дисперсию в модели?
Anonymous Quiz
48%
Bagging
16%
Gradient Descent
21%
Ensemble Learning
14%
Cross-Validation
🤔 Как систематическая ошибка и дисперсии связаны между собой?

Высокая систематическая ошибка (bias) уменьшает сложность модели, но снижает точность, а высокая дисперсия (variance) приводит к переобучению. Баланс между ними важен для оптимальной работы модели.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚Базу Знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
🤔 Какой метод уменьшает дисперсию в глубокой нейронной сети?
Anonymous Quiz
41%
Dropout
42%
Batch Normalization
10%
Gradient Clipping
8%
Data Augmentation
🔥2
Forwarded from easyoffer
Ищу работу пол года

Практически под каждым постом в этом канале я вижу комментарии от людей, которые ищут работу по полгода. Это перерастает в обсуждение того, как нужно (или не нужно) искать работу, почему процесс найма сломан и как они откликались на фейковые вакансии.

Честно говоря, искать работу полгода — это нонсенс. Очевидно, что человек делает что-то не так. Главная ошибка, которую совершают многие, — это создание иллюзии поиска работы.

То есть человек вроде бы ищет работу, но делает это неэффективно, тратя время на нецелевые действия. Например:

Просматривает вакансии перед откликом.
Пытается понять, подходит ли он под вакансию. Если считает, что не подходит — не откликается.
Пишет сопроводительные письма (иногда даже уникальные под каждую вакансию).
Заполняет анкеты, проходит тесты.

Все эти действия отнимают время, но не приводят к результату.

Почему это не работает?

HR-менеджер не может вручную отсмотреть 2000 откликов, оценить каждое резюме и прочитать сопроводительные письма. Поэтому компании используют ATS-системы (системы автоматического подбора), которые анализируют резюме и определяют процент его соответствия вакансии.

Что делать, чтобы повысить шансы?

1️⃣ Добавить ключевые навыки в резюме — и в основной текст, и в теги. Возьмите их с easyoffer.ru

2️⃣ Убрать нерелевантный опыт, оставить только подходящий.

3️⃣ Оформить опыт так, чтобы он выглядел релевантным. Если у вас его нет, укажите проекты, стажировки или другой опыт, который можно представить как работу от 1 года. Если опыт слишком большой, сузьте его до 6 лет.

4️⃣ Откликаться на все вакансии без разбору. Если вы Junior, не ищите только стажер или Junior-вакансии — пробуйте везде. Не отказывайте себе сами, пусть это решит HR

5️⃣ Сделать резюме публичным, потому что HR-менеджеры часто ищут кандидатов не только среди откликов, но и в базе резюме.

6️⃣ Используйте ИИ по минимуму – ATS-системы считывают это и помечают "сгенерировано ИИ"

‼️ Главное правило: чем больше откликов — тем выше шанс получить оффер. Делайте резюме удобным для ATS-систем, и вас заметят.

1. Посмотрите видео о том как я вывел свою резюме в Топ1 на HH
2. Посмотрите видео как я нашел первую работу
3. Прочитайте этот кейс про оптимизацию резюме

Если прям вообще тяжело.

Создайте несколько разных резюме. Создайте 2, 3 да хоть 10 резюме. Настройте авто-отлики и ждите приглашения на собесы.

Не нужно создавать иллюзию поиска работы, сделайте несколько простых и актуальных действий.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔 Какой метод часто применяют для обработки категориальных данных?
Anonymous Quiz
88%
One-hot encoding
6%
K-means
1%
PCA
5%
Логистическая регрессия