Start Career in DS
11.9K subscribers
93 photos
1 video
10 files
317 links
Тут публикуются материалы для прокачки скиллов в DS и подготовки к собеседованиям.

Пишем про технические тулзы, визуализацию данных, бизнесовые задачи, разбираем ML-алгоритмы и обсуждаем смежные темы :)

Автор: @RAVasiliev

№ 5141779667
Download Telegram
🚕 Технологии Яндекс.Такси

Мы когда-то делали пост с обзором алгоритмов, которые используются под капотом. Буквально час назад вышло очень классное видео от ребят из Яндекса, в котором они достаточно подробно рассказывают про прайсинг и не только 🙂
Если вам всегда было интересно узнать почему цены именно такие и что же это за повышенный спрос - вам сюда!

Понакидайте огонёчков, видео того заслуживает 🔥

https://youtu.be/IeFvaGmoHZs
🔥383🤩3
​​🤔 Стандартная выдача OLS - рай для статистиков, ад для фит-предиктеров

В видосе про линейную регрессию мы говорили про то, что существуют два самых часто-используемых инструмента для работы с линейной регрессией: sklearn и statsmodels.

При этом у statsmodels есть подробная статистическая справка по значимости коэффициентов, модели, распределению остатков и т.д.
Читать её, если у вас не было курса по статистике (а еще лучше - стат. моделированию), очень сложно.

Вот в этой статье подробно описаны все пункты выдачи OLS, в частности:

— Как проверить значимость коэффициентов регрессии
— Что такое коэффициент детерминации R-squared и как с ним правильно работать
— Как быстро делать анализ остатков модели
…и как в целом правильно читать выдачу OLS

https://habr.com/ru/post/690414/
27🔥9👍5
📃 Правила написания резюме

Решил написать для вас несколько полезных практик, которые позволят сделать ваше резюме более привлекательным для работодателей. Основаны на моём опыте + общении кучей руководителей/эйчаров 🙂

1. Нет шаблонам с hh. Шаблон с hh универсален, но в случае с аналитическими профессиями он сильно раздут. Да и многие уже напрямую триггерятся со стандартных резюме оттуда
2. Не раздувать объём. Лучше - страница. Нужно понимать, что проверяющие ваше резюме - тоже люди. И если у вас там будет сочинение на 3 страницы, вряд ли кто-то его будет проверять. Нужно писать коротко и по делу
3. Явно пишите на кого идете. Junior/Middle DA/DS/DE. Это упрощает жизнь рекрутеру. Если хотите собеседоваться на несколько ролей (DS/DE) - лучше писать разные cv. И делать акценты на разных блоках
4. Структура очень важна. Хорошее резюме состоит из примерно таких основных блоков: шапка, опыт работы, навыки, образование, достижения. Порядок и пропорции блоков могут варьироваться в зависимости от опыта
5. Нужны ключевые слова для hr. Первый кто видит ваше резюме - рекрутер. Они такие резюме перебирают сотнями, поэтому лучше сразу дать ключевые слова, за которые можно зацепиться (sql/python/pyspark/…). Рекрутера обычно просят искать людей с конкретными навыками, явно указывая их, вы порой сильно увеличиваете свои шансы на этапе скриннинга
6. Конкретные проекты и навыки. Очень хорошим тоном является явно указывать вашу роль при решении задач и эффекты от тех проектов, которые вы реализовывали. При этом важно понимать, что в некоторых компаниях вас будут спрашивать по навыкам и проектам из cv. Умейте рассказать про каждый из пунктов. Не пишите лишнее. Ну и конечно же, врать в резюме не стоит - вас быстро раскусят.
7. Про выступления/статьи - лучше прикладывать гиперссылки. Если вы пишите что где-то публиковались - лучше явно укажите где и с какой статьёй.

Как думаете, может быть стоит устроить анонимный разбор CV? Ставьте 👍 если оно будет полезно!
👍923🔥2
​​​​​​🐍 6 лучших бесплатных курсов для изучения Python

1. Курсы на Stepik от Института биоинформатики:
Программирование на Python - для тех, кто ни разу не программировал
Python: основы и применение - для тех, кто уже имеет небольшой опыт программирования
2. py.CheckiO - игра с множеством различных задачек на питоне и качественными примерами их решений
3. Поколение Python - курс для школьников и всех желающих познакомиться с программированием. Лучший бесплатный курс 2020 года на степике (!)
4. Основы Python от Академии Яндекса - от стандартного ввода-вывода до библиотек для анализа данных.
5. Видеоуроки Python для анализа данных - тут и базовый Python, и NumPy, и Pandas - подойдет как новичкам, так и более опытным.

Жмите 🔥, это очень мотивирует!
🔥934🤩3
Что спрашивать у интервьюеров прежде чем принмиать оффер?

Перед принятием оффера обязательно нужно уточнить про доступность и адекватность данных, возможности роста. Кроме того, в DS есть ещё ряд специфичных вопросов, ответив на которые вы можете сильно упростить себе дальнейшую жизнь.
У Жени есть клёвый пост на эту тему

А еще есть у Жени есть канал про с Нескучными позициями в Data Science: @not_boring_ds_jobs
👍20🔥51
📈 Метрики и функции потерь в линейной регрессии: как выбрать лучшую модель?

Метрики - это инструменты для оценки качества моделей машинного обучения. Они наглядно показывают человеку, насколько хорошо модель предсказывает результаты, что позволяет выявить возможные проблемы.

Функции потерь - это способы измерения ошибки между предсказанными значениями и истинными значениями. Они помогают модели обучаться и адаптироваться к данным.

В прикрепленных фото вы найдете формулы, плюсы и минусы основных метрик и функций потерь в линейной регрессии.

В ближайшее время на нашем ютуб-канале выйдет мини-лекция про метрики и функции потерь – поэтому подписывайтесь и жмите колокольчик, чтобы не пропустить видео 🙂

Ставьте лайки на этот пост, чтобы ролик вышел быстрее) 👍
👍83🔥107
​​🤔 Как стать аналитиком?

У Тагира, который работает senior аналитиком в Альфе, есть целая серия постов это. Всего там 5 частей:
Часть 1: Почему люди хотят стать аналитиками, и признаки того, что аналитика – это твоё.
Часть 2: Тут подробно разбираются основные типы аналитиков: чем они занимаются и какие навыки для этого нужны.
Часть 3: Какими будут ваши первые шаги в аналитике и варианты обучения на аналитика в зависимости от вашего бэкграунда.
Часть 4: Ресурсы, где можно получить или подтянуть навыки для работы аналитиком - Python, A/B тестирование, SQL и т.д.
Часть 5: Лучшие школы и курсы для аналитиков.

А ещё у него на канале очень много другой полезной информации, советуем глянуть
👍19🔥104
Start Career in DS
📈 Метрики и функции потерь в линейной регрессии: как выбрать лучшую модель? — Метрики - это инструменты для оценки качества моделей машинного обучения. Они наглядно показывают человеку, насколько хорошо модель предсказывает результаты, что позволяет выявить…
📹 Видео про функционалы потерь и метрики регрессии!

Мы строили-строили и наконец построили! Долго собирались сделать видео про основные ФП и метрики - и наконец выпустили 🙂

Накидайте комментарии, задавайте вопросы и ставьте лайки!
Если хотите больше подобных видео - пишите какие темы были бы наиболее интересны

https://youtu.be/EyxcTnHl1wk
🔥27👍63
🐢 Первый пост про ChatGPT на этом канале

Пока в комментариях других каналов на тему DS люди ругаются, что они слишком часто делают посты про ChatGPT, мы решили сделать небольшое саммари про нашумевшую нейросеть для тех, кто «в танке»
ChatGPT - это чат-бот с искусственным интеллектом, который поможет вам написать код, сгенерировать идеи, сделать доклад и даже дипломную работу - это лишь малая часть его возможностей.
Пользоваться ChatGPT можно как через официальный сайт, так и через тг ботов.

Мы подготовили для вас краткую инструкцию по регистрации на официальном сайте

Если возиться с регистрацией не хочется - можно использовать тг боты, которые подключены к ChatGPT: например, этот. Но функционал у таких ботов, конечно, поменьше.
После того, как вы зарегистрировались в ChatGPT, можете получить свой API ключ, благодаря которому открываются новые возможности. Например, вы сможете использовать бота в гугл-таблицах. Подробнее об этом можно почитать тут.

Рассказывать про ChatGPT можно долго. Если хотите постов такого рода – ставьте 👍, а если посты про ChatGPT уже надоели и хочется чего-то другого – ставьте 🤩
👍47🤩28🔥93
🥳 Парадокс дней рождения

Часто говорят, что для работы в аналитике данных нужна математическая интуиция. Один из способов её развить - рассуждать над задачками из повседневной жизни. Парадокс дней рождений - одна из таких задач.

Представьте, что вы и еще 22 человека находитесь в одной комнате. Какова вероятность, что хотя бы у двух человек из комнаты дни рождения приходятся на один и тот же день? А если в комнате находитесь вы и еще 49 человек?

Попробуйте посчитать эту вероятностью сами, а потом обязательно гляньте нашу статью о парадоксе дней рождения.

Если вас заинтересовал этот парадокс, можете посмотреть, как о нём рассказывает Алексей Савватеев

Ну и ставьте лайки, если вам заходят такие посты 👍

#тервер
👍37🔥62
✒️ Подборка задач с одного из дней карьеры в МИФИ
Как-то мы уже постили задачки со дня карьеры в МГУ, и, кажется, вам зашло. Поэтому вот подборка задачек на теорвер, матан, логику и т. п. от одной компании по управлению цифровыми рисками: за две правильно решённых задачки можно было получить их мерч 🙂

Пишите свои решения в комментариях и, если вам нравятся посты с задачками, ставьте огонёчки 🔥
#задачи
🔥46👍5
Мок-интервью - одна из самых мощный техник подготовки к собеседованиям. Это симулятор реального интервью, на котором вы оцениваете свои знания в максимально приближенных к реальным условиях.

Чтобы проверить интерес к теме, мы проведем конкурс: разыгрываем 4 мок-интервью с развёрнутым фидбэком для вас (укажем на сильные/слабые стороны, дадим советы по проработке навыков). Всё это будет бесплатно и полностью приватно 🙂

Проводить моки будет автор канала Start Career in DS Рома Васильев.

Коротко о Роме:
– Проводит собеседования в Яндексе, до этого делал это в DS командах Мегафона и Магнита
- Занимался наймом и развитием стажёров и более опытных специалистов
– Сейчас строит аналитику ассортимента в Яндекс.Лавке
– Закончил ВМК МГУ с красным дипломом

Условия розыгрыша:
1. Написать в комментариях самые интересные вопросы и задачи, которые вам встречались на собеседованиях. Если вы только начинаете свой путь - можете рассказать про вопросы, которые слышали от товарищей! Или просто про то, что часто спрашивают 🙂
2. Поставить на этот пост реакцию
3. Ну и, конечно, быть подписанным на этот канал)

13 мая мы объявим четырех победителей:
- Двоих выберем экспертно по самым интересным вопросам/задачам
- А ещё двоих выберем абсолютно случайно среди комментариев к этому посту

Учитываться будут только осмысленные комментарии (с вопросами)

По любым вопросам пишите сюда
Примеры моков в записи можно посмотреть тут

🍀 Удачи!
🔥74👍5🎉4🤩21