Start Career in DS
11.9K subscribers
93 photos
1 video
10 files
317 links
Тут публикуются материалы для прокачки скиллов в DS и подготовки к собеседованиям.

Пишем про технические тулзы, визуализацию данных, бизнесовые задачи, разбираем ML-алгоритмы и обсуждаем смежные темы :)

Автор: @RAVasiliev

№ 5141779667
Download Telegram
👨‍🎓 Симулятор ML1-курса в ВШЭ

От многих ребят слышал что-то вроде “Ну, у меня есть техническая база, но после ухода курсеры совсем не ясно какие курсы по машинке проходить”.
В моём представлении, один из лучших общедоступных курсов по введению в машинное обучение на русском языке - курс Жени Соколова, который читается на многих факультетах в вышке (я и сам его читал).
Казалось бы, один из лучших универов страны, офигеть какие усилия приложены к проработке лекций и семинаров, иии… Все материалы открыты и общедоступны! И лекции, и семинары, и домашки!
Каждый может взять и пройти курс целиком. Разве что, никто не будет проверять ваши работы (дз/проверочные/контрольные).

Вы можете (ссылки кликабельны!):
- смотреть записи лекций, семинаров
- самостоятельно прорабатывать конспекты занятий
- параллельно с записями разбирать семинары
- делать домашки на интерес
- ловить шуточки и жизненные истории в записях лекций Жени!

P.S. Зацените количетсво звёздочек у репозитория курса. И накидайте ещё :))
👍99🔥26🤩31
🐍 Регулярные выражения в Python. Лучшая статья на русском!

Регулярные выражения супер-полезны, когда вам нужно перелопатить большой объём текстовых данных.
Например, вытащить из наименований товаров граммаж, достать города из адресов и т.д.
При этом на русском материалы по этой теме очень сложно найти.

Вот эта статья на хабре - лучшее что я видел 🙂
Регулярные выражения в Python от простого к сложному. Подробности, примеры, картинки, упражнения
👍38🔥9🤩3
​​🦖 Какова вероятность того, что гуляя по улице, вы встретите динозавра?

Ответить на этот вопрос поможет клёвая статья на тему теории вероятностей. Как удачно подметил её автор: «Если непонимание алгебры или математического анализа может мало влиять на вашу жизнь, то непонимание теории вероятностей делает из вас лёгкую мишень для обмана и манипулирования». К тому же, вопросы по ней могут встретиться вам на собеседовании 🙂

Время прочтения ~17 минут, за них вам расскажут:
- О базовых формулах, и о том, откуда они взялись
- О том, что такое условная вероятность
- Что понимается под «независимыми событиями»
- Несколько парадоксов (парадокс Монти-Холла, парадокс мальчика и девочки, парадокс Спящей Красавицы)

#тервер #статья
22👍10🔥7🤩3
​​🤔 Как стать дата-шрушером aka вкатиться в DS?

Филипп написал подробную статью о том, как можно «вкатиться в DS». Вот несколько сценариев по «вкатыванию» оттуда:

Сценарий 1. «Тааак, *****»
«Набираете минимум навыков и врываетесь на Дикий Запад. Дальше учитесь в процессе.Когда я стажировался в Диком Сбере, я своими глазами видел, как чуваки, которые до этого работали в кнопочной системе, приходят на работу и ботают на ней питон.»

Сценарий 2. «Экспресс-курс»
«Этот сценарий более систематичен. От первого он отличается тем, что вы набираете побольше компетенций перед тем, как вломиться в DS-мир. Именно по такому сценарию обычно строятся все курсы переподготовки для взрослых.»

Сценарий 3. «Доскональный aka студенческий»
«Если вы студент младших курсов, делайте акцент на математике и проге. Не бегите впереди паровоза. До нейронок добежать ещё успеете. У вас есть куча времени, чтобы досконально разобраться в математике. Поверьте на слово, это очень полезно. Пока ботаете, можете смотреть на вступительный в ШАД и тайно грезить о нём.»

Подробнее об этих и ещё 6-ти сценариях почитать можно тут: https://vas3k.club/post/9904/
🔥29👍102
​​🏃 Вы когда-нибудь задумывались о том, как на ваш заказ в сервисах доставки еды назначаются курьеры?

Задача: увеличить оборачиваемость - среднее число заказов, которые курьер успевает доставить за час.

Вот как это делали ребята из Яндекс.Еды - время чтения ~7 минут:
автор статьи расскажет, как они с командой уменьшали время бесполезного ожидания курьеров

— А вот как с этой задачей справились ребята из Delivery Club - время чтения ~8 минут: статья о том, как они улучшали скоринг курьеров

Статья на похожую тему - время чтения ~11 минут:
как в Delivery Club прогнозируют время для курьеров, ресторанов и клиентов

#логистика
🔥17🎉4👍2🤩2
🚕 Технологии Яндекс.Такси

Мы когда-то делали пост с обзором алгоритмов, которые используются под капотом. Буквально час назад вышло очень классное видео от ребят из Яндекса, в котором они достаточно подробно рассказывают про прайсинг и не только 🙂
Если вам всегда было интересно узнать почему цены именно такие и что же это за повышенный спрос - вам сюда!

Понакидайте огонёчков, видео того заслуживает 🔥

https://youtu.be/IeFvaGmoHZs
🔥383🤩3
​​🤔 Стандартная выдача OLS - рай для статистиков, ад для фит-предиктеров

В видосе про линейную регрессию мы говорили про то, что существуют два самых часто-используемых инструмента для работы с линейной регрессией: sklearn и statsmodels.

При этом у statsmodels есть подробная статистическая справка по значимости коэффициентов, модели, распределению остатков и т.д.
Читать её, если у вас не было курса по статистике (а еще лучше - стат. моделированию), очень сложно.

Вот в этой статье подробно описаны все пункты выдачи OLS, в частности:

— Как проверить значимость коэффициентов регрессии
— Что такое коэффициент детерминации R-squared и как с ним правильно работать
— Как быстро делать анализ остатков модели
…и как в целом правильно читать выдачу OLS

https://habr.com/ru/post/690414/
27🔥9👍5
📃 Правила написания резюме

Решил написать для вас несколько полезных практик, которые позволят сделать ваше резюме более привлекательным для работодателей. Основаны на моём опыте + общении кучей руководителей/эйчаров 🙂

1. Нет шаблонам с hh. Шаблон с hh универсален, но в случае с аналитическими профессиями он сильно раздут. Да и многие уже напрямую триггерятся со стандартных резюме оттуда
2. Не раздувать объём. Лучше - страница. Нужно понимать, что проверяющие ваше резюме - тоже люди. И если у вас там будет сочинение на 3 страницы, вряд ли кто-то его будет проверять. Нужно писать коротко и по делу
3. Явно пишите на кого идете. Junior/Middle DA/DS/DE. Это упрощает жизнь рекрутеру. Если хотите собеседоваться на несколько ролей (DS/DE) - лучше писать разные cv. И делать акценты на разных блоках
4. Структура очень важна. Хорошее резюме состоит из примерно таких основных блоков: шапка, опыт работы, навыки, образование, достижения. Порядок и пропорции блоков могут варьироваться в зависимости от опыта
5. Нужны ключевые слова для hr. Первый кто видит ваше резюме - рекрутер. Они такие резюме перебирают сотнями, поэтому лучше сразу дать ключевые слова, за которые можно зацепиться (sql/python/pyspark/…). Рекрутера обычно просят искать людей с конкретными навыками, явно указывая их, вы порой сильно увеличиваете свои шансы на этапе скриннинга
6. Конкретные проекты и навыки. Очень хорошим тоном является явно указывать вашу роль при решении задач и эффекты от тех проектов, которые вы реализовывали. При этом важно понимать, что в некоторых компаниях вас будут спрашивать по навыкам и проектам из cv. Умейте рассказать про каждый из пунктов. Не пишите лишнее. Ну и конечно же, врать в резюме не стоит - вас быстро раскусят.
7. Про выступления/статьи - лучше прикладывать гиперссылки. Если вы пишите что где-то публиковались - лучше явно укажите где и с какой статьёй.

Как думаете, может быть стоит устроить анонимный разбор CV? Ставьте 👍 если оно будет полезно!
👍923🔥2
​​​​​​🐍 6 лучших бесплатных курсов для изучения Python

1. Курсы на Stepik от Института биоинформатики:
Программирование на Python - для тех, кто ни разу не программировал
Python: основы и применение - для тех, кто уже имеет небольшой опыт программирования
2. py.CheckiO - игра с множеством различных задачек на питоне и качественными примерами их решений
3. Поколение Python - курс для школьников и всех желающих познакомиться с программированием. Лучший бесплатный курс 2020 года на степике (!)
4. Основы Python от Академии Яндекса - от стандартного ввода-вывода до библиотек для анализа данных.
5. Видеоуроки Python для анализа данных - тут и базовый Python, и NumPy, и Pandas - подойдет как новичкам, так и более опытным.

Жмите 🔥, это очень мотивирует!
🔥934🤩3
Что спрашивать у интервьюеров прежде чем принмиать оффер?

Перед принятием оффера обязательно нужно уточнить про доступность и адекватность данных, возможности роста. Кроме того, в DS есть ещё ряд специфичных вопросов, ответив на которые вы можете сильно упростить себе дальнейшую жизнь.
У Жени есть клёвый пост на эту тему

А еще есть у Жени есть канал про с Нескучными позициями в Data Science: @not_boring_ds_jobs
👍20🔥51
📈 Метрики и функции потерь в линейной регрессии: как выбрать лучшую модель?

Метрики - это инструменты для оценки качества моделей машинного обучения. Они наглядно показывают человеку, насколько хорошо модель предсказывает результаты, что позволяет выявить возможные проблемы.

Функции потерь - это способы измерения ошибки между предсказанными значениями и истинными значениями. Они помогают модели обучаться и адаптироваться к данным.

В прикрепленных фото вы найдете формулы, плюсы и минусы основных метрик и функций потерь в линейной регрессии.

В ближайшее время на нашем ютуб-канале выйдет мини-лекция про метрики и функции потерь – поэтому подписывайтесь и жмите колокольчик, чтобы не пропустить видео 🙂

Ставьте лайки на этот пост, чтобы ролик вышел быстрее) 👍
👍83🔥107
​​🤔 Как стать аналитиком?

У Тагира, который работает senior аналитиком в Альфе, есть целая серия постов это. Всего там 5 частей:
Часть 1: Почему люди хотят стать аналитиками, и признаки того, что аналитика – это твоё.
Часть 2: Тут подробно разбираются основные типы аналитиков: чем они занимаются и какие навыки для этого нужны.
Часть 3: Какими будут ваши первые шаги в аналитике и варианты обучения на аналитика в зависимости от вашего бэкграунда.
Часть 4: Ресурсы, где можно получить или подтянуть навыки для работы аналитиком - Python, A/B тестирование, SQL и т.д.
Часть 5: Лучшие школы и курсы для аналитиков.

А ещё у него на канале очень много другой полезной информации, советуем глянуть
👍19🔥104
Start Career in DS
📈 Метрики и функции потерь в линейной регрессии: как выбрать лучшую модель? — Метрики - это инструменты для оценки качества моделей машинного обучения. Они наглядно показывают человеку, насколько хорошо модель предсказывает результаты, что позволяет выявить…
📹 Видео про функционалы потерь и метрики регрессии!

Мы строили-строили и наконец построили! Долго собирались сделать видео про основные ФП и метрики - и наконец выпустили 🙂

Накидайте комментарии, задавайте вопросы и ставьте лайки!
Если хотите больше подобных видео - пишите какие темы были бы наиболее интересны

https://youtu.be/EyxcTnHl1wk
🔥27👍63