Start Career in DS
11.9K subscribers
93 photos
1 video
10 files
317 links
Тут публикуются материалы для прокачки скиллов в DS и подготовки к собеседованиям.

Пишем про технические тулзы, визуализацию данных, бизнесовые задачи, разбираем ML-алгоритмы и обсуждаем смежные темы :)

Автор: @RAVasiliev

№ 5141779667
Download Telegram
Умение работать с unix-подобными системами, а в частности с терминалом - штука очень полезная. Ловите клёвую подборку команд:
https://tproger.ru/articles/useful-linux-commands/?utm_medium=messenger&utm_source=telegram

P.S. Про некоторое (например, прогноз погоды в терминале) даже я не знал, хотя на линуксовых системах достатончо давно)
Книжка выглядит прям супер-годной. Поделюсь тут со ссылкой на блог Александра Дьяконова, там можно найти много интересностей :)
Полезная шпаркалка по Encoding'у категориальных фичей:

+хорошая статья [ENG]: https://towardsdatascience.com/all-about-categorical-variable-encoding-305f3361fd02
2
«Как проходит собес на DS? Про что обычно спрашивают? В каком порядке?»
Такие вопросы часто появляются у тех, кто готовится к интервью.
Нашёл несколько примеров, которые в той или иной степени описывают процесс собеседования и несут в себе много полезных инсайтов. #видео_собеседования
Одно из них:
https://youtu.be/svk9GmIMR3U
Статья "Feature Engineering, о чём молчат online-курсы"
Если просмотреть наискосок, то может показаться, что какая-то муть. Но часто придумать признаки для модели совсем не так просто.
Лично я например про метод "Отображения времени на круг" узнал относительно не так давно и он показался мне очень красивым 🙂
https://habr.com/ru/company/mailru/blog/346942/
Парадоксы статистики.
Часто от вас на собеседованиях хотят не нарешанных задачек, а именно понимания статистики. Его можно достигнуть разными способами, но один из наиболее интересных на мой взгляд - научпоп.
Со мной поделились замечательным видео, которое несёт в себе целую кучу парадоксов статистики.
Разогрею ваш интерес тем, что про несколько из них (например, про интервалы времени между автобусами) спрашивали сразу нескольких моих знакомых на собеседованиях в Яндекс :)
#статистика
https://youtu.be/9NYtSfIlRB4
Где искать #вакансии в DS новичкам и не только?
0. Друзья/знакомые. Да-да, как бы банально не было. Если кто-то из вашего окружения работает в айти (не обязательно аналитике) - обязательно узнайте нет ли у них вакансий. Потому что часто бывает так, что при приводе новых ребят компании выплачивают бонусы тем, кто их приводит, так что это будет полезно и вам, и товарищу :)
1. LinkedIn. Если у вас есть хоть какой-то релевантный опыт (универские/учебные проекты, проекты на стажировке/работе) - описывайте его как можно подробнее. Про Линк даже был отдельный пост: https://t.me/start_ds/93
2. Канал #_jobs в ODS (если не знаете что это - читайте https://t.me/start_ds/44). Там свежие вакансии выкладываются постоянно + с жесткими требования (например, там обязательно должна быть указана вилка зп).
3. Каналы в tg. Их много, но я опишу те, на которые обращаю внимание сам.
Сначала узкие:
Вакансии МГУ, но кажется, что если вы из МИФИ/МГТУ/ВШЭ, вас тоже радостно рассмотрят: https://t.me/vacancyMSU
Вакансии Яндекса, часто проскальзывает аналитика: https://t.me/ya_jobs
Каналы и бот с кучей самых разных вакансий для аналитиков и DS-ов:
https://t.me/foranalysts
https://t.me/datasciencejobs
https://t.me/g_jobbot
https://t.me/datajob
https://t.me/sberlogajobs
4. Прости господи, hh. Я его ставлю на не самый высокий приоритет, но порой там и правда можно найти что-то годное.
5. Start career in DS, по мере появления мы тоже будем потихоньку публиковать вакансии :)

Если у вас есть какие-то свои секретные (и не очень) места поиска вакансий - пишите в комментариях!
В канале ещё не было материалов по #spark, хотя штука очень полезная и применяется широко в огромном количестве компаний.
Восполняем пробелы.
По ссылке ниже - куча примеров использования спарка. По ним удобно и знания освежить перед собесом, и что-то новое для себя узнать
https://sparkbyexamples.com/

P.S. Ссылка выше ведёт вас на оригинальный спарк (с кодом на Scala), если вы хотите начать с чего-то более близкого, вот аналогичная про pySpark: https://sparkbyexamples.com/pyspark-tutorial/
Forwarded from Инжиниринг Данных (Roman Ponomarev)
А вот и вебинар на подходе (2 сентября 2021 в 20:00 по мск)

Кого, чего:
Как подготовиться в первым собесам в DS и найти вакансии?
Вебинар проведёт Васильев Роман, Senior Data Scientist в компании Магнит. Роман когда-то руководил наймом и развитием стажёров DS-ов в российской телеком-компании, а сейчас развивает уже полноценную команду в одной из крупнейших ритейл-компаний РФ.

Вы услышите ответы на вопросы:
1. Что нужно изучить чтобы идти на первые собеседования?
2. Где искать вакансии новичкам в DS?
3. Как грамотно подготовить резюме?
4. Как выстроить подготовку, что повторить?
5. Чего ждать на собеседовании?
Даже если не собираетесь в DS, приходите, так как инфа будет полезная :)

Канал спикера: https://t.me/start_ds

Ссылка на вебинар:
https://youtu.be/SKItc7yHnVY
Инжиниринг Данных
А вот и вебинар на подходе (2 сентября 2021 в 20:00 по мск) Кого, чего: Как подготовиться в первым собесам в DS и найти вакансии? Вебинар проведёт Васильев Роман, Senior Data Scientist в компании Магнит. Роман когда-то руководил наймом и развитием стажёров…
Напоминаю про сегодняшний вебинар 🙂
Буду рад рассказать полезные штуки и поотвечать на вопросы онлайн!

Бонусом для пришедших будет инсайдерская информация по крутой образовательно-практической программе (в виде стажировки) в крупной российской компании 🙂
Более расширенная шпаргалка по #pandas
Очень рекомендую быстренько пробежаться, понять что там есть. И в случае необходимости - быстро вернуться к ней