«Что делать в ситуациях дисбаланса классов?» - популярный вопрос на собеседованиях всех уровней.
Статья Александра Дьяконова отвечает на этот вопрос:
https://dyakonov.org/2021/05/27/imbalance/
Статья Александра Дьяконова отвечает на этот вопрос:
https://dyakonov.org/2021/05/27/imbalance/
Анализ малых данных
Дисбаланс классов
Рассмотрим ситуацию несбалансированных классов – что нужно уточнить при выработке стратегии решения задачи классификации, какие стратегии бывают, как отвечать на вопрос про дисбаланс на собеседован…
Статья "Feature Engineering, о чём молчат online-курсы"
Если просмотреть наискосок, то может показаться, что какая-то муть. Но часто придумать признаки для модели совсем не так просто.
Лично я например про метод "Отображения времени на круг" узнал относительно не так давно и он показался мне очень красивым 🙂
https://habr.com/ru/company/mailru/blog/346942/
Если просмотреть наискосок, то может показаться, что какая-то муть. Но часто придумать признаки для модели совсем не так просто.
Лично я например про метод "Отображения времени на круг" узнал относительно не так давно и он показался мне очень красивым 🙂
https://habr.com/ru/company/mailru/blog/346942/
Хабр
Feature Engineering, о чём молчат online-курсы
Sherlock by ThatsWhatSheSayd Чтобы стать великим сыщиком, Шерлоку Холмсу было достаточно замечать то, чего не видели остальные, в вещах, которые находились у вс...
Парадоксы статистики.
Часто от вас на собеседованиях хотят не нарешанных задачек, а именно понимания статистики. Его можно достигнуть разными способами, но один из наиболее интересных на мой взгляд - научпоп.
Со мной поделились замечательным видео, которое несёт в себе целую кучу парадоксов статистики.
Разогрею ваш интерес тем, что про несколько из них (например, про интервалы времени между автобусами) спрашивали сразу нескольких моих знакомых на собеседованиях в Яндекс :)
#статистика
https://youtu.be/9NYtSfIlRB4
Часто от вас на собеседованиях хотят не нарешанных задачек, а именно понимания статистики. Его можно достигнуть разными способами, но один из наиболее интересных на мой взгляд - научпоп.
Со мной поделились замечательным видео, которое несёт в себе целую кучу парадоксов статистики.
Разогрею ваш интерес тем, что про несколько из них (например, про интервалы времени между автобусами) спрашивали сразу нескольких моих знакомых на собеседованиях в Яндекс :)
#статистика
https://youtu.be/9NYtSfIlRB4
YouTube
Как статистика обманывает нас?
Все технологии и функции безопасности в Яндекс.Такси: https://ya.cc/847tg
Вокруг нас столько информации, что когда мы ее анализируем, совершаем очень много ошибок. Все потому-что мы не знаем законов статистики и теории вероятностей. В этом выпуске мы обсудим…
Вокруг нас столько информации, что когда мы ее анализируем, совершаем очень много ошибок. Все потому-что мы не знаем законов статистики и теории вероятностей. В этом выпуске мы обсудим…
Где искать #вакансии в DS новичкам и не только?
0. Друзья/знакомые. Да-да, как бы банально не было. Если кто-то из вашего окружения работает в айти (не обязательно аналитике) - обязательно узнайте нет ли у них вакансий. Потому что часто бывает так, что при приводе новых ребят компании выплачивают бонусы тем, кто их приводит, так что это будет полезно и вам, и товарищу :)
1. LinkedIn. Если у вас есть хоть какой-то релевантный опыт (универские/учебные проекты, проекты на стажировке/работе) - описывайте его как можно подробнее. Про Линк даже был отдельный пост: https://t.me/start_ds/93
2. Канал #_jobs в ODS (если не знаете что это - читайте https://t.me/start_ds/44). Там свежие вакансии выкладываются постоянно + с жесткими требования (например, там обязательно должна быть указана вилка зп).
3. Каналы в tg. Их много, но я опишу те, на которые обращаю внимание сам.
Сначала узкие:
Вакансии МГУ, но кажется, что если вы из МИФИ/МГТУ/ВШЭ, вас тоже радостно рассмотрят: https://t.me/vacancyMSU
Вакансии Яндекса, часто проскальзывает аналитика: https://t.me/ya_jobs
Каналы и бот с кучей самых разных вакансий для аналитиков и DS-ов:
https://t.me/foranalysts
https://t.me/datasciencejobs
https://t.me/g_jobbot
https://t.me/datajob
https://t.me/sberlogajobs
4. Прости господи, hh. Я его ставлю на не самый высокий приоритет, но порой там и правда можно найти что-то годное.
5. Start career in DS, по мере появления мы тоже будем потихоньку публиковать вакансии :)
Если у вас есть какие-то свои секретные (и не очень) места поиска вакансий - пишите в комментариях!
0. Друзья/знакомые. Да-да, как бы банально не было. Если кто-то из вашего окружения работает в айти (не обязательно аналитике) - обязательно узнайте нет ли у них вакансий. Потому что часто бывает так, что при приводе новых ребят компании выплачивают бонусы тем, кто их приводит, так что это будет полезно и вам, и товарищу :)
1. LinkedIn. Если у вас есть хоть какой-то релевантный опыт (универские/учебные проекты, проекты на стажировке/работе) - описывайте его как можно подробнее. Про Линк даже был отдельный пост: https://t.me/start_ds/93
2. Канал #_jobs в ODS (если не знаете что это - читайте https://t.me/start_ds/44). Там свежие вакансии выкладываются постоянно + с жесткими требования (например, там обязательно должна быть указана вилка зп).
3. Каналы в tg. Их много, но я опишу те, на которые обращаю внимание сам.
Сначала узкие:
Вакансии МГУ, но кажется, что если вы из МИФИ/МГТУ/ВШЭ, вас тоже радостно рассмотрят: https://t.me/vacancyMSU
Вакансии Яндекса, часто проскальзывает аналитика: https://t.me/ya_jobs
Каналы и бот с кучей самых разных вакансий для аналитиков и DS-ов:
https://t.me/foranalysts
https://t.me/datasciencejobs
https://t.me/g_jobbot
https://t.me/datajob
https://t.me/sberlogajobs
4. Прости господи, hh. Я его ставлю на не самый высокий приоритет, но порой там и правда можно найти что-то годное.
5. Start career in DS, по мере появления мы тоже будем потихоньку публиковать вакансии :)
Если у вас есть какие-то свои секретные (и не очень) места поиска вакансий - пишите в комментариях!
Telegram
Start Career in DS
Если hh - так себе, то что делать? Где рассказать о своих успехах и выложить резюме?
По моему опыту, LinkedIn - очень хороший инструмент. Для тех кто не знает - это своего рода Facebook, только для поиска вакансий/сотрудников/деловых контактов. Пару лет…
По моему опыту, LinkedIn - очень хороший инструмент. Для тех кто не знает - это своего рода Facebook, только для поиска вакансий/сотрудников/деловых контактов. Пару лет…
Start Career in DS
Где искать #вакансии в DS новичкам и не только? 0. Друзья/знакомые. Да-да, как бы банально не было. Если кто-то из вашего окружения работает в айти (не обязательно аналитике) - обязательно узнайте нет ли у них вакансий. Потому что часто бывает так, что при…
#вакансии #стажировки
Нашёл тут на просторах интернета агрегатор стажировок различных компаний:
https://github.com/MrHakimov/russian-internships
Нашёл тут на просторах интернета агрегатор стажировок различных компаний:
https://github.com/MrHakimov/russian-internships
GitHub
GitHub - mrhakimov/russian-internships: IT internships in Russia 🇷🇺
IT internships in Russia 🇷🇺. Contribute to mrhakimov/russian-internships development by creating an account on GitHub.
В канале ещё не было материалов по #spark, хотя штука очень полезная и применяется широко в огромном количестве компаний.
Восполняем пробелы.
По ссылке ниже - куча примеров использования спарка. По ним удобно и знания освежить перед собесом, и что-то новое для себя узнать
https://sparkbyexamples.com/
P.S. Ссылка выше ведёт вас на оригинальный спарк (с кодом на Scala), если вы хотите начать с чего-то более близкого, вот аналогичная про pySpark: https://sparkbyexamples.com/pyspark-tutorial/
Восполняем пробелы.
По ссылке ниже - куча примеров использования спарка. По ним удобно и знания освежить перед собесом, и что-то новое для себя узнать
https://sparkbyexamples.com/
P.S. Ссылка выше ведёт вас на оригинальный спарк (с кодом на Scala), если вы хотите начать с чего-то более близкого, вот аналогичная про pySpark: https://sparkbyexamples.com/pyspark-tutorial/
Spark By {Examples}
Apache Spark Tutorial with Examples - Spark By {Examples}
Apache Spark Tutorial - Apache Spark is an Open source analytical processing engine for large-scale powerful distributed data processing applications.
Forwarded from Инжиниринг Данных (Roman Ponomarev)
А вот и вебинар на подходе (2 сентября 2021 в 20:00 по мск)
Кого, чего:
Как подготовиться в первым собесам в DS и найти вакансии?
Вебинар проведёт Васильев Роман, Senior Data Scientist в компании Магнит. Роман когда-то руководил наймом и развитием стажёров DS-ов в российской телеком-компании, а сейчас развивает уже полноценную команду в одной из крупнейших ритейл-компаний РФ.
Вы услышите ответы на вопросы:
1. Что нужно изучить чтобы идти на первые собеседования?
2. Где искать вакансии новичкам в DS?
3. Как грамотно подготовить резюме?
4. Как выстроить подготовку, что повторить?
5. Чего ждать на собеседовании?
Даже если не собираетесь в DS, приходите, так как инфа будет полезная :)
Канал спикера: https://t.me/start_ds
Ссылка на вебинар:
https://youtu.be/SKItc7yHnVY
Кого, чего:
Как подготовиться в первым собесам в DS и найти вакансии?
Вебинар проведёт Васильев Роман, Senior Data Scientist в компании Магнит. Роман когда-то руководил наймом и развитием стажёров DS-ов в российской телеком-компании, а сейчас развивает уже полноценную команду в одной из крупнейших ритейл-компаний РФ.
Вы услышите ответы на вопросы:
1. Что нужно изучить чтобы идти на первые собеседования?
2. Где искать вакансии новичкам в DS?
3. Как грамотно подготовить резюме?
4. Как выстроить подготовку, что повторить?
5. Чего ждать на собеседовании?
Даже если не собираетесь в DS, приходите, так как инфа будет полезная :)
Канал спикера: https://t.me/start_ds
Ссылка на вебинар:
https://youtu.be/SKItc7yHnVY
YouTube
Как подготовиться в первым собесам в DS и найти вакансии / Роман Васильев
Как подготовиться в первым собесам в DS и найти вакансии?
Вебинар проведёт Васильев Роман, Senior Data Scientist в компании Магнит. Роман когда-то руководил наймом и развитием стажёров DS-ов в российской телеком-компании, а сейчас развивает уже полноценную…
Вебинар проведёт Васильев Роман, Senior Data Scientist в компании Магнит. Роман когда-то руководил наймом и развитием стажёров DS-ов в российской телеком-компании, а сейчас развивает уже полноценную…
Start Career in DS
В канале ещё не было материалов по #spark, хотя штука очень полезная и применяется широко в огромном количестве компаний. Восполняем пробелы. По ссылке ниже - куча примеров использования спарка. По ним удобно и знания освежить перед собесом, и что-то новое…
#pyspark
Статья-переводчик с «пандасовского» на «пайспарковский» язык:
https://towardsdatascience.com/from-pandas-to-pyspark-fd3a908e55a0
Статья-переводчик с «пандасовского» на «пайспарковский» язык:
https://towardsdatascience.com/from-pandas-to-pyspark-fd3a908e55a0
Medium
From pandas to PySpark
Leveraging your pandas data manipulation skills to learn PySpark
Инжиниринг Данных
А вот и вебинар на подходе (2 сентября 2021 в 20:00 по мск) Кого, чего: Как подготовиться в первым собесам в DS и найти вакансии? Вебинар проведёт Васильев Роман, Senior Data Scientist в компании Магнит. Роман когда-то руководил наймом и развитием стажёров…
Напоминаю про сегодняшний вебинар 🙂
Буду рад рассказать полезные штуки и поотвечать на вопросы онлайн!
Бонусом для пришедших будет инсайдерская информация по крутой образовательно-практической программе (в виде стажировки) в крупной российской компании 🙂
Буду рад рассказать полезные штуки и поотвечать на вопросы онлайн!
Бонусом для пришедших будет инсайдерская информация по крутой образовательно-практической программе (в виде стажировки) в крупной российской компании 🙂
Более расширенная шпаргалка по #pandas
Очень рекомендую быстренько пробежаться, понять что там есть. И в случае необходимости - быстро вернуться к ней
Очень рекомендую быстренько пробежаться, понять что там есть. И в случае необходимости - быстро вернуться к ней
Судя по статистике, такие мини-справочники очень зашли 🙂
Вот аналогичный по основам #SQL :
Вот аналогичный по основам #SQL :
Теорема Байеса - одна из основ машинного обучения, на которой держится множество алгоритмов. Вот видео, с которым вы раз и навсегда разберетесь что это и как её правильно интерпретировать: https://youtu.be/_bcAK_1a72k
YouTube
Теорема Байеса [3Blue1Brown]
Смотреть видео в оригинале: https://youtu.be/HZGCoVF3YvM
Поддержать выход переводов: https://vertdider.tv/to-support-us/
Теорема Байеса — одна из основных в теории вероятностей. Она имеет довольно широкую область применения, в частности, помогает учёным…
Поддержать выход переводов: https://vertdider.tv/to-support-us/
Теорема Байеса — одна из основных в теории вероятностей. Она имеет довольно широкую область применения, в частности, помогает учёным…
Математика для Data Science.
Хорошая подборка книг и курсов, по которым можно изучить ключевые разделы:
https://habr.com/ru/company/plarium/blog/442772/
Хорошая подборка книг и курсов, по которым можно изучить ключевые разделы:
https://habr.com/ru/company/plarium/blog/442772/
Хабр
Математика для Data Scientist: необходимые разделы
Математика — это краеугольный камень Data Science. Хотя некоторые теоремы, аксиомы и формулы кажутся слишком абстрактными и далекими от практики, на самом деле без них невозможно по-настоящему глубоко...
Друзья из МегаФона делают просто топовый подкаст, в котором берут интервью у звёзд индустрии. Послушать очень интересно, советую. Скоро выйдет выпуск с Александром Дьяконовым - я слушал в лайве, там много инсайтов для начинающих карьеру
Чат в tg: https://t.me/bigdatapeople
Подкаст на Я.Музыке: https://music.yandex.ru/album/18194079
Подкаст в Apple Podcasts: https://apple.co/2VSpOoU
Чат в tg: https://t.me/bigdatapeople
Подкаст на Я.Музыке: https://music.yandex.ru/album/18194079
Подкаст в Apple Podcasts: https://apple.co/2VSpOoU
Telegram
Данные люди
💬 Чат подкаста про данные и людей, которые с ними работают.
Здесь в прямом эфире проводим войс-чаты с интересными людьми из DS-сообщества, а потом — публикуем в качестве выпусков подкаста.
Ведущие @ivan_gor_w и @artglazunov
Здесь в прямом эфире проводим войс-чаты с интересными людьми из DS-сообщества, а потом — публикуем в качестве выпусков подкаста.
Ведущие @ivan_gor_w и @artglazunov
#тестовые задания
Меня на одном из вебинаров спрашивали относительно тестовых. Нашёл целый клад из них:
https://github.com/slgero/testovoe
Меня на одном из вебинаров спрашивали относительно тестовых. Нашёл целый клад из них:
https://github.com/slgero/testovoe
GitHub
GitHub - slgero/testovoe: Home assignments for data science positions
Home assignments for data science positions. Contribute to slgero/testovoe development by creating an account on GitHub.
🔥2
Как рассказать про ту или иную тему на собеседовании? Какие вопросы могут задать?
Запускаю цикл видео, которые ответят на эти и многие другие вопросы.
https://youtu.be/MM4onsNaLlI
P.S. На первый выпуск ушло прям очень много сил и времени, огромнейшее спасибо всем, кто в той или иной степени помогал 🙂
Запускаю цикл видео, которые ответят на эти и многие другие вопросы.
https://youtu.be/MM4onsNaLlI
P.S. На первый выпуск ушло прям очень много сил и времени, огромнейшее спасибо всем, кто в той или иной степени помогал 🙂
YouTube
Линейная регрессия. Что спросят на собеседовании? ч.1
0:00 - О чём видео, дисклеймер
0:39 - План видео
1:09 - Что такое линейная регрессия? Основные идеи и особенности алгоритма
2:57 - Нужно ли предобрабатывать признаки моя линейных моделей? Если да, то как?
4:57 - Что подразумевается под fit() и predict() в…
0:39 - План видео
1:09 - Что такое линейная регрессия? Основные идеи и особенности алгоритма
2:57 - Нужно ли предобрабатывать признаки моя линейных моделей? Если да, то как?
4:57 - Что подразумевается под fit() и predict() в…
👍3