#тестирование
Сейчас аналитика и Data Science очень часто идут бок-о-бок.
Поэтому на собеседованиях часто спрашивают о том, как работать с A/B тестами и порой даже просят писать код.
Вот эта статья из Академии Яндекса поможет вам чуточку лучше с этим разобраться:
https://academy.yandex.ru/posts/prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python?utm_source=smm&utm_medium=tg&utm_campaign=prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python
Сейчас аналитика и Data Science очень часто идут бок-о-бок.
Поэтому на собеседованиях часто спрашивают о том, как работать с A/B тестами и порой даже просят писать код.
Вот эта статья из Академии Яндекса поможет вам чуточку лучше с этим разобраться:
https://academy.yandex.ru/posts/prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python?utm_source=smm&utm_medium=tg&utm_campaign=prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python
Говоря о Data Science, очень сложно не упомянуть о крупнейшем в СНГ (думаю, уже и в Восточной Европе) сообществе - Open Data Science.
Оно представлено каналом в слаке, в котором публикуют целую кучу полезной информации - курсы, вакансии, предстоящие конференции. Кроме того, сообщество очень активное - там вполне можно задать свой вопрос и получить на него грамотный ответ.
Зарегестрироваться: https://ods.ai/
Приложил парочку своих скринов, чтобы вы примерно представляли о чём речь :)
Оно представлено каналом в слаке, в котором публикуют целую кучу полезной информации - курсы, вакансии, предстоящие конференции. Кроме того, сообщество очень активное - там вполне можно задать свой вопрос и получить на него грамотный ответ.
Зарегестрироваться: https://ods.ai/
Приложил парочку своих скринов, чтобы вы примерно представляли о чём речь :)
👍2
Позволю себе взять в канале @kupchanski пост, который здорово поможет при подготовке к собеседованиям в части #python
Некоторые вопросы из списка я реально встречал и задавал на собеседованиях, так что сохраняйте :)
Некоторые вопросы из списка я реально встречал и задавал на собеседованиях, так что сохраняйте :)
Forwarded from Data Science Guy
Неплохая статья, для оценки собственных навыков в python. Рекомендую пробежаться, освежить знания или узнать новое)
https://mcs.mail.ru/blog/spisok-voprosov-s-sobesedovaniy-python-dlya-data-sayentistov
https://mcs.mail.ru/blog/spisok-voprosov-s-sobesedovaniy-python-dlya-data-sayentistov
Конспект лекций Анатолия Карпова на тему #статистика в формате ноутбука.
В нём рассматриваются многие базовые термины с примерами в знакомом всем формате
https://nbviewer.jupyter.org/github/KlukvaMors/basic_stat/blob/main/%D0%BA%D0%BE%D0%BD%D1%81%D0%BF%D0%B5%D0%BA%D1%82.ipynb?flush_cache=true
В нём рассматриваются многие базовые термины с примерами в знакомом всем формате
https://nbviewer.jupyter.org/github/KlukvaMors/basic_stat/blob/main/%D0%BA%D0%BE%D0%BD%D1%81%D0%BF%D0%B5%D0%BA%D1%82.ipynb?flush_cache=true
Ещё один достойный список вопросов для подготовки к собеседованию, наткнулся на просторах интернета.
Он на английском, но возможно это будет кому-то и в плюс :)
Многие из вопросов действительно очень годные.
+ к практически всем есть ответы, по ним удобно готовиться
https://github.com/alexeygrigorev/data-science-interviews/blob/master/theory.md
Он на английском, но возможно это будет кому-то и в плюс :)
Многие из вопросов действительно очень годные.
+ к практически всем есть ответы, по ним удобно готовиться
https://github.com/alexeygrigorev/data-science-interviews/blob/master/theory.md
GitHub
data-science-interviews/theory.md at master · alexeygrigorev/data-science-interviews
Data science interview questions and answers. Contribute to alexeygrigorev/data-science-interviews development by creating an account on GitHub.
Ещё один хороший сборник вопросов с собеседований на тему #статистика.
Важно: лично мне кажется, что ответы на некоторые вопросы тут даны ну прям уж совсем краткие (та же стат. значимость). Так что советую перед собесом более подробно пробежаться по ним и покопаться в теме.
https://proglib.io/sh/q6rCD0Nca1
Важно: лично мне кажется, что ответы на некоторые вопросы тут даны ну прям уж совсем краткие (та же стат. значимость). Так что советую перед собесом более подробно пробежаться по ним и покопаться в теме.
https://proglib.io/sh/q6rCD0Nca1
Библиотека программиста
🎲 40 вопросов по статистике с собеседований на должность Data Scientist
40 популярных вопросов, которые задавали на собеседованиях соискателям на должность Data Scientist. Приведены также и ответы – c рисунками, формулами и ссылками для самостоятельного изучения.
На собеседованиях часто задают вопросы с используемыми в работе DS'a библиотеками.
В частности, про #numpy
Если хотите поупражняться, вот хороший репозиторий для этого:
https://github.com/rougier/numpy-100
Там 100 заданий самого разного уровня - над тремя звёздочками уверен, что многим придётся подумать :)
P.S. Для тех кто боится гита.
Можете просто тыкнуть зелёную кнопку Code, затем Download ZIP. Потом разахривируйте на своём компьютере и используйте файлики 100_Numpy_exercises.ipynb (сами задания), 100_Numpy_exercises_with_hints.md (задания с подсказками), 100_Numpy_exercises_with_hints_with_solutions.md (решения)
В частности, про #numpy
Если хотите поупражняться, вот хороший репозиторий для этого:
https://github.com/rougier/numpy-100
Там 100 заданий самого разного уровня - над тремя звёздочками уверен, что многим придётся подумать :)
P.S. Для тех кто боится гита.
Можете просто тыкнуть зелёную кнопку Code, затем Download ZIP. Потом разахривируйте на своём компьютере и используйте файлики 100_Numpy_exercises.ipynb (сами задания), 100_Numpy_exercises_with_hints.md (задания с подсказками), 100_Numpy_exercises_with_hints_with_solutions.md (решения)
GitHub
GitHub - rougier/numpy-100: 100 numpy exercises (with solutions)
100 numpy exercises (with solutions). Contribute to rougier/numpy-100 development by creating an account on GitHub.
#визуализация
Копаясь по работе с графиками, наткнулся на вот эту классную заметку: https://neptune.ai/blog/pandas-plot-deep-dive-into-plotting-directly-with-pandas
Честно признаюсь - сам долго не знал, что графики можно рисовать просто приписав .plot() к датафрейму в Pandas. В этой статьей есть куча примеров рисования разнообразных визуализаций с помощью этого
Копаясь по работе с графиками, наткнулся на вот эту классную заметку: https://neptune.ai/blog/pandas-plot-deep-dive-into-plotting-directly-with-pandas
Честно признаюсь - сам долго не знал, что графики можно рисовать просто приписав .plot() к датафрейму в Pandas. В этой статьей есть куча примеров рисования разнообразных визуализаций с помощью этого
neptune.ai
Pandas Plot: Deep Dive Into Plotting Directly With Pandas
Explore direct plotting with Pandas, from dataset imports to exploring various plot styles and essential Pandas plotting tools.
super-cheatsheet-machine-learning.pdf
1.3 MB
Наткнулся тут на просторах интернета на "Super VIP Cheatsheet: Machine Learning" от ребят из Stanford University.
Я бы описал его так: оочень краткий конспект некоторых основных тем в ML с самыми важными формулами и наглядными иллюстрациями.
Некоторые темы раскрыты прям круто: функции потерь, град. спуск, регрессии, обучение без учителя, метрики. А вот про деревянные модели рассказали как-то не очень подробно.
Кроме того, в конце есть блок "Refreshers", который покрывает, как мне кажется, очень большую часть базовой математической теории, которая используется в алгоритмах.
Для тех кто не любит большие книжки - там всего 16 страниц! Прям самое то на полистать и вспомнить формулы перед собеседованием.
#книжки
Я бы описал его так: оочень краткий конспект некоторых основных тем в ML с самыми важными формулами и наглядными иллюстрациями.
Некоторые темы раскрыты прям круто: функции потерь, град. спуск, регрессии, обучение без учителя, метрики. А вот про деревянные модели рассказали как-то не очень подробно.
Кроме того, в конце есть блок "Refreshers", который покрывает, как мне кажется, очень большую часть базовой математической теории, которая используется в алгоритмах.
Для тех кто не любит большие книжки - там всего 16 страниц! Прям самое то на полистать и вспомнить формулы перед собеседованием.
#книжки
👍1🔥1
#алгоритмы
Выше в этом треде писалось о том, что в некоторых компаниях на собеседованиях любят спрашивать про алгоритмы и структуры данных.
Удобная шпаргалка по сложности взаимодействия с разными структурами данных:
Выше в этом треде писалось о том, что в некоторых компаниях на собеседованиях любят спрашивать про алгоритмы и структуры данных.
Удобная шпаргалка по сложности взаимодействия с разными структурами данных:
#тестирование
Справочник по A/B тестам с примерами кода на Python:
https://towardsdatascience.com/a-b-testing-a-complete-guide-to-statistical-testing-e3f1db140499
Справочник по A/B тестам с примерами кода на Python:
https://towardsdatascience.com/a-b-testing-a-complete-guide-to-statistical-testing-e3f1db140499
Towards Data Science
A/B Testing - A complete guide to statistical testing | Towards Data Science
Optimizing web marketing strategies through statistical testing
Мне тут недавно пришлось очень плотно поработать с временными рядами, нашел супер-крутую библиотеку от Facebook для этого:
https://facebook.github.io/prophet/
Пишут, что хорошо работает с рядами, в которых выражена сезонность. Имеет очень удобный интерфейс и позволяет находу отрисовывать красивые графики
https://facebook.github.io/prophet/
Пишут, что хорошо работает с рядами, в которых выражена сезонность. Имеет очень удобный интерфейс и позволяет находу отрисовывать красивые графики
Prophet
Prophet is a forecasting procedure implemented in R and Python. It is fast and provides completely automated forecasts that can be tuned by hand by data scientists and analysts.
Start Career in DS
Мне тут недавно пришлось очень плотно поработать с временными рядами, нашел супер-крутую библиотеку от Facebook для этого: https://facebook.github.io/prophet/ Пишут, что хорошо работает с рядами, в которых выражена сезонность. Имеет очень удобный интерфейс…
Спасибо большое @cosadesl за классную книжку по работе с временными рядами в комментариях!
Там глава конкретно про Prophet очень крутая, думаю, всем будет полезно:
https://ranalytics.github.io/tsa-with-r/ch-intro-to-prophet.html
Хоть и описываются функции R'овские, но в Python синтаксис не сильно отличается. А вот описание основных функций, гиперпараметров и особенностей на русском - штука полезная.
Там глава конкретно про Prophet очень крутая, думаю, всем будет полезно:
https://ranalytics.github.io/tsa-with-r/ch-intro-to-prophet.html
Хоть и описываются функции R'овские, но в Python синтаксис не сильно отличается. А вот описание основных функций, гиперпараметров и особенностей на русском - штука полезная.
ranalytics.github.io
ГЛАВА 6 Пакет prophet | Анализ временных рядов с помощью R
Современные методы анализа временных рядов, реализованные в системе статистических вычислений R
#softskills - штука очень полезная и нужная в работе. Часто мало сделать задачу круто - важно объяснить своё решение коллегам/руководству и убедить их в том, что оно действительно поможет принести value для бизнеса.
Кажется, самая большая подборка материалов по софтам, которую я встречал:
https://vc.ru/education/101011-samaya-bolshaya-podborka-po-prokachke-soft-skills-hvatit-na-vsyu-zhizn
Кажется, самая большая подборка материалов по софтам, которую я встречал:
https://vc.ru/education/101011-samaya-bolshaya-podborka-po-prokachke-soft-skills-hvatit-na-vsyu-zhizn
vc.ru
Самая большая подборка по прокачке soft skills. Хватит на всю жизнь
Чтобы развивать инновационную среду в компании, нужно начать с развития собственных навыков. Конечно, вы слышали про soft skills и уже знаете шутку, что за hard skills вас берут на работу, а за soft skills увольняют. Но что вас точно удивит, так это количество…
Каждый уважающий себя DS гоняет xgboost :)
Но далеко не каждый понимает что означают те или иные его параметры. Вот статья, в которой рассказывают про смысл большинства из них:
https://www.analyticsvidhya.com/blog/2016/03/complete-guide-parameter-tuning-xgboost-with-codes-python/
Но далеко не каждый понимает что означают те или иные его параметры. Вот статья, в которой рассказывают про смысл большинства из них:
https://www.analyticsvidhya.com/blog/2016/03/complete-guide-parameter-tuning-xgboost-with-codes-python/
Analytics Vidhya
XGBoost Parameters Tuning
Explore XGBoost parameters and hyperparameter tuning like learning rate, depth of trees, regularization, etc. to improve model accuracy.
🔥1
#softskills
Я тут недавно осознал, что синдром самозванца - большая проблема, из-за которой многие страдают. Причем как стажеры, так и ребята с опытом.
Важно всегда помнить, что если вас взяли на стажировку/работу - значит, вы круты! И в этом сомневаться не нужно.
Статья, в которой рассказывают как со всем этим жить:
https://m.habr.com/ru/post/548384/
Я тут недавно осознал, что синдром самозванца - большая проблема, из-за которой многие страдают. Причем как стажеры, так и ребята с опытом.
Важно всегда помнить, что если вас взяли на стажировку/работу - значит, вы круты! И в этом сомневаться не нужно.
Статья, в которой рассказывают как со всем этим жить:
https://m.habr.com/ru/post/548384/
Хабр
Синдром самозванца у айтишников. Немного логики для тех, кто подумывает писать в блоги
Imposter Phenomenon – это когда человек считает свой успех или результаты работы удачным стечением обстоятельств и не приписывает их своим стараниям или личным качествам. В результате он не готов...
👍2❤1