Интересная статья о том как использовать if-else конструкции для формирования новых колонок в pandas.
Для многих очевидным будет использование
https://medium.com/@ODSC/creating-if-elseif-else-variables-in-python-pandas-7900f512f0e4
Для многих очевидным будет использование
apply(), но в статье показаны и более любопытные примеры, например, применение метода np.select()https://medium.com/@ODSC/creating-if-elseif-else-variables-in-python-pandas-7900f512f0e4
Medium
Creating if/elseif/else Variables in Python/Pandas
Summary: This blog demos Python/Pandas/Numpy code to manage the creation of Pandas dataframe attributes with if/then/else logic. It…
Дмитрий Осиюк написал отличную инструкцию по отправке Server-side событий через Facebook Pixel. Например, это может быть полезно для формирования аудитории на основе совершения телефонного звонка через коллтрекинг. В инструкции рассказывается о том как активировать Server-Side API в личном кабинете, а также о передаче событий с помощью скрипта на Python.
https://iosiuk.blogspot.com/2020/04/server-side-api-facebook-pixel.html
https://iosiuk.blogspot.com/2020/04/server-side-api-facebook-pixel.html
Blogspot
Настройка Conversions API (Server-Side API) для Facebook Pixel
Как собирать аудиторию ремаркетинга и автоматически оптимизировать показ Facebook рекламы по событиям, которые происходят за пределами сайта: по звонкам, продажам в оффлайне и другим.
Виталий Бахвалов написал статью о том как отправлять целевые звонки из коллтрекинга CoMagic в Facebook Pixel, используя Server-Side API
http://italylov.ru/blog/all/otpravlyaem-celevye-zvonki-iz-comagic-v-piksel-feysbuka/
http://italylov.ru/blog/all/otpravlyaem-celevye-zvonki-iz-comagic-v-piksel-feysbuka/
Алексей Селезнёв запустил бесплатный, вводный курс по R.
В ходе курса рассмотрены основные возможности инфраструктуры
На данный момент открыто уже 5 уроков, и каждую неделю по понедельникам открывается новый урок.
Кому интерсно велкам.
Программа и информация о курсе на proglib
Подписка на youtube канал
В ходе курса рассмотрены основные возможности инфраструктуры
tidyverse, т.е. своего рода аналог pandas на R.На данный момент открыто уже 5 уроков, и каждую неделю по понедельникам открывается новый урок.
Кому интерсно велкам.
Программа и информация о курсе на proglib
Подписка на youtube канал
Библиотека программиста
Бесплатный видеокурс «Язык R для пользователей Excel»
Курс по языку R для пользователей Microsoft Excel: 12 уроков об архитектуре tidyverse и входящих в неё пакетах: readr, vroom, dplyr, tidyr и ggplot2.
У нас последнее время бум статей про маркетинговые API. Вот например, Юрий Борзило написал хорошую инструкцию об использовании API Google Analytics с помощью Python
http://toolmark.ru/python-ga-api/
http://toolmark.ru/python-ga-api/
Toolmark
Получаем данные из api Google analytics при помощи python - Toolmark
Получаем данные из api Google analytics при помощи python Для того, что бы начать работать с API google analytics у вас на компьютере должен быть установлен python, а также должен быть pip. PIP система управления пакетами, которая используется для установки…
Отличная статья про агрегацию и группировку данных с помощью pandas. В ней рассказывается про кучу нюансов, которые обычно возникают в процессе работы с данными:
- какие агрегирующие функции существуют,
- как сделать собственную агрегирующую функцию (lambda в помощь),
- как сделать результат группировки не в виде series, а в виде фрейма,
- как убрать мультииндекс в колонках после группировки,
- как использовать именнованные агрегаты.
В общем, если бы я наткнулся на такую статью лет 5 назад, то это существенно сократило бы количество самостоятельно набитых шишек.
https://www.shanelynn.ie/summarising-aggregation-and-grouping-data-in-python-pandas/
- какие агрегирующие функции существуют,
- как сделать собственную агрегирующую функцию (lambda в помощь),
- как сделать результат группировки не в виде series, а в виде фрейма,
- как убрать мультииндекс в колонках после группировки,
- как использовать именнованные агрегаты.
В общем, если бы я наткнулся на такую статью лет 5 назад, то это существенно сократило бы количество самостоятельно набитых шишек.
https://www.shanelynn.ie/summarising-aggregation-and-grouping-data-in-python-pandas/
www.shanelynn.ie
Group and Aggregate your Data Better using Pandas Groupby
Aggregation and grouping of Dataframes is accomplished in Python Pandas using “groupby()” and “agg()” functions. Apply max, min, count, distinct to groups.
Возможно вы сталкивались с задачей параллельных вычислений над pandas датафреймами. Решить эту проблему можно как силами нативного Python, так и с помощью замечательной библиотеки — pandarallel. В статье объясняется, как эта библиотека позволяет обрабатывать данные с использованием параллельных вычислений.
https://habr.com/ru/post/498904/
https://habr.com/ru/post/498904/
Хабр
Добавляем параллельные вычисления в Pandas
Возможно вы сталкивались с задачей параллельных вычислений над pandas датафреймами. Решить эту проблему можно как силами нативного Python, так и с помощью замечательной библиотеки — pandarallel. В...
Алексей Селезнёв написал заметку про небольшую библиотеку pretty-html-table, которая позволяет привести пандасовский датафрейм в нормальную HTML таблицу. Да такую, чтобы было не стыдно вставить в письмо🙃
Как создать оформленную HTML-таблицу из dataframe
Как создать оформленную HTML-таблицу из dataframe
Alexey Seleznev blog
Python: Как создать оформленную HTML таблицу из pandas DataFrame
Как преобразовать pandas DataFrame в HTML таблицу для отправки электронном письме.
Статья про визуализацию данных с помощью Altair. Как-то многие упускают из виду этот инструмент для создания визуализаций, а меж тем он эффективен и прост. В особенности, когда нужны графики для исследования данных
https://towardsdatascience.com/python-interactive-data-visualization-with-altair-b4c4664308f8
https://towardsdatascience.com/python-interactive-data-visualization-with-altair-b4c4664308f8
This media is not supported in your browser
VIEW IN TELEGRAM
Как выделиться на фоне остальных кандидатов и получить работу аналитика?
13 мая в 19:00 (мск) в рамках шестимесячного онлайн-курса «Профессия: Аналитик», ребята из ProductStar проводят бесплатный вебинар «Как подготовиться и пройти собеседование на аналитика».
👨🏫 Кто выступит?
Артур Самигуллин, ex-DS & Analytics Team Lead в Modulbank
🎓 О чем пойдет речь?
— Разберём, как проходит собеседование на аналитика.
— Узнаем, как правильно подготовиться к интервью.
— Проанализируем основные ошибки кандидатов на собеседовании.
🔥 Два самых активных участника вебинара получат сертификат на бесплатное обучение в ProductStar.
Участие бесплатное, но регистрация обязательна.
Зарегистрироваться на вебинар 👉 @ProductStarAnalyticsBot
13 мая в 19:00 (мск) в рамках шестимесячного онлайн-курса «Профессия: Аналитик», ребята из ProductStar проводят бесплатный вебинар «Как подготовиться и пройти собеседование на аналитика».
👨🏫 Кто выступит?
Артур Самигуллин, ex-DS & Analytics Team Lead в Modulbank
🎓 О чем пойдет речь?
— Разберём, как проходит собеседование на аналитика.
— Узнаем, как правильно подготовиться к интервью.
— Проанализируем основные ошибки кандидатов на собеседовании.
🔥 Два самых активных участника вебинара получат сертификат на бесплатное обучение в ProductStar.
Участие бесплатное, но регистрация обязательна.
Зарегистрироваться на вебинар 👉 @ProductStarAnalyticsBot
Искал информацию про моделирование процессов и случайно наткнулся на коллекцию замечательных ноутбуков, посвященных моделированию точечных процессов. В этом есть две прелести: узнал что такое точечный процесс и в очередной раз потерял дар речи от того какие классные ноутбуки делают учёные.
https://github.com/MatthewDaws/PointProcesses
https://github.com/MatthewDaws/PointProcesses
GitHub
GitHub - MatthewDaws/PointProcesses: Basics of point processes using python for simulation
Basics of point processes using python for simulation - GitHub - MatthewDaws/PointProcesses: Basics of point processes using python for simulation
Если вы занимаетесь анализом данных на Python, то точно знакомы с Jupyter. И, конечно же, вы знаете насколько это удобная штука для Interactive Computing. Но тем кто сильно привык к обычным IDE (например, PyCharm) не хватало визуального отладчика. Команда Project Jupyter, после нескольких месяцев разработки, представила первый публичный релиз визуального отладчика для Jupyter!
Отладчик позволяет устанавливать в ячейках блокнотов и в файлах с исходным кодом точки останова. Он позволяет исследовать содержимое переменных, просматривать стек вызовов. И этим его возможности не ограничиваются.
https://habr.com/ru/company/ruvds/blog/500422/
Отладчик позволяет устанавливать в ячейках блокнотов и в файлах с исходным кодом точки останова. Он позволяет исследовать содержимое переменных, просматривать стек вызовов. И этим его возможности не ограничиваются.
https://habr.com/ru/company/ruvds/blog/500422/
Хабр
Визуальный отладчик для Jupyter
Прогресс большинства программных проектов строится на малых изменениях, которые, перед тем, как двигаться дальше, тщательно оценивают. Быстрое получение результатов выполнения кода и высокая скорость...
A/B тестирование — это неотъемлемая часть работы над продуктом. С его помощью можно проверить гипотезу о том, поменяется ли выбранная продуктовая метрика, если изменить что-то в продукте, — например, увеличится ли количество пользователей, если изменить дизайн страницы регистрации. Для этого сравниваются результаты в тестовой и контрольной группах пользователей: первой выборке показывают новое решение, а у контрольной группы продукт остаётся неизменным.
При этом важно проверить, будет ли изменение статистически значимым: подтвердить, что наблюдаемая разница у тестовой и контрольных групп действительно связана с нововведениями в продукте, а не является случайностью. Для этого можно применять традиционный (частотный) или байесовский подход к A/B тестированию. У обоих методов есть свои сторонники и противники, но байесовский подход позволяет проще визуализировать данные и интерпретировать результат эксперимента. Академия Яндекса перевела статью из блога Towards Data Science о том, как провести байесовское A/B тестирование и разобраться в его работе.
https://academy.yandex.ru/posts/prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python
При этом важно проверить, будет ли изменение статистически значимым: подтвердить, что наблюдаемая разница у тестовой и контрольных групп действительно связана с нововведениями в продукте, а не является случайностью. Для этого можно применять традиционный (частотный) или байесовский подход к A/B тестированию. У обоих методов есть свои сторонники и противники, но байесовский подход позволяет проще визуализировать данные и интерпретировать результат эксперимента. Академия Яндекса перевела статью из блога Towards Data Science о том, как провести байесовское A/B тестирование и разобраться в его работе.
https://academy.yandex.ru/posts/prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python
Forwarded from Oh My Py
📦 Как сделать классный Python-пакет
Раньше я думал, что создание пакетов в питоне — жуткая головная боль. Никогда с этим не связывался.
Оказывается, ситуация давно изменилась, и делать библиотеки стало легко и приятно. Буквально так:
Попробуйте: https://antonz.ru/packaging/
P.S. Если у вас есть собственная библиотека, которой не стыдно поделиться — присылайте в личку. Про самые интересные напишу отдельно.
Раньше я думал, что создание пакетов в питоне — жуткая головная боль. Никогда с этим не связывался.
Оказывается, ситуация давно изменилась, и делать библиотеки стало легко и приятно. Буквально так:
flit init
...
flit publish
Попробуйте: https://antonz.ru/packaging/
P.S. Если у вас есть собственная библиотека, которой не стыдно поделиться — присылайте в личку. Про самые интересные напишу отдельно.
Отличная статья про визуализацию данных с помощью Plotly. Статья рассказывает о том как строить различные интерактивные визуализации от простых вроде line-chart до более сложных, например, отображение данных на карте
https://habr.com/ru/post/502958/
https://habr.com/ru/post/502958/
Хабр
Шпаргалка по визуализации данных в Python с помощью Plotly
Plotly — библиотека для визуализации данных, состоящая из нескольких частей: Front-End на JS Back-End на Python (за основу взята библиотека Seaborn) Back-End на R В этой простыне все...
Forwarded from Интернет-аналитика // Алексей Никушин (Алексей Никушин)
Леша Куличевский @kulichevskiy описал процесс создания системы сквозной аналитики без подключения сторонних сервисов.
Как подключаться к AmoCRM по API (на Python) и забирать данные о сделках.
https://github.com/kulichevskiy/end-to-end/blob/master/amocrm.ipynb
Как подключаться к AmoCRM по API (на Python) и забирать данные о сделках.
https://github.com/kulichevskiy/end-to-end/blob/master/amocrm.ipynb
GitHub
end-to-end/amocrm.ipynb at master · kulichevskiy/end-to-end
Code snippets for creation of your own end-to-end analytics system - kulichevskiy/end-to-end
О том как быстро и просто делать интерактивные визуализации с помощью Bokeh. В статье рассказывается о библиотеке Pandas-Bokeh, с помощью которой можно делать визуализации в одну строку. Это обеспечивается методом
https://towardsdatascience.com/beautiful-and-easy-plotting-in-python-pandas-bokeh-afa92d792167
plot_bokeh(), который появляется при импорте библиотекиhttps://towardsdatascience.com/beautiful-and-easy-plotting-in-python-pandas-bokeh-afa92d792167
Medium
Beautiful and Easy Plotting in Python — Pandas + Bokeh
A single line of code to create an interactive plot from Pandas dataframe to Bokeh
Простая, но полезная, библиотека, позволяющая по набору данных подсчитать количество строк по категориальной колонке (или нескольким). Помимо самого количества также выводится доля и нарастающие показатели. По сути этой такой value_counts() на стероидах.
Но основная прелесть библиотеки в том, что она использует новое API pandas, которое позволяет писать собственные ацессоры для датафреймов и series, чтобы делать методы, которые могут встраиваться непосредственно как методы датафрейма. То есть вы можете расширять функциональность pandas, создавая дополнительные библиотеки, и при этом ваши методы будут выглядеть очень нативно и правильно с точки зрения хорошего стиля (например, логично встраиваться в концепцию method chaining). В общем, советую покопаться в исходниках.
https://pbpython.com/sidetable.html
Но основная прелесть библиотеки в том, что она использует новое API pandas, которое позволяет писать собственные ацессоры для датафреймов и series, чтобы делать методы, которые могут встраиваться непосредственно как методы датафрейма. То есть вы можете расширять функциональность pandas, создавая дополнительные библиотеки, и при этом ваши методы будут выглядеть очень нативно и правильно с точки зрения хорошего стиля (например, логично встраиваться в концепцию method chaining). В общем, советую покопаться в исходниках.
https://pbpython.com/sidetable.html
Pbpython
sidetable - Create Simple Summary Tables in Pandas
Introducing sidetable, a pandas library that build summary tables of your DataFrames.
Когда-то давно я написал статью про то с чего действующим аналитикам начать изучение Python. С тех пор статья немного актуализировалась и дополнилась несколькими интересными ссылками. Если кто-то вдруг подписан на канал, но пока ещё не нашёл как подступиться к Python, то эта статья как раз для вас
http://datalytics.ru/all/s-chego-analitiku-nachat-izuchenie-python/
http://datalytics.ru/all/s-chego-analitiku-nachat-izuchenie-python/
www.datalytics.ru
С чего аналитику начать изучение Python
Многие аналитики задумываются об изучении Python, но не представляют себе первых шагов
Forwarded from A/B testing
Краткое руководство по реализации A/B тестов на Python:
https://medium.com/@robbiegeoghegan/implementing-a-b-tests-in-python-514e9eb5b3a1
Github Repository: https://github.com/RobbieGeoghegan/AB_Testing
via @ABtesting
https://medium.com/@robbiegeoghegan/implementing-a-b-tests-in-python-514e9eb5b3a1
Github Repository: https://github.com/RobbieGeoghegan/AB_Testing
via @ABtesting
Medium
Implementing A/B Tests in Python
A quick guide to experiment design and implementation
Хорошая статья про то как строить простые визуализации с помощью методов, встроенных в ацессор
https://towardsdatascience.com/the-simplest-way-to-create-complex-visualizations-in-python-isnt-with-matplotlib-a5802f2dba92
plot. Внутри этого ацессора существует ряд простых в применении методов (например, bar() или hist()), которые позволяют быстро строить простые визуализации, основанные на matplotlib. О применении этих методов и пойдёт речьhttps://towardsdatascience.com/the-simplest-way-to-create-complex-visualizations-in-python-isnt-with-matplotlib-a5802f2dba92
Medium
The Simplest Way to Create Visualizations in Python Isn’t With matplotlib.
Creating Sleek & Easy Plots Directly From Pandas