Алексей Селезнев написал на Хабре статью, в которой сравнил подход к основным возможностям по манипуляции данных в R и Python.
В статье сравниваются следующие пакеты: tidyverse, data.table и pandas.
Цель статьи упростить миграцию между языками для их пользователей.
https://habr.com/ru/post/475210/
В статье сравниваются следующие пакеты: tidyverse, data.table и pandas.
Цель статьи упростить миграцию между языками для их пользователей.
https://habr.com/ru/post/475210/
Хабр
Какой язык выбрать для работы с данными — R или Python? Оба! Мигрируем с pandas на tidyverse и data.table и обратно
По запросу R или Python в интернете вы найдёте миллионы статей и километровых обсуждений по теме какой из них лучше, быстрее и удобнее для работы с данными. Но к сожалению особой пользы все эти статьи...
Статья о том как проводить простейший финансовый анализ с помощью Python. Показаны простые, но эффективные способы расчета показателей, таких как доходность, кумулятивная доходность, а также матрица рассеяния по парам акций. Отличный пример анализа реальных данных.
https://habr.com/ru/post/492364/
https://habr.com/ru/post/492364/
Хабр
Общий финансовый анализ на Python (Часть 1)
В прошлой статье рассмотрено как можно получить информацию по финансовым инструментам. Дальше будет опубликовано несколько статей о том, что первоначально можно...
Видео с YouTube-канала MoscowPython, в котором ребята обсудили возможности коллективной работы с jupyter notebook и многое другое.
https://www.youtube.com/watch?v=V0XXiOooP_U
https://www.youtube.com/watch?v=V0XXiOooP_U
YouTube
Moscow Python Podcast. Проблемы jupyter notebook и их решения в production (level: junior)
В гостях у Moscow Python Podcast Петр Ермаков, senior data scientist в компании Lamoda, основатель школы DataGym. Обсудили возможности коллективной работы с jupyter notebook и многое другое.
Ведущие выпуска — сооснователь MoscowPython и компании DryLabs…
Ведущие выпуска — сооснователь MoscowPython и компании DryLabs…
И снова про финансы. Интересный пример анализа котировок в том числе с использованием скользящего среднего, так что если вы хотели посмотреть на рабочие примеры применения rolling() в pandas, то вам сюда. Ну и ещё плюс статьи в том, что в самом начале указана ссылка на скачивание котировок с Финама в csv, что удобно, если вам лень возиться с финансовыми АПИ.
https://habr.com/ru/post/491612/
https://habr.com/ru/post/491612/
Хабр
Сравнение динамики котировок двух акций на python на примере привилегированных и обычных акций Сбербанка
Здравствуйте, сегодня хотел бы рассказать про мой опыт анализа акций сбербанка. Порой они показывают немного разную динамику — мне стало интересно проанализирова...
Крутые примеры генеративного искусства, созданного с помощью библиотеки Processing на Python со ссылками на исходный код
https://github.com/aaronpenne/generative_art
https://github.com/aaronpenne/generative_art
Виталий Черемисинов и Искандер Мирмахмадов из ExperimentFest запустили телеграм-канал. В нем будут публиковаться интересные статьи, книги, лекции и кейсы из мира математической статистики, анализа данных и экспериментов. Bootstrap, методы сокращения дисперсии, AB-тестирования - ребята знают толк в прикладной статистике, так что смело присоединяйтесь!
https://t.me/exp_fest
https://t.me/exp_fest
Интересная статья о том как использовать if-else конструкции для формирования новых колонок в pandas.
Для многих очевидным будет использование
https://medium.com/@ODSC/creating-if-elseif-else-variables-in-python-pandas-7900f512f0e4
Для многих очевидным будет использование
apply(), но в статье показаны и более любопытные примеры, например, применение метода np.select()https://medium.com/@ODSC/creating-if-elseif-else-variables-in-python-pandas-7900f512f0e4
Medium
Creating if/elseif/else Variables in Python/Pandas
Summary: This blog demos Python/Pandas/Numpy code to manage the creation of Pandas dataframe attributes with if/then/else logic. It…
Дмитрий Осиюк написал отличную инструкцию по отправке Server-side событий через Facebook Pixel. Например, это может быть полезно для формирования аудитории на основе совершения телефонного звонка через коллтрекинг. В инструкции рассказывается о том как активировать Server-Side API в личном кабинете, а также о передаче событий с помощью скрипта на Python.
https://iosiuk.blogspot.com/2020/04/server-side-api-facebook-pixel.html
https://iosiuk.blogspot.com/2020/04/server-side-api-facebook-pixel.html
Blogspot
Настройка Conversions API (Server-Side API) для Facebook Pixel
Как собирать аудиторию ремаркетинга и автоматически оптимизировать показ Facebook рекламы по событиям, которые происходят за пределами сайта: по звонкам, продажам в оффлайне и другим.
Виталий Бахвалов написал статью о том как отправлять целевые звонки из коллтрекинга CoMagic в Facebook Pixel, используя Server-Side API
http://italylov.ru/blog/all/otpravlyaem-celevye-zvonki-iz-comagic-v-piksel-feysbuka/
http://italylov.ru/blog/all/otpravlyaem-celevye-zvonki-iz-comagic-v-piksel-feysbuka/
Алексей Селезнёв запустил бесплатный, вводный курс по R.
В ходе курса рассмотрены основные возможности инфраструктуры
На данный момент открыто уже 5 уроков, и каждую неделю по понедельникам открывается новый урок.
Кому интерсно велкам.
Программа и информация о курсе на proglib
Подписка на youtube канал
В ходе курса рассмотрены основные возможности инфраструктуры
tidyverse, т.е. своего рода аналог pandas на R.На данный момент открыто уже 5 уроков, и каждую неделю по понедельникам открывается новый урок.
Кому интерсно велкам.
Программа и информация о курсе на proglib
Подписка на youtube канал
Библиотека программиста
Бесплатный видеокурс «Язык R для пользователей Excel»
Курс по языку R для пользователей Microsoft Excel: 12 уроков об архитектуре tidyverse и входящих в неё пакетах: readr, vroom, dplyr, tidyr и ggplot2.
У нас последнее время бум статей про маркетинговые API. Вот например, Юрий Борзило написал хорошую инструкцию об использовании API Google Analytics с помощью Python
http://toolmark.ru/python-ga-api/
http://toolmark.ru/python-ga-api/
Toolmark
Получаем данные из api Google analytics при помощи python - Toolmark
Получаем данные из api Google analytics при помощи python Для того, что бы начать работать с API google analytics у вас на компьютере должен быть установлен python, а также должен быть pip. PIP система управления пакетами, которая используется для установки…
Отличная статья про агрегацию и группировку данных с помощью pandas. В ней рассказывается про кучу нюансов, которые обычно возникают в процессе работы с данными:
- какие агрегирующие функции существуют,
- как сделать собственную агрегирующую функцию (lambda в помощь),
- как сделать результат группировки не в виде series, а в виде фрейма,
- как убрать мультииндекс в колонках после группировки,
- как использовать именнованные агрегаты.
В общем, если бы я наткнулся на такую статью лет 5 назад, то это существенно сократило бы количество самостоятельно набитых шишек.
https://www.shanelynn.ie/summarising-aggregation-and-grouping-data-in-python-pandas/
- какие агрегирующие функции существуют,
- как сделать собственную агрегирующую функцию (lambda в помощь),
- как сделать результат группировки не в виде series, а в виде фрейма,
- как убрать мультииндекс в колонках после группировки,
- как использовать именнованные агрегаты.
В общем, если бы я наткнулся на такую статью лет 5 назад, то это существенно сократило бы количество самостоятельно набитых шишек.
https://www.shanelynn.ie/summarising-aggregation-and-grouping-data-in-python-pandas/
www.shanelynn.ie
Group and Aggregate your Data Better using Pandas Groupby
Aggregation and grouping of Dataframes is accomplished in Python Pandas using “groupby()” and “agg()” functions. Apply max, min, count, distinct to groups.
Возможно вы сталкивались с задачей параллельных вычислений над pandas датафреймами. Решить эту проблему можно как силами нативного Python, так и с помощью замечательной библиотеки — pandarallel. В статье объясняется, как эта библиотека позволяет обрабатывать данные с использованием параллельных вычислений.
https://habr.com/ru/post/498904/
https://habr.com/ru/post/498904/
Хабр
Добавляем параллельные вычисления в Pandas
Возможно вы сталкивались с задачей параллельных вычислений над pandas датафреймами. Решить эту проблему можно как силами нативного Python, так и с помощью замечательной библиотеки — pandarallel. В...
Алексей Селезнёв написал заметку про небольшую библиотеку pretty-html-table, которая позволяет привести пандасовский датафрейм в нормальную HTML таблицу. Да такую, чтобы было не стыдно вставить в письмо🙃
Как создать оформленную HTML-таблицу из dataframe
Как создать оформленную HTML-таблицу из dataframe
Alexey Seleznev blog
Python: Как создать оформленную HTML таблицу из pandas DataFrame
Как преобразовать pandas DataFrame в HTML таблицу для отправки электронном письме.
Статья про визуализацию данных с помощью Altair. Как-то многие упускают из виду этот инструмент для создания визуализаций, а меж тем он эффективен и прост. В особенности, когда нужны графики для исследования данных
https://towardsdatascience.com/python-interactive-data-visualization-with-altair-b4c4664308f8
https://towardsdatascience.com/python-interactive-data-visualization-with-altair-b4c4664308f8
This media is not supported in your browser
VIEW IN TELEGRAM
Как выделиться на фоне остальных кандидатов и получить работу аналитика?
13 мая в 19:00 (мск) в рамках шестимесячного онлайн-курса «Профессия: Аналитик», ребята из ProductStar проводят бесплатный вебинар «Как подготовиться и пройти собеседование на аналитика».
👨🏫 Кто выступит?
Артур Самигуллин, ex-DS & Analytics Team Lead в Modulbank
🎓 О чем пойдет речь?
— Разберём, как проходит собеседование на аналитика.
— Узнаем, как правильно подготовиться к интервью.
— Проанализируем основные ошибки кандидатов на собеседовании.
🔥 Два самых активных участника вебинара получат сертификат на бесплатное обучение в ProductStar.
Участие бесплатное, но регистрация обязательна.
Зарегистрироваться на вебинар 👉 @ProductStarAnalyticsBot
13 мая в 19:00 (мск) в рамках шестимесячного онлайн-курса «Профессия: Аналитик», ребята из ProductStar проводят бесплатный вебинар «Как подготовиться и пройти собеседование на аналитика».
👨🏫 Кто выступит?
Артур Самигуллин, ex-DS & Analytics Team Lead в Modulbank
🎓 О чем пойдет речь?
— Разберём, как проходит собеседование на аналитика.
— Узнаем, как правильно подготовиться к интервью.
— Проанализируем основные ошибки кандидатов на собеседовании.
🔥 Два самых активных участника вебинара получат сертификат на бесплатное обучение в ProductStar.
Участие бесплатное, но регистрация обязательна.
Зарегистрироваться на вебинар 👉 @ProductStarAnalyticsBot
Искал информацию про моделирование процессов и случайно наткнулся на коллекцию замечательных ноутбуков, посвященных моделированию точечных процессов. В этом есть две прелести: узнал что такое точечный процесс и в очередной раз потерял дар речи от того какие классные ноутбуки делают учёные.
https://github.com/MatthewDaws/PointProcesses
https://github.com/MatthewDaws/PointProcesses
GitHub
GitHub - MatthewDaws/PointProcesses: Basics of point processes using python for simulation
Basics of point processes using python for simulation - GitHub - MatthewDaws/PointProcesses: Basics of point processes using python for simulation
Если вы занимаетесь анализом данных на Python, то точно знакомы с Jupyter. И, конечно же, вы знаете насколько это удобная штука для Interactive Computing. Но тем кто сильно привык к обычным IDE (например, PyCharm) не хватало визуального отладчика. Команда Project Jupyter, после нескольких месяцев разработки, представила первый публичный релиз визуального отладчика для Jupyter!
Отладчик позволяет устанавливать в ячейках блокнотов и в файлах с исходным кодом точки останова. Он позволяет исследовать содержимое переменных, просматривать стек вызовов. И этим его возможности не ограничиваются.
https://habr.com/ru/company/ruvds/blog/500422/
Отладчик позволяет устанавливать в ячейках блокнотов и в файлах с исходным кодом точки останова. Он позволяет исследовать содержимое переменных, просматривать стек вызовов. И этим его возможности не ограничиваются.
https://habr.com/ru/company/ruvds/blog/500422/
Хабр
Визуальный отладчик для Jupyter
Прогресс большинства программных проектов строится на малых изменениях, которые, перед тем, как двигаться дальше, тщательно оценивают. Быстрое получение результатов выполнения кода и высокая скорость...
A/B тестирование — это неотъемлемая часть работы над продуктом. С его помощью можно проверить гипотезу о том, поменяется ли выбранная продуктовая метрика, если изменить что-то в продукте, — например, увеличится ли количество пользователей, если изменить дизайн страницы регистрации. Для этого сравниваются результаты в тестовой и контрольной группах пользователей: первой выборке показывают новое решение, а у контрольной группы продукт остаётся неизменным.
При этом важно проверить, будет ли изменение статистически значимым: подтвердить, что наблюдаемая разница у тестовой и контрольных групп действительно связана с нововведениями в продукте, а не является случайностью. Для этого можно применять традиционный (частотный) или байесовский подход к A/B тестированию. У обоих методов есть свои сторонники и противники, но байесовский подход позволяет проще визуализировать данные и интерпретировать результат эксперимента. Академия Яндекса перевела статью из блога Towards Data Science о том, как провести байесовское A/B тестирование и разобраться в его работе.
https://academy.yandex.ru/posts/prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python
При этом важно проверить, будет ли изменение статистически значимым: подтвердить, что наблюдаемая разница у тестовой и контрольных групп действительно связана с нововведениями в продукте, а не является случайностью. Для этого можно применять традиционный (частотный) или байесовский подход к A/B тестированию. У обоих методов есть свои сторонники и противники, но байесовский подход позволяет проще визуализировать данные и интерпретировать результат эксперимента. Академия Яндекса перевела статью из блога Towards Data Science о том, как провести байесовское A/B тестирование и разобраться в его работе.
https://academy.yandex.ru/posts/prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python
Forwarded from Oh My Py
📦 Как сделать классный Python-пакет
Раньше я думал, что создание пакетов в питоне — жуткая головная боль. Никогда с этим не связывался.
Оказывается, ситуация давно изменилась, и делать библиотеки стало легко и приятно. Буквально так:
Попробуйте: https://antonz.ru/packaging/
P.S. Если у вас есть собственная библиотека, которой не стыдно поделиться — присылайте в личку. Про самые интересные напишу отдельно.
Раньше я думал, что создание пакетов в питоне — жуткая головная боль. Никогда с этим не связывался.
Оказывается, ситуация давно изменилась, и делать библиотеки стало легко и приятно. Буквально так:
flit init
...
flit publish
Попробуйте: https://antonz.ru/packaging/
P.S. Если у вас есть собственная библиотека, которой не стыдно поделиться — присылайте в личку. Про самые интересные напишу отдельно.