Datalytics
9.07K subscribers
218 photos
17 videos
5 files
673 links
Канал для аналитиков данных про Python, карьерное развитие в анализе данных, всякое разное

Автор – @ax_makarov

Отдельный канал про ChatGPT и его практическое применение —  @ai_forge

Чат канала — @pydata_chat

Вакансии — @data_hr
Download Telegram
Статья о том как проводить простейший финансовый анализ с помощью Python. Показаны простые, но эффективные способы расчета показателей, таких как доходность, кумулятивная доходность, а также матрица рассеяния по парам акций. Отличный пример анализа реальных данных.

https://habr.com/ru/post/492364/
И снова про финансы. Интересный пример анализа котировок в том числе с использованием скользящего среднего, так что если вы хотели посмотреть на рабочие примеры применения rolling() в pandas, то вам сюда. Ну и ещё плюс статьи в том, что в самом начале указана ссылка на скачивание котировок с Финама в csv, что удобно, если вам лень возиться с финансовыми АПИ.

https://habr.com/ru/post/491612/
Крутые примеры генеративного искусства, созданного с помощью библиотеки Processing на Python со ссылками на исходный код

https://github.com/aaronpenne/generative_art
Виталий Черемисинов и Искандер Мирмахмадов из ExperimentFest запустили телеграм-канал. В нем будут публиковаться интересные статьи, книги, лекции и кейсы из мира математической статистики, анализа данных и экспериментов. Bootstrap, методы сокращения дисперсии, AB-тестирования - ребята знают толк в прикладной статистике, так что смело присоединяйтесь!

https://t.me/exp_fest
Интересная статья о том как использовать if-else конструкции для формирования новых колонок в pandas.

Для многих очевидным будет использование apply(), но в статье показаны и более любопытные примеры, например, применение метода np.select()

https://medium.com/@ODSC/creating-if-elseif-else-variables-in-python-pandas-7900f512f0e4
Дмитрий Осиюк написал отличную инструкцию по отправке Server-side событий через Facebook Pixel. Например, это может быть полезно для формирования аудитории на основе совершения телефонного звонка через коллтрекинг. В инструкции рассказывается о том как активировать Server-Side API в личном кабинете, а также о передаче событий с помощью скрипта на Python.

https://iosiuk.blogspot.com/2020/04/server-side-api-facebook-pixel.html
Виталий Бахвалов написал статью о том как отправлять целевые звонки из коллтрекинга CoMagic в Facebook Pixel, используя Server-Side API

http://italylov.ru/blog/all/otpravlyaem-celevye-zvonki-iz-comagic-v-piksel-feysbuka/
Алексей Селезнёв запустил бесплатный, вводный курс по R.

В ходе курса рассмотрены основные возможности инфраструктуры tidyverse, т.е. своего рода аналог pandas на R.

На данный момент открыто уже 5 уроков, и каждую неделю по понедельникам открывается новый урок.

Кому интерсно велкам.


Программа и информация о курсе на proglib
Подписка на youtube канал
Отличная статья про агрегацию и группировку данных с помощью pandas. В ней рассказывается про кучу нюансов, которые обычно возникают в процессе работы с данными:

- какие агрегирующие функции существуют,
- как сделать собственную агрегирующую функцию (lambda в помощь),
- как сделать результат группировки не в виде series, а в виде фрейма,
- как убрать мультииндекс в колонках после группировки,
- как использовать именнованные агрегаты.

В общем, если бы я наткнулся на такую статью лет 5 назад, то это существенно сократило бы количество самостоятельно набитых шишек.

https://www.shanelynn.ie/summarising-aggregation-and-grouping-data-in-python-pandas/
Возможно вы сталкивались с задачей параллельных вычислений над pandas датафреймами. Решить эту проблему можно как силами нативного Python, так и с помощью замечательной библиотеки — pandarallel. В статье объясняется, как эта библиотека позволяет обрабатывать данные с использованием параллельных вычислений.

https://habr.com/ru/post/498904/
Алексей Селезнёв написал заметку про небольшую библиотеку pretty-html-table, которая позволяет привести пандасовский датафрейм в нормальную HTML таблицу. Да такую, чтобы было не стыдно вставить в письмо🙃

Как создать оформленную HTML-таблицу из dataframe
Статья про визуализацию данных с помощью Altair. Как-то многие упускают из виду этот инструмент для создания визуализаций, а меж тем он эффективен и прост. В особенности, когда нужны графики для исследования данных

https://towardsdatascience.com/python-interactive-data-visualization-with-altair-b4c4664308f8
This media is not supported in your browser
VIEW IN TELEGRAM
Как выделиться на фоне остальных кандидатов и получить работу аналитика?

13 мая в 19:00 (мск) в рамках шестимесячного онлайн-курса «Профессия: Аналитик», ребята из ProductStar проводят бесплатный вебинар «Как подготовиться и пройти собеседование на аналитика».

👨‍🏫 Кто выступит?

Артур Самигуллин, ex-DS & Analytics Team Lead в Modulbank

🎓 О чем пойдет речь?

— Разберём, как проходит собеседование на аналитика.
— Узнаем, как правильно подготовиться к интервью.
— Проанализируем основные ошибки кандидатов на собеседовании.

🔥 Два самых активных участника вебинара получат сертификат на бесплатное обучение в ProductStar.

Участие бесплатное, но регистрация обязательна.

Зарегистрироваться на вебинар 👉 @ProductStarAnalyticsBot
Искал информацию про моделирование процессов и случайно наткнулся на коллекцию замечательных ноутбуков, посвященных моделированию точечных процессов. В этом есть две прелести: узнал что такое точечный процесс и в очередной раз потерял дар речи от того какие классные ноутбуки делают учёные.

https://github.com/MatthewDaws/PointProcesses
Если вы занимаетесь анализом данных на Python, то точно знакомы с Jupyter. И, конечно же, вы знаете насколько это удобная штука для Interactive Computing. Но тем кто сильно привык к обычным IDE (например, PyCharm) не хватало визуального отладчика. Команда Project Jupyter, после нескольких месяцев разработки, представила первый публичный релиз визуального отладчика для Jupyter!

Отладчик позволяет устанавливать в ячейках блокнотов и в файлах с исходным кодом точки останова. Он позволяет исследовать содержимое переменных, просматривать стек вызовов. И этим его возможности не ограничиваются.

https://habr.com/ru/company/ruvds/blog/500422/
A/B тестирование — это неотъемлемая часть работы над продуктом. С его помощью можно проверить гипотезу о том, поменяется ли выбранная продуктовая метрика, если изменить что-то в продукте, — например, увеличится ли количество пользователей, если изменить дизайн страницы регистрации. Для этого сравниваются результаты в тестовой и контрольной группах пользователей: первой выборке показывают новое решение, а у контрольной группы продукт остаётся неизменным.

При этом важно проверить, будет ли изменение статистически значимым: подтвердить, что наблюдаемая разница у тестовой и контрольных групп действительно связана с нововведениями в продукте, а не является случайностью. Для этого можно применять традиционный (частотный) или байесовский подход к A/B тестированию. У обоих методов есть свои сторонники и противники, но байесовский подход позволяет проще визуализировать данные и интерпретировать результат эксперимента. Академия Яндекса перевела статью из блога Towards Data Science о том, как провести байесовское A/B тестирование и разобраться в его работе.

https://academy.yandex.ru/posts/prostoy-gid-po-bayesovskomu-a-b-testirovaniyu-na-python
Forwarded from Oh My Py
📦 Как сделать классный Python-пакет

Раньше я думал, что создание пакетов в питоне — жуткая головная боль. Никогда с этим не связывался.

Оказывается, ситуация давно изменилась, и делать библиотеки стало легко и приятно. Буквально так:

flit init
...
flit publish


Попробуйте: https://antonz.ru/packaging/

P.S. Если у вас есть собственная библиотека, которой не стыдно поделиться — присылайте в личку. Про самые интересные напишу отдельно.
Отличная статья про визуализацию данных с помощью Plotly. Статья рассказывает о том как строить различные интерактивные визуализации от простых вроде line-chart до более сложных, например, отображение данных на карте

https://habr.com/ru/post/502958/