Статья о том как с помощью библиотеки PyMySQL делать запросы к базе данных MySQL из Python https://khashtamov.com/ru/mysql-python/
Khashtamov
Работа с MySQL в Python
Ранее я уже писал статью про работу с PostgreSQL из Python. Сегодняшний пост будет посвящен другой популярной базе данных MySQL. Мой путь в веб-программирование был классическим: PHP, MySQL и Apache.…
Хорошая статья, в которой приводится пример простого (но от этого не менее полезного) анализа статистики группы ВКонтакте. Автор сначала получает данные через API (ноутбук со скриптом http://bit.ly/2HTjUv6), а затем с помощью Pandas и Matplotlib строит графики, позволяющие увидеть интересные закономерности https://habr.com/ru/post/440738/
10 примеров нестандартного использования команд в Pandas. Лично я для себя открыл интересный пример про процентильные группы, буду использовать. https://proglib.io/p/pandas-tricks/
Библиотека программиста
10 трюков библиотеки Python Pandas, которые вам нужны
Любите панд? Мы тоже. А еще мы любим эффективный код, поэтому собрали классные трюки, которые облегчат работу с библиотекой Python Pandas.
Алексей Куличевский написал один из самых объёмных и доступных для понимания русскоязычных материалов по Pandas. Это бомба 💣 🔥http://smysl.io/blog/pandas/
smysl.io
Аналитикам: большая шпаргалка по Pandas
Для одних визуализация данных является неотъемлемой частью их профессиональной деятельности, а для других — занимательным хобби. Для обмена опытом, взаимопомощи и эффективного обучения было основано Data Visualization Society. Присоединяйтесь! ✊🏻http://tiny.cc/egrs4y
Medium
Представляем вам Сообщество Визуализации Данных
English | Espanol | Português | Română
Статья про продвинутое использование Jupyter Notebook. Если вы не в курсе что такое magic-команды и не знали, что можно выполнять shell'овские команды прямо из Юпитера, то найдете в статье много нового😉https://www.dataquest.io/blog/advanced-jupyter-notebooks-tutorial/
Dataquest
Advanced Jupyter Notebook Tutorial – Dataquest
If you're doing data science in Python, notebooks are a powerful tool. This free Jupyter Notebooks tutorial has will help you get the best out of Jupyter.
Короткий гайд об использовании функций map и replace в Pandas https://kanoki.org/2019/04/06/pandas-map-dictionary-values-with-dataframe-columns/
JetBrains объявили о сотрудничестве с Anaconda. Первым шагом стал новый релиз PyCharm, в котором улучшена поддержка окружений Conda. Также JetBrains анонсировали PyCharm for Anaconda ( https://www.jetbrains.com/pycharm/promo/anaconda/) - полноценную среду разработки для анализа данных и различных научных вычислений с поддержкой Jupyter Notebooks. Жить становится лучше, жить становится веселее😊 https://blog.jetbrains.com/pycharm/2019/04/collaboration-with-anaconda-inc/
JetBrains Blog
Collaboration with Anaconda, Inc. | The PyCharm Blog
Just now at AnacondaCON, JetBrains CEO Max Shafirov, and Anaconda’s CEO Scott Collison announced the start of our collaboration.
The PyCharm team has been working hard in the last months to improve t
The PyCharm team has been working hard in the last months to improve t
Павел Максимов (@pavel_maksimow) выложил в открытый доступ обертку для более удобной работы с API Google Analytics на Python.
- Умеет запрашивать данные маленькими порциями, чтобы обойти семплирование.
- Если в один ответ не поместятся все строки (макс 10000), сделает дополнительные запросы.
- По умолчанию возвращает данные в формате dataframe.
Налетай! Торопись! https://bit.ly/2WYeDpr
- Умеет запрашивать данные маленькими порциями, чтобы обойти семплирование.
- Если в один ответ не поместятся все строки (макс 10000), сделает дополнительные запросы.
- По умолчанию возвращает данные в формате dataframe.
Налетай! Торопись! https://bit.ly/2WYeDpr
GitHub
GitHub - pavelmaksimov/galytics3: Обертка над стандартной библиотекой google_api_python_client для легкой работы с API Google Analytics…
Обертка над стандартной библиотекой google_api_python_client для легкой работы с API Google Analytics v3 - GitHub - pavelmaksimov/galytics3: Обертка над стандартной библиотекой google_api_python_cl...
Небольшой гайд про выбор (слайсинг) данных из датафрейма. Новичкам будет полезно для того, чтобы понять чем loc отличается от iloc и когда нужно использовать какую из функций. Также там есть интересный пример использования filter для формирования выборки на основе регулярки https://www.pluralsight.com/guides/indexing-selecting-data
Pluralsight
Indexing and Selecting Data | Pluralsight
Pluralsight Guides
Алексей Куличевский написал статью о том как сделать когортный анализ в Pandas. Как всегда подробно и круто! http://smysl.io/blog/pandas-cohorts/
smysl.io
Когортный анализ в Pandas
Интересный пример скрэпинга туториалов с сайта DataCamp с помощью BeautifulSoup и дальнейшего анализа с применением Pandas и Seaborn. https://www.datacamp.com/community/tutorials/tutorial-python-beautifulsoup-datacamp-tutorials
Datacamp
Web Scraping using Python (and Beautiful Soup)
Learn how to extract data from the web with Beautiful Soup, manipulate and clean data using Python's Pandas library, and data visualization using Python's Matplotlib library.
Ответы на вопрос "Почему Python такой плохой язык программирования?". Ожидаемо, что ругаются на то какой он медленный, на табуляции и на динамическую типизацию. А ещё некоторым людям не нравится слишком дружелюбное сообщество и то, что порог входа в Python слишком низкий, настолько низкий, что его даже советуют изучать детям! Ужас какой-то, программисты на Perl явно негодуют. https://www.quora.com/Why-is-python-so-bad
Quora
Why is python so bad? - Quora
It isn’t bad, it’s certainly useful for some projects. I like it for smaller tasks that I’d otherwise do in shell scripts. I also find it to be the best pocket calculator in existence (a CLI with python will do that job far better than any pocket ...
tg_image_250679840.jpeg
29.2 KB
А давайте немного поразгадываем головоломки. Что делает вот такой кусок кода? Правильный ответ выложу завтра в 15:00, к этому времени все успеют попробовать запустить🙃
Классный ноутбук с подробными комментариями, объясняющий основы разведочного анализа данных на примере данных о сердечно-сосудистых заболеваниях. Рекомендую ознакомиться, написано всё интересно и качественно👍https://www.kaggle.com/emstrakhov/lesson-1-eda-with-pandas
Kaggle
Lesson 1. EDA with Pandas
Explore and run machine learning code with Kaggle Notebooks | Using data from Cardiovascular Disease dataset
Отвечая на вопрос о вчерашней головоломке. Этот код задает в колонке some_column значение, равное 1, для 10% случайно выбранных строк датафрейма. Мне кажется, что для новичков будет полезным детально рассмотреть как работает эта строчка кода, потому что там зарыто много мелких неочевидных нюансов. Написал про это статью: http://datalytics.ru/all/golovolomka-pro-randomny-sempl/
datalytics.ru
Головоломка про рандомный сэмпл
Иногда чтение чужого кода бывает крайне интересным и увлекательным, будто читаешь отличный нон-фикшн
Подробный гайд по визуализации данных с помощью Seaborn.
Лично мне Seaborn нравится больше, чем matplotlib, какие-то более аккуратные графики в нём получаются, даже если использовать дефолтные визуализации.
https://elitedatascience.com/python-seaborn-tutorial
Лично мне Seaborn нравится больше, чем matplotlib, какие-то более аккуратные графики в нём получаются, даже если использовать дефолтные визуализации.
https://elitedatascience.com/python-seaborn-tutorial
EliteDataScience
The Ultimate Python Seaborn Tutorial: Gotta Catch 'Em All
In this step-by-step Python Seaborn tutorial, you'll learn how to use one of Python's most convenient libraries for data visualization.
Перевод статьи из блога DataQuest о том как использовать Pandas для анализа тяжелых датасетов. Рассматриваются методики преобразования типов к более легковесным, оптимизация хранения объектных типов с помощью их преобразования к категориальным типам. В итоге, на тестовом датасете получилось на 90% снизить объем памяти, нужной для хранения датасета. https://habr.com/ru/company/ruvds/blog/442516/
Хабр
Руководство по использованию pandas для анализа больших наборов данных
При использовании библиотеки pandas для анализа маленьких наборов данных, размер которых не превышает 100 мегабайт, производительность редко становится проблемой. Но когда речь идёт об исследовании...
Небольшой туториал о том как получить статистику из API Яндекс.Директа с помощью несложного скрипта
https://habr.com/ru/post/449392/
https://habr.com/ru/post/449392/
Хабр
Получение статистики по всем клиентам из API Яндекс Директ в разрезе дней с помощью Python
В работе часто использую короткую статистику в разрезе дней чтобы отслеживать отклонения трафика. Более подробно о написании запросов написал в статье « Получе...
Наткнулся на интересную утилиту csvkit.
Это набор инструментов, вызываемых из командной строки, позволяющих быстро производить рутинные операции с csv.
Так csvkit умеет конвертировать csv в json и обратно, читать xlsx-файлы, находить строки, соответствующие условию, вытягивать и передавать данные в БД. Ну и ещё много всего. Почитайте доку, там интересно
https://csvkit.readthedocs.io/en/latest/
Это набор инструментов, вызываемых из командной строки, позволяющих быстро производить рутинные операции с csv.
Так csvkit умеет конвертировать csv в json и обратно, читать xlsx-файлы, находить строки, соответствующие условию, вытягивать и передавать данные в БД. Ну и ещё много всего. Почитайте доку, там интересно
https://csvkit.readthedocs.io/en/latest/