Datalytics

Статья о том как с помощью библиотеки PyMySQL делать запросы к базе данных MySQL из Python https://khashtamov.com/ru/mysql-python/

Khashtamov

Работа с MySQL в Python

Ранее я уже писал статью про работу с PostgreSQL из Python. Сегодняшний пост будет посвящен другой популярной базе данных MySQL. Мой путь в веб-программирование был классическим: PHP, MySQL и Apache.…

1.39K views10:15

Datalytics

Хорошая статья, в которой приводится пример простого (но от этого не менее полезного) анализа статистики группы ВКонтакте. Автор сначала получает данные через API (ноутбук со скриптом http://bit.ly/2HTjUv6), а затем с помощью Pandas и Matplotlib строит графики, позволяющие увидеть интересные закономерности https://habr.com/ru/post/440738/

1.35K views09:06

Datalytics

10 примеров нестандартного использования команд в Pandas. Лично я для себя открыл интересный пример про процентильные группы, буду использовать. https://proglib.io/p/pandas-tricks/

Библиотека программиста

10 трюков библиотеки Python Pandas, которые вам нужны

Любите панд? Мы тоже. А еще мы любим эффективный код, поэтому собрали классные трюки, которые облегчат работу с библиотекой Python Pandas.

1.42K views08:04

Datalytics

Алексей Куличевский написал один из самых объёмных и доступных для понимания русскоязычных материалов по Pandas. Это бомба 💣 🔥http://smysl.io/blog/pandas/

smysl.io

Аналитикам: большая шпаргалка по Pandas

1.66K views15:58

Datalytics

Для одних визуализация данных является неотъемлемой частью их профессиональной деятельности, а для других — занимательным хобби. Для обмена опытом, взаимопомощи и эффективного обучения было основано Data Visualization Society. Присоединяйтесь! ✊🏻http://tiny.cc/egrs4y

Medium

Представляем вам Сообщество Визуализации Данных

English | Espanol | Português | Română

1.39K viewsedited 14:17

Datalytics

Статья про продвинутое использование Jupyter Notebook. Если вы не в курсе что такое magic-команды и не знали, что можно выполнять shell'овские команды прямо из Юпитера, то найдете в статье много нового😉https://www.dataquest.io/blog/advanced-jupyter-notebooks-tutorial/

Dataquest

Advanced Jupyter Notebook Tutorial – Dataquest

If you're doing data science in Python, notebooks are a powerful tool. This free Jupyter Notebooks tutorial has will help you get the best out of Jupyter.

1.48K views08:14

Datalytics

Короткий гайд об использовании функций map и replace в Pandas https://kanoki.org/2019/04/06/pandas-map-dictionary-values-with-dataframe-columns/

1.26K viewsedited 08:43

Datalytics

JetBrains объявили о сотрудничестве с Anaconda. Первым шагом стал новый релиз PyCharm, в котором улучшена поддержка окружений Conda. Также JetBrains анонсировали PyCharm for Anaconda ( https://www.jetbrains.com/pycharm/promo/anaconda/) - полноценную среду разработки для анализа данных и различных научных вычислений с поддержкой Jupyter Notebooks. Жить становится лучше, жить становится веселее😊 https://blog.jetbrains.com/pycharm/2019/04/collaboration-with-anaconda-inc/

JetBrains Blog

Collaboration with Anaconda, Inc. | The PyCharm Blog

Just now at AnacondaCON, JetBrains CEO Max Shafirov, and Anaconda’s CEO Scott Collison announced the start of our collaboration.

The PyCharm team has been working hard in the last months to improve t

1.79K views08:58

Datalytics

Павел Максимов (@pavel_maksimow) выложил в открытый доступ обертку для более удобной работы с API Google Analytics на Python.

- Умеет запрашивать данные маленькими порциями, чтобы обойти семплирование.

- Если в один ответ не поместятся все строки (макс 10000), сделает дополнительные запросы.

- По умолчанию возвращает данные в формате dataframe.

Налетай! Торопись! https://bit.ly/2WYeDpr

GitHub

GitHub - pavelmaksimov/galytics3: Обертка над стандартной библиотекой google_api_python_client для легкой работы с API Google Analytics…

Обертка над стандартной библиотекой google_api_python_client для легкой работы с API Google Analytics v3 - GitHub - pavelmaksimov/galytics3: Обертка над стандартной библиотекой google_api_python_cl...

1.98K views12:30

Datalytics

Небольшой гайд про выбор (слайсинг) данных из датафрейма. Новичкам будет полезно для того, чтобы понять чем loc отличается от iloc и когда нужно использовать какую из функций. Также там есть интересный пример использования filter для формирования выборки на основе регулярки https://www.pluralsight.com/guides/indexing-selecting-data

Pluralsight

Indexing and Selecting Data | Pluralsight

Pluralsight Guides

1.76K views07:12

Datalytics

Принес вам небольшую шпаргалку по numpy https://www.kaggle.com/emstrakhov/numpy-quick-reference

Kaggle

NumPy: quick reference

Explore and run machine learning code with Kaggle Notebooks | Using data from Cardiovascular Disease dataset

1.67K views12:00

Datalytics

Алексей Куличевский написал статью о том как сделать когортный анализ в Pandas. Как всегда подробно и круто! http://smysl.io/blog/pandas-cohorts/

smysl.io

Когортный анализ в Pandas

1.67K views06:38

Datalytics

Интересный пример скрэпинга туториалов с сайта DataCamp с помощью BeautifulSoup и дальнейшего анализа с применением Pandas и Seaborn. https://www.datacamp.com/community/tutorials/tutorial-python-beautifulsoup-datacamp-tutorials

Datacamp

Web Scraping using Python (and Beautiful Soup)

Learn how to extract data from the web with Beautiful Soup, manipulate and clean data using Python's Pandas library, and data visualization using Python's Matplotlib library.

1.54K views09:50

Datalytics

Ответы на вопрос "Почему Python такой плохой язык программирования?". Ожидаемо, что ругаются на то какой он медленный, на табуляции и на динамическую типизацию. А ещё некоторым людям не нравится слишком дружелюбное сообщество и то, что порог входа в Python слишком низкий, настолько низкий, что его даже советуют изучать детям! Ужас какой-то, программисты на Perl явно негодуют. https://www.quora.com/Why-is-python-so-bad

Quora

Why is python so bad? - Quora

It isn’t bad, it’s certainly useful for some projects. I like it for smaller tasks that I’d otherwise do in shell scripts. I also find it to be the best pocket calculator in existence (a CLI with python will do that job far better than any pocket ...

1.51K views07:26

Datalytics

tg_image_250679840.jpeg

29.2 KB

А давайте немного поразгадываем головоломки. Что делает вот такой кусок кода? Правильный ответ выложу завтра в 15:00, к этому времени все успеют попробовать запустить🙃

2.26K views20:57

Datalytics

Классный ноутбук с подробными комментариями, объясняющий основы разведочного анализа данных на примере данных о сердечно-сосудистых заболеваниях. Рекомендую ознакомиться, написано всё интересно и качественно👍https://www.kaggle.com/emstrakhov/lesson-1-eda-with-pandas

Kaggle

Lesson 1. EDA with Pandas

Explore and run machine learning code with Kaggle Notebooks | Using data from Cardiovascular Disease dataset

1.49K views09:08

Datalytics

Отвечая на вопрос о вчерашней головоломке. Этот код задает в колонке some_column значение, равное 1, для 10% случайно выбранных строк датафрейма. Мне кажется, что для новичков будет полезным детально рассмотреть как работает эта строчка кода, потому что там зарыто много мелких неочевидных нюансов. Написал про это статью: http://datalytics.ru/all/golovolomka-pro-randomny-sempl/

datalytics.ru

Головоломка про рандомный сэмпл

Иногда чтение чужого кода бывает крайне интересным и увлекательным, будто читаешь отличный нон-фикшн

1.37K views13:07

Datalytics

Подробный гайд по визуализации данных с помощью Seaborn.

Лично мне Seaborn нравится больше, чем matplotlib, какие-то более аккуратные графики в нём получаются, даже если использовать дефолтные визуализации.

https://elitedatascience.com/python-seaborn-tutorial

EliteDataScience

The Ultimate Python Seaborn Tutorial: Gotta Catch 'Em All

In this step-by-step Python Seaborn tutorial, you'll learn how to use one of Python's most convenient libraries for data visualization.

1.64K viewsedited 09:23

Datalytics

Перевод статьи из блога DataQuest о том как использовать Pandas для анализа тяжелых датасетов. Рассматриваются методики преобразования типов к более легковесным, оптимизация хранения объектных типов с помощью их преобразования к категориальным типам. В итоге, на тестовом датасете получилось на 90% снизить объем памяти, нужной для хранения датасета. https://habr.com/ru/company/ruvds/blog/442516/

Хабр

Руководство по использованию pandas для анализа больших наборов данных

При использовании библиотеки pandas для анализа маленьких наборов данных, размер которых не превышает 100 мегабайт, производительность редко становится проблемой. Но когда речь идёт об исследовании...

1.65K views08:05

Datalytics

Небольшой туториал о том как получить статистику из API Яндекс.Директа с помощью несложного скрипта

https://habr.com/ru/post/449392/

Хабр

Получение статистики по всем клиентам из API Яндекс Директ в разрезе дней с помощью Python

В работе часто использую короткую статистику в разрезе дней чтобы отслеживать отклонения трафика. Более подробно о написании запросов написал в статье « Получе...

1.48K views07:46

Datalytics

Наткнулся на интересную утилиту csvkit.

Это набор инструментов, вызываемых из командной строки, позволяющих быстро производить рутинные операции с csv.
Так csvkit умеет конвертировать csv в json и обратно, читать xlsx-файлы, находить строки, соответствующие условию, вытягивать и передавать данные в БД. Ну и ещё много всего. Почитайте доку, там интересно

https://csvkit.readthedocs.io/en/latest/

1.58K views09:26

About

Blog

Apps

Platform