Zen of Python
20.1K subscribers
1.16K photos
157 videos
32 files
3.09K links
Полный Дзен Пайтона в одном канале

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Сайт: https://tprg.ru/site

Регистрация в перечне РКН: https://tprg.ru/xZOL
Download Telegram
Индексация и отбор данных в Pandas

В Pandas существует несколько способов выбора данных — DataFrame или Series. Поскольку документация у этой библиотеки не самая простая, то разобраться может быть не просто. Да и понять, когда воспользоваться тем или иным лучше, тоже не всегда очевидно.

В этой статье автор подробно разбирает примеры использования различных методов индексации и отбора данных:

https://tprg.ru/ZiUS

#pandas
Чтение и запись HTML-таблиц с помощью Pandas

Python имеет обширные возможности и подходит не только для машинного обучения, но и для веб-разработки. Так, с помощью библиотеки Pandas мы можем взаимодействовать с HTML, например, читая и записывая различные данные.

В этой статье мы поработаем с HTML-таблицами, используя Pandas:

https://tprg.ru/WEOe

#pandas
Срезы в Pandas

Это вторая часть статьи об индексации и работе с данными. В первой части автор прошёлся по основам работы с данными, а теперь он расскажет непосредственно о создании срезов и возможных проблемах с этим:

https://tprg.ru/AYr3

#pandas
Новая библиотека превосходит Pandas по производительности

Pandas возникла в 2008 году и на сегодняшний день является крайне популярной, если речь идёт о Data Science. Но ничто не вечно под луной и вот, появилась новая библиотека pypolars, которая уже сейчас может конкурировать с Pandas как минимум в плане производительности.

В этой статье провели сравнительные тесты скорости отработки одних и тех же действий с помощью этих двух библиотек и результаты заставляют задуматься:

https://tprg.ru/qvjG

#datascience #pandas
10 советов при работе с Pandas в Python

В этой статье собраны несколько полезных, но не всегда очевидных трюков, которые помогут работать с Pandas:

https://tprg.ru/7Dy8

#pandas
Загрузка данных SQL в Pandas без нехватки памяти

Если вы попытаетесь загрузитесь слишком большой объём данных в Pandas из SQL, то велика вероятность, что вашему компьютеру просто не хватит оперативной памяти, чтобы обработать такой запрос.

Этой проблемы можно избежать и в этой статье вы узнаете как:

https://tprg.ru/Rqst

#pandas #sql
9 первоклассных функций Pandas Python для работы с данными

Pandas — мощная и одна из самых популярных библиотек при работе с данными, машинном обучении и ИИ. В этой статье представлены 9 функций, которые продемонстрируют его возможности и заставят полюбить его:

https://tprg.ru/YTmK

#pandas
Как правильно сортировать данные в Pandas

В этой статье вы узнаете, как сортировать датафреймы Pandas по нескольким столбцам с помощью метода sort_values, а также по индексам методом sort_index.

Подробности:

https://tprg.ru/y3kT

#pandas
Добавление нового столбца в существующий DataFrame в Pandas

Держите небольшой гайд с пятью способами добавления нового столбца в Pandas. Вы узнаете, как это сделать с помощью DataFrame.insert(), DataFrame.assign(), pandas.concat() и не только.

Подробнее:

https://itsmycode.com/adding-new-column-to-existing-dataframe-in-pandas/

#pandas
​​25 возможностей Pandas, о которых вы не знали

Возможно, что некоторые возможности вам и известны, но многие из них являются новыми и малоизвестными. Поэтому рекомендуем вам быстро пробежаться по списку и найти для себя что-то новое и полезное:

https://proglib.io/p/25-vozmozhnostey-pandas-o-kotoryh-vy-ne-znali-2022-02-28

#pandas
Работа с отсутствующими значениями в Pandas

Отсутствующее значение в наборе данных отображается как вопросительный знак, ноль, NaN или просто пустая ячейка. Но как можно справиться с недостающими данными?

На самом деле есть много способов. В этой статье рассмотрены типичные варианты на примере набора данных «Titanic». Эти данные являются открытым набором данных Kaggle. Подробнее:

https://habr.com/ru/post/663414/

#pandas #datascience
Пакетная обработка 22 ГБ данных о транзакциях с помощью Pandas

С большими наборами данных работать сложно, особенно при отсутствии необходимых ресурсов. Если вы не располагаете достаточно мощным компьютером, то решить проблему такой обработки можно с помощью фрагментации данных. Как это сделать можно узнать здесь:

https://nuancesprog.ru/p/15805/

#datascience #pandas
Анализ данных на Python с помощью Pandas

Сегодня данные присутствуют во всех сферах жизни, будь то медицинские исследования или данные технологической компании. Независимо от того, с какими данными вы работаете, вы должны знать, как фильтровать и анализировать ваши данные. 

В этой статье вы познакомитесь с одним из популярных инструментов анализа данных в Python:

https://www.askpython.com/python-modules/pandas/data-analysis

#pandas
Как получить данные в нужном формате с помощью Pandas

Специалистам по данным постоянно приходится приводить данные в нужный им вид. Иногда, очищая от лишнего, в других случаях меняя формат данных. Чаще всего применяются два формата данных: длинный и широкий.

В этой статье вы рассмотрите несколько примеров, чтобы понять, как именно выглядит каждый формат данных, а затем посмотрите, как конвертировать один формат в другой с помощью Pandas:

https://nuancesprog.ru/p/16466/

#pandas #datascience
Гайд по обработке данных с помощью Pandas

Отличное руководство для новичков и тех, кто постоянно работает с Pandas. В статье досконально описаны стандартные методы фильтрации, объединения, приведения типов и другие операции, но даже для гуру найдётся пара новых приёмов. Вау-эффект гарантирован.

#pandas
Продолжение бомбического гайда по работе с Pandas

Продолжение статьи от руководителя группы видеоаналитики MTS AI Андрея Дугина про библиотеку Pandas. На сей раз вы узнаете, чем отличается представление (view) от копии (copy) датафрейма, как наконец избавиться от SettingWithCopyWarning (‘a value is trying to be set on a copy of a slice from a DataFrame’), и почему цепочка методов не является оптимальным решением с точки зрения расходования памяти.

Статья

#pandas #лучшиепрактики
​​Квиз про сводные таблицы на Python

Небольшая бесплатная викторина на 10 вопросов с небезызвестного realpython.com про pivot tables на pandas. Перед прохождением освежить материал можно по ссылке.

NB! Если хотите сохранить результат, предварительно авторизуйтесь.

#квиз #pandas

@zen_of_python
pandas_cheatsheet.pdf
2.6 MB
Полезная шпаргалка по Pandas

В этом файле вы найдёте несколько страниц полезных шпаргалок по базовым командам и конкретным задачам.

#шпаргалка #pandas
Работаем с данными через GUI

Познакомившись с Bamboolib вы будете жалеть, что не узнали о ней раньше. Она позволяет работать с фреймами данных pandas через графический интерфейс, что сильно упрощает задачу.

Познакомиться с её возможностями подробнее и установить можно по ссылке:

https://pypi.org/project/bamboolib/#description

#библиотека #datascience #pandas
Гайд по обработке данных с помощью Pandas

Отличное руководство для новичков и тех, кто постоянно работает с Pandas. В статье досконально описаны стандартные методы фильтрации, объединения, приведения типов и другие операции, но даже для гуру найдётся пара новых приёмов. Вау-эффект гарантирован.

#гайд #pandas