Индексация и отбор данных в Pandas
В Pandas существует несколько способов выбора данных —
В этой статье автор подробно разбирает примеры использования различных методов индексации и отбора данных:
https://tprg.ru/ZiUS
#pandas
В Pandas существует несколько способов выбора данных —
DataFrame
или Series
. Поскольку документация у этой библиотеки не самая простая, то разобраться может быть не просто. Да и понять, когда воспользоваться тем или иным лучше, тоже не всегда очевидно.В этой статье автор подробно разбирает примеры использования различных методов индексации и отбора данных:
https://tprg.ru/ZiUS
#pandas
Чтение и запись HTML-таблиц с помощью Pandas
Python имеет обширные возможности и подходит не только для машинного обучения, но и для веб-разработки. Так, с помощью библиотеки Pandas мы можем взаимодействовать с HTML, например, читая и записывая различные данные.
В этой статье мы поработаем с HTML-таблицами, используя Pandas:
https://tprg.ru/WEOe
#pandas
Python имеет обширные возможности и подходит не только для машинного обучения, но и для веб-разработки. Так, с помощью библиотеки Pandas мы можем взаимодействовать с HTML, например, читая и записывая различные данные.
В этой статье мы поработаем с HTML-таблицами, используя Pandas:
https://tprg.ru/WEOe
#pandas
Срезы в Pandas
Это вторая часть статьи об индексации и работе с данными. В первой части автор прошёлся по основам работы с данными, а теперь он расскажет непосредственно о создании срезов и возможных проблемах с этим:
https://tprg.ru/AYr3
#pandas
Это вторая часть статьи об индексации и работе с данными. В первой части автор прошёлся по основам работы с данными, а теперь он расскажет непосредственно о создании срезов и возможных проблемах с этим:
https://tprg.ru/AYr3
#pandas
Новая библиотека превосходит Pandas по производительности
В этой статье провели сравнительные тесты скорости отработки одних и тех же действий с помощью этих двух библиотек и результаты заставляют задуматься:
https://tprg.ru/qvjG
#datascience #pandas
Pandas
возникла в 2008 году и на сегодняшний день является крайне популярной, если речь идёт о Data Science. Но ничто не вечно под луной и вот, появилась новая библиотека pypolars
, которая уже сейчас может конкурировать с Pandas
как минимум в плане производительности.В этой статье провели сравнительные тесты скорости отработки одних и тех же действий с помощью этих двух библиотек и результаты заставляют задуматься:
https://tprg.ru/qvjG
#datascience #pandas
10 советов при работе с Pandas в Python
В этой статье собраны несколько полезных, но не всегда очевидных трюков, которые помогут работать с Pandas:
https://tprg.ru/7Dy8
#pandas
В этой статье собраны несколько полезных, но не всегда очевидных трюков, которые помогут работать с Pandas:
https://tprg.ru/7Dy8
#pandas
Загрузка данных SQL в Pandas без нехватки памяти
Если вы попытаетесь загрузитесь слишком большой объём данных в Pandas из SQL, то велика вероятность, что вашему компьютеру просто не хватит оперативной памяти, чтобы обработать такой запрос.
Этой проблемы можно избежать и в этой статье вы узнаете как:
https://tprg.ru/Rqst
#pandas #sql
Если вы попытаетесь загрузитесь слишком большой объём данных в Pandas из SQL, то велика вероятность, что вашему компьютеру просто не хватит оперативной памяти, чтобы обработать такой запрос.
Этой проблемы можно избежать и в этой статье вы узнаете как:
https://tprg.ru/Rqst
#pandas #sql
9 первоклассных функций Pandas Python для работы с данными
Pandas — мощная и одна из самых популярных библиотек при работе с данными, машинном обучении и ИИ. В этой статье представлены 9 функций, которые продемонстрируют его возможности и заставят полюбить его:
https://tprg.ru/YTmK
#pandas
Pandas — мощная и одна из самых популярных библиотек при работе с данными, машинном обучении и ИИ. В этой статье представлены 9 функций, которые продемонстрируют его возможности и заставят полюбить его:
https://tprg.ru/YTmK
#pandas
Как правильно сортировать данные в Pandas
В этой статье вы узнаете, как сортировать датафреймы Pandas по нескольким столбцам с помощью метода sort_values, а также по индексам методом sort_index.
Подробности:
https://tprg.ru/y3kT
#pandas
В этой статье вы узнаете, как сортировать датафреймы Pandas по нескольким столбцам с помощью метода sort_values, а также по индексам методом sort_index.
Подробности:
https://tprg.ru/y3kT
#pandas
Добавление нового столбца в существующий DataFrame в Pandas
Держите небольшой гайд с пятью способами добавления нового столбца в Pandas. Вы узнаете, как это сделать с помощью
Подробнее:
https://itsmycode.com/adding-new-column-to-existing-dataframe-in-pandas/
#pandas
Держите небольшой гайд с пятью способами добавления нового столбца в Pandas. Вы узнаете, как это сделать с помощью
DataFrame.insert()
, DataFrame.assign()
, pandas.concat()
и не только.Подробнее:
https://itsmycode.com/adding-new-column-to-existing-dataframe-in-pandas/
#pandas
25 возможностей Pandas, о которых вы не знали
Возможно, что некоторые возможности вам и известны, но многие из них являются новыми и малоизвестными. Поэтому рекомендуем вам быстро пробежаться по списку и найти для себя что-то новое и полезное:
https://proglib.io/p/25-vozmozhnostey-pandas-o-kotoryh-vy-ne-znali-2022-02-28
#pandas
Возможно, что некоторые возможности вам и известны, но многие из них являются новыми и малоизвестными. Поэтому рекомендуем вам быстро пробежаться по списку и найти для себя что-то новое и полезное:
https://proglib.io/p/25-vozmozhnostey-pandas-o-kotoryh-vy-ne-znali-2022-02-28
#pandas
Работа с отсутствующими значениями в Pandas
Отсутствующее значение в наборе данных отображается как вопросительный знак, ноль, NaN или просто пустая ячейка. Но как можно справиться с недостающими данными?
На самом деле есть много способов. В этой статье рассмотрены типичные варианты на примере набора данных «Titanic». Эти данные являются открытым набором данных Kaggle. Подробнее:
https://habr.com/ru/post/663414/
#pandas #datascience
Отсутствующее значение в наборе данных отображается как вопросительный знак, ноль, NaN или просто пустая ячейка. Но как можно справиться с недостающими данными?
На самом деле есть много способов. В этой статье рассмотрены типичные варианты на примере набора данных «Titanic». Эти данные являются открытым набором данных Kaggle. Подробнее:
https://habr.com/ru/post/663414/
#pandas #datascience
Пакетная обработка 22 ГБ данных о транзакциях с помощью Pandas
С большими наборами данных работать сложно, особенно при отсутствии необходимых ресурсов. Если вы не располагаете достаточно мощным компьютером, то решить проблему такой обработки можно с помощью фрагментации данных. Как это сделать можно узнать здесь:
https://nuancesprog.ru/p/15805/
#datascience #pandas
С большими наборами данных работать сложно, особенно при отсутствии необходимых ресурсов. Если вы не располагаете достаточно мощным компьютером, то решить проблему такой обработки можно с помощью фрагментации данных. Как это сделать можно узнать здесь:
https://nuancesprog.ru/p/15805/
#datascience #pandas
Анализ данных на Python с помощью Pandas
Сегодня данные присутствуют во всех сферах жизни, будь то медицинские исследования или данные технологической компании. Независимо от того, с какими данными вы работаете, вы должны знать, как фильтровать и анализировать ваши данные.
В этой статье вы познакомитесь с одним из популярных инструментов анализа данных в Python:
https://www.askpython.com/python-modules/pandas/data-analysis
#pandas
Сегодня данные присутствуют во всех сферах жизни, будь то медицинские исследования или данные технологической компании. Независимо от того, с какими данными вы работаете, вы должны знать, как фильтровать и анализировать ваши данные.
В этой статье вы познакомитесь с одним из популярных инструментов анализа данных в Python:
https://www.askpython.com/python-modules/pandas/data-analysis
#pandas
Как получить данные в нужном формате с помощью Pandas
Специалистам по данным постоянно приходится приводить данные в нужный им вид. Иногда, очищая от лишнего, в других случаях меняя формат данных. Чаще всего применяются два формата данных: длинный и широкий.
В этой статье вы рассмотрите несколько примеров, чтобы понять, как именно выглядит каждый формат данных, а затем посмотрите, как конвертировать один формат в другой с помощью Pandas:
https://nuancesprog.ru/p/16466/
#pandas #datascience
Специалистам по данным постоянно приходится приводить данные в нужный им вид. Иногда, очищая от лишнего, в других случаях меняя формат данных. Чаще всего применяются два формата данных: длинный и широкий.
В этой статье вы рассмотрите несколько примеров, чтобы понять, как именно выглядит каждый формат данных, а затем посмотрите, как конвертировать один формат в другой с помощью Pandas:
https://nuancesprog.ru/p/16466/
#pandas #datascience
Гайд по обработке данных с помощью Pandas
Отличное руководство для новичков и тех, кто постоянно работает с Pandas. В статье досконально описаны стандартные методы фильтрации, объединения, приведения типов и другие операции, но даже для гуру найдётся пара новых приёмов. Вау-эффект гарантирован.
#pandas
Отличное руководство для новичков и тех, кто постоянно работает с Pandas. В статье досконально описаны стандартные методы фильтрации, объединения, приведения типов и другие операции, но даже для гуру найдётся пара новых приёмов. Вау-эффект гарантирован.
#pandas
Продолжение бомбического гайда по работе с Pandas
Продолжение статьи от руководителя группы видеоаналитики MTS AI Андрея Дугина про библиотеку Pandas. На сей раз вы узнаете, чем отличается представление (view) от копии (copy) датафрейма, как наконец избавиться от
Статья
#pandas #лучшиепрактики
Продолжение статьи от руководителя группы видеоаналитики MTS AI Андрея Дугина про библиотеку Pandas. На сей раз вы узнаете, чем отличается представление (view) от копии (copy) датафрейма, как наконец избавиться от
SettingWithCopyWarning (‘a value is trying to be set on a copy of a slice from a DataFrame’)
, и почему цепочка методов не является оптимальным решением с точки зрения расходования памяти.Статья
#pandas #лучшиепрактики
Квиз про сводные таблицы на Python
Небольшая бесплатная викторина на 10 вопросов с небезызвестного realpython.com про pivot tables на pandas. Перед прохождением освежить материал можно по ссылке.
NB! Если хотите сохранить результат, предварительно авторизуйтесь.
#квиз #pandas
@zen_of_python
Небольшая бесплатная викторина на 10 вопросов с небезызвестного realpython.com про pivot tables на pandas. Перед прохождением освежить материал можно по ссылке.
NB! Если хотите сохранить результат, предварительно авторизуйтесь.
#квиз #pandas
@zen_of_python
pandas_cheatsheet.pdf
2.6 MB
Полезная шпаргалка по Pandas
В этом файле вы найдёте несколько страниц полезных шпаргалок по базовым командам и конкретным задачам.
#шпаргалка #pandas
В этом файле вы найдёте несколько страниц полезных шпаргалок по базовым командам и конкретным задачам.
#шпаргалка #pandas
Работаем с данными через GUI
Познакомившись с Bamboolib вы будете жалеть, что не узнали о ней раньше. Она позволяет работать с фреймами данных pandas через графический интерфейс, что сильно упрощает задачу.
Познакомиться с её возможностями подробнее и установить можно по ссылке:
https://pypi.org/project/bamboolib/#description
#библиотека #datascience #pandas
Познакомившись с Bamboolib вы будете жалеть, что не узнали о ней раньше. Она позволяет работать с фреймами данных pandas через графический интерфейс, что сильно упрощает задачу.
Познакомиться с её возможностями подробнее и установить можно по ссылке:
https://pypi.org/project/bamboolib/#description
#библиотека #datascience #pandas
Гайд по обработке данных с помощью Pandas
Отличное руководство для новичков и тех, кто постоянно работает с Pandas. В статье досконально описаны стандартные методы фильтрации, объединения, приведения типов и другие операции, но даже для гуру найдётся пара новых приёмов. Вау-эффект гарантирован.
#гайд #pandas
Отличное руководство для новичков и тех, кто постоянно работает с Pandas. В статье досконально описаны стандартные методы фильтрации, объединения, приведения типов и другие операции, но даже для гуру найдётся пара новых приёмов. Вау-эффект гарантирован.
#гайд #pandas