Представим что у на есть некоторый dataset c неопределенным количеством столбцов:
[..., 'Category', 'Region', 'Inventory Level', ...]
Задача: построить сводную таблицу (как на изображении), для отображения остатков (Inventory Level) во всех регионах для каждой категории и отобразить сумму остатков для каждой категории и каждого региона.
В Excel мы бы создали сводную таблицу, перетащили бы Category в область "Cтроки", Region в область "Столбцы", а Inventory Level в область "Значения".
import pandas as pd
df = pd.read_csv('retail_store_inventory.csv')
pivot_table = df.groupby(['Category', 'Region'])['Inventory Level'].sum().reset_index()
pivot_result = pivot_table.pivot(index='Category', columns='Region', values='Inventory Level')
pivot_result['Total'] = pivot_result.sum(axis=1)
pivot_result.loc['Total'] = pivot_result.sum(axis=0)
Dataset
Ссылка на набор данных
———
#python #pandas #data_analitycs #excel
Please open Telegram to view this post
VIEW IN TELEGRAM
data.rar
132.6 KB
В общем пытался устроится на должность аналитика данных в сеть магазинов, где я когда то поваром работал. Было бы забавно мне кажется. Так на любой вакансии, где есть пук про АЙ ТИ, конкуренция безумная, я решил не ограничиваться отправкой резюме.
Так как в вакансии было указано, что нужно знать pandas, я решил спарсить данные о продуктах с сайта и как раз с помощью pandas что то почистить, проанализировать. Бонусом сделал небольшую презентацию на 5 слайдов с не графиками и аналитикой.
В итоге даже не заслужил фразы "Мы одобрили другого кандидата, а ваше резюме отложили. Если вакансия снова откроется, то мы вам напишем".
Но никакого расстройства, прикольная практика вышла.
Репозиторий
Данные в прикрепе
———
#python #pandas #data_analitycs #resources #dataset
Please open Telegram to view this post
VIEW IN TELEGRAM