欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

对比Excel,学习pandas数据透视表

发布时间:2024/9/15 编程问答 47 豆豆
生活随笔 收集整理的这篇文章主要介绍了 对比Excel,学习pandas数据透视表 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

Excel中做数据透视表

① 选中整个数据源;

② 依次点击“插入”—“数据透视表”

③ 选择在Excel中的哪个位置,插入数据透视表

④ 然后根据实际需求,从不同维度展示结果

⑤ 结果如下

pandas用pivot_table()做数据透视表

1)语法格式

pd.pivot_table(data,index=None,columns=None,values=None,aggfunc='mean',margins=False,margins_name='All',dropna=True,fill_value=None)

2)对比excel,说明上述参数的具体含义

参数说明:

  • data 相当于Excel中的"选中数据源";

  • index 相当于上述"数据透视表字段"中的行;

  • columns 相当于上述"数据透视表字段"中的列;

  • values 相当于上述"数据透视表字段"中的值;

  • aggfunc 相当于上述"结果"中的计算类型;

  • margins 相当于上述"结果"中的总计;

  • margins_name 相当于修改"总计"名,为其它名称;

下面几个参数,用的较少,记住干嘛的,等以后需要就百度。

  • dropna 表示是否删除缺失值,如果为True时,则把一整行全作为缺失值删除;

  • fill_value 表示将缺失值,用某个指定值填充。

案例说明

1)求出不同品牌下,每个月份的销售数量之和

① 在Excel中的操作结果如下

② 在pandas中的操作如下

df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx") display(df.sample(5))df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month)) display(df.sample(5))df1 = pd.pivot_table(df,index="品牌",columns="月份",values="销售数量",aggfunc=np.sum) display(df1)

结果如下:

2)求出不同品牌下,每个地区、每个月份的销售数量之和

① 在Excel中的操作结果如下

② 在pandas中的操作如下

df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx") display(df.sample(5))df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month)) display(df.sample(5))df1 = pd.pivot_table(df,index="品牌",columns=["销售区域","月份"],values="销售数量",aggfunc=np.sum) display(df1)

结果如下:

3)求出不同品牌不同地区下,每个月份的销售数量之和

① 在Excel中的操作结果如下

② 在pandas中的操作如下

df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx") display(df.sample(5))df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month)) display(df.sample(5))df1 = pd.pivot_table(df,index=["品牌","销售区域"],columns="月份",values="销售数量",aggfunc=np.sum) display(df1)

结果如下:

4)求出不同品牌下的“销售数量之和”与“货号计数”

① 在Excel中的操作结果如下

② 在pandas中的操作如下

df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx") display(df.sample(5))df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month)) display(df.sample(5))df1 = pd.pivot_table(df,index="品牌",columns="月份",values=["销售数量","货号"],aggfunc={"销售数量":"sum","货号":"count"},margins=True,margins_name="总计") display(df1)

结果如下:

推荐阅读

Pandas处理数据太慢,来试试Polars吧!

懒人必备!只需一行代码,就能导入所有的Python库

绝!关于pip的15个使用小技巧

介绍10个常用的Python内置函数,99.99%的人都在用!

可能是全网最完整的 Python 操作 Excel库总结!

总结

以上是生活随笔为你收集整理的对比Excel,学习pandas数据透视表的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。