当前位置：首页 > 编程资源 > 编程问答 >内容正文

编程问答

数据分析（排序，数据特征、平均数、方差等，累计统计，相关分析）

发布时间：2025/3/21 编程问答 29 豆豆

生活随笔收集整理的这篇文章主要介绍了数据分析（排序，数据特征、平均数、方差等，累计统计，相关分析）小编觉得挺不错的,现在分享给大家,帮大家做个参考.

# hanbb # come on!!! import pandas as pd import numpy as np import matplotlib.pyplot as pltdf = pd.DataFrame(np.arange(12).reshape(3,4),index=['b','a','c'],columns=['2nd','1st','4or','3rd']) print(df) # 排序# 根据行列排序 print(df.sort_index(axis=0,ascending=True)) # 默认是列索引，升序 print(df.sort_index(axis=1)) # 行索引# 根据某行或者某列的值排序 print(df.sort_values('1st')) # 默认是列,升序列 print(df.sort_values('a',axis=1,ascending=False)) # 改为行，降序# 求和 print(df.sum()) print(df.sum(axis=1)) # 累计求和 print(df.cumsum()) print(df.cumsum(axis=1)) # 数量 print(df.count()) print(df.count(axis=1))# 数据操作 print(df.mean()) # 平均数 print(df.median()) # 中位数 print(df.max()) # 最大值 print(df.min()) # 最小值 print(df.var()) # 方差 print(df.std()) # 标准差# 数据特征 a = df.describe() # 求出所有的数据特征 print(a.ix['max']) # ix 怎么用？？？# 累计操作 print(df.cumsum()) # 累计求和 print(df.cumprod()) # 累计乘积 print(df.cummax()) # 累计最大值 print(df.cummin()) # 累计最小值# 累计统计，滚动分布 print(df.rolling(2).sum()) # 相邻2个元素的和 print(df.rolling(2).mean()) # 相邻2个元素的平均值 print(df.rolling(2).var()) # 相邻2个元素的方差 print(df.rolling(2).std()) # 相邻2个元素的标准 print(df.rolling(2).min()) # 相邻2个元素的最小值 print(df.rolling(2).max()) # 相邻2个元素的最大值# 相关分析 df1 = pd.Series(np.arange(1,5),index=['a','b','c','d']) # 1.66666666667 df2 = pd.Series(np.arange(5,9),index=['a','b','c','d']) # 1.0# plt.plot(df1.values) # plt.plot(df2.values) # plt.show()print(df1.cov(df2)) # 协方差，正相关>0,负相关<0,无关=0 print(df1.corr(df2)) # pearson 相关 0.8到1极强相关，0.6-0.8强相关；0.4-0.6中等相关；0.2-0.4弱相关，0-0.2极弱相关或无关 df3 = pd.Series(np.random.randint(1,5),index=['a','b','c','d']) # 0.0 df4 = pd.Series(np.random.randint(5,9),index=['a','b','c','d']) # nan print(df3.cov(df4)) print(df3.corr(df4)) print(df3) print(df4) plt.scatter(df3.values,df4.values) plt.show()

转载于:https://www.cnblogs.com/hanbb/p/7861766.html

总结

以上是生活随笔为你收集整理的数据分析（排序，数据特征、平均数、方差等，累计统计，相关分析）的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇： js格式化文件大小, 输出成带单位的字符
下一篇：用CRT查找内存泄漏