欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程语言 > python >内容正文

python

月均数据_利用Python进行数据分析(附详细案例)

发布时间:2023/12/19 python 54 豆豆
生活随笔 收集整理的这篇文章主要介绍了 月均数据_利用Python进行数据分析(附详细案例) 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

一、前期准备

分析要用到两个包:NumPy和Pandas,首先确保jupyter中成功安装了这两个包。

#导入numpy包 import numpy as np #导入pandas包 import pandas as pd

二、基础知识

2.1 一维数据分析:NumPy

2.2 一维数据结构:Pandas

2.3 二维数据分析:numpy对应array

2.4 二维数据分析:pandas对应数据框DateFrame

此处遇到一个问题:读取Excel文件报错。

解决方法:

1 查看Excel文件存放路径

具体操作:点击文件名,鼠标右键,选择“属性”,找到下面标红的两个地方。

2 将上面标红的两处合成文件的路径,

格式为文件夹文件名,比如F:annUntitled1.ipynb

3 最后把路径中全部的斜杠(/)或者反斜杠()替换为双反斜杠()

最后的路径为F:annUntitled1.ipynb

三、Python具体案例分析:药店销售数据

3.1 提出问题

分析指标:

  • 月均消费次数
  • 月均消费金额
  • 客单件
  • 消费趋势

3.2 理解数据

3.3 清洗数据

3.3.1 选择子集

3.3.2 列名重命名

3.3.3 缺失数据处理(dropna()函数)

Python缺失值有3种:None,NA,NaN。(分析数据时,如果遇到什么错误,比如float错误,就要考虑是否为缺失值,若是,则需要处理掉)。

  • Python内置的None值;
  • pandas中,将缺失值表示 为NA,表示不可用not available;
  • 对应数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据;
  • None和NaN的区别:None是Python的一种数据类型(NoneType),NaN是浮点类型(float),两个都用作空值。

    3.3.4 数据类型转换

    3.3.5 数据排序

    3.3.6 异常值处理

    3.4 构建模型

    3.4.1 指标1:月均消费次数=总消费次数/月份数

    3.4.2 指标2:月均消费金额=总消费金额/月份数

    3.4.3 指标3:客单价=总消费金额/总消费次数

    客单价(per customer transaction):商场(超市)每位顾客平均购买商品的金额,即是平均交易金额。

    3.4.3 消费趋势

    End.

    总结

    以上是生活随笔为你收集整理的月均数据_利用Python进行数据分析(附详细案例)的全部内容,希望文章能够帮你解决所遇到的问题。

    如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。