数学建模——数据分析方法
生活随笔
收集整理的这篇文章主要介绍了
数学建模——数据分析方法
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
一、常见数据分析软件
Excel(office三件套之一)、R语言、Eviews、origin(图形分析工具)、SPSS(统计分析与数据挖掘)
MATLAB(墙裂推荐)、python(墙裂推荐)、SAS
二、统计性描述
(与传统的方差不同,这里除以的是n-1)
sk=1n∑i=1n(xi−xˉ)3s3s_{k}=\frac{\frac{1}{n} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{3}}{s^{3}}sk=s3n1∑i=1n(xi−xˉ)3
三、数据的预处理
- 删掉这条数据:df.dropna(axis=0,how="any",inplace=False)
- 用均值填充:
- 用中位数来填补
- 用众数来填补
最大最小值标准化和均值标准化
xi′=xi−xminxmax−xminxi′=xi−xsx_{i}^{\prime}=\frac{x_{i}-x_{\min }}{x_{\max }-x_{\min }} \quad x_{i}^{\prime}=\frac{x_{i}-x}{s}xi′=xmax−xminxi−xminxi′=sxi−x # 最大最小值标准化def max_min_std(data):m_max = data.max(axis=0)m_min = data.min(axis=0)data = (data - m_min)/(m_max-m_min)return data#均值标准化def mean_std(data):m_mean = data.mean(axis=0)m_std = data.std(axis=0)data = (data - m_mean)/m_stdreturn data
四、相关性分析
1. pearson相关系数(df.corr(method = )):
r=∑i=1n(xi−xˉ)(yi−yˉ)∑i=1n(xi−xˉ)2∑i=1n(yi−yˉ)2r=\frac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sqrt{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2} \sum_{i=1}^{n}\left(y_{i}-\bar{y}\right)^{2}}}r=∑i=1n(xi−xˉ)2∑i=1n(yi−yˉ)2∑i=1n(xi−xˉ)(yi−yˉ)
2. spearman,kendall相关系数
1. 当R>0时,正相关,R<0时,负相关
2. R的绝对值越接近1,表示两个变量越接近线性关系
3. R的绝对值越接近0,表示两个变量越没有相关系
4. R的绝对值大于0.8时,视为高度相关
5. R的绝对值介于0.5~0.8时,视为中度相关
6. R的绝对值小于0.3时,视为不相关
五、回归分析
y=β0+β1x1+β2x2+…+βpxp+εy=\beta_{0}+\beta_{1} x_{1}+\beta_{2} x_{2}+\ldots+\beta_{p} x_{p}+\varepsilony=β0+β1x1+β2x2+…+βpxp+ε
其中的βi\beta_{i}βi是回归系数
总结
以上是生活随笔为你收集整理的数学建模——数据分析方法的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 华南理工计算机电路基础试题,华南理工计算
- 下一篇: java开源社区 推荐_13 个最火的