欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH571A R语言回归分析实践 一元回归2 NBA球员的工资

发布时间:2025/4/14 编程问答 55 豆豆
生活随笔 收集整理的这篇文章主要介绍了 UA MATH571A R语言回归分析实践 一元回归2 NBA球员的工资 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

UA MATH571A R语言回归分析实践 一元回归2 NBA球员的工资

  • 方差分析
  • 相关性分析

上一讲完成了解释NBA球员工资的一个简单的一元线性回归模型的估计、分析,展示了一下简单的预测,这一讲我们的问题是一元线性回归模型够好了吗?上一讲做出来的结果所反映的主要的问题是系数是显著不为0的(非常小的p值),但模型的解释力不高(只有18%多一点的解释力)。这一讲我们希望先验证一下球员Draft Number和工资之间的负向关系是不是真的存在,如果真的存在的话,我们希望解释为什么名次对工资的解释力会很低,是因为数据并非线性关系还是正态假设不成立?

方差分析

首先我们用方差分析看看工资的信息都到哪里去了,对回归用ANOVA分析我们只需要用R语言的anova函数输入模型对象就可以了,

> anova(ureg01.lm) Analysis of Variance TableResponse: YDf Sum Sq Mean Sq F value Pr(>F) X 1 6.0811e+15 6.0811e+15 150.12 < 2.2e-16 *** Residuals 649 2.6290e+16 4.0508e+13 --- Signif. codes: 0***0.001**0.01*0.05.0.1 ‘ ’ 1

我们这个回归模型解释变量是X,它占一个自由度,一共651个样本,也就是650个自由度,所以残差占649个自由度,这是第一列df告诉我们的信息。第二列是平方和的分解,第一个数是回归平方和,第二个数是残差平方和,平方和也可以理解成被解释变量,也就是球员工资的信息,很显然在这个一元线性回归中,解释变量X能解释的信息比残差中的信息少一个数量级,大部分信息模型都解释不了,都在残差中了。第三列就是第二列除以对应的第一列,是自由度调整以后的平方和,第四列是F统计量,这个F统计量就是上一讲回归结果中最后那一行的F统计量,只是ANOVA给出了这个统计量的计算细节,它等于第三列的第一个数除以第二个数。最后一列是F统计量的p值。方差分析的结果是对R方告诉我们的信息,即名次对工资的解释力不足的更细致的说明。

相关性分析

相关性分析与回归的逻辑不一样,相关性分析把两个变量都看成随机变量,分析他们的相关性系数。

> alpha <- .05 > N <- length(Y) > r12 <- cor(X,Y) > r12 [1] -0.4334236 > t <- r12*sqrt(N-2)/sqrt(1-r12^2) > t [1] -12.25232 > t < -qt(1-alpha/2,N-2) [1] TRUE > p <- pt(t,N-2) > p [1] 1.70131e-31

先用PPMCC来分析,第一行定义显著性水平,r12给出了相关性系数的值是-0.4334236,这说明名次和工资之间的确是存在负相关的,这个相关性系数的t统计量是-12.25232,它比5%的显著性水平要求的判别值更小,并且p值非常的小,说明我们可以拒绝这个t检验的原假设,认同相关性系数是显著异于0的。但PPMCC有一个缺陷,他需要正态分布假设,我们尚且对残差是否是正态的存疑,这里又用需要正态假设的检验显然不太合理。因此一个更好的选择是Spearman秩相关检验,这个检验不需要某种具体的分布形式,所以得出的结果会比PPMCC更合理。在R语言中,用cor.test,选择method为spearman就可以做这个检验:

> cor.test(X,Y,method = "spearman",exact = F)Spearman's rank correlation rhodata: X and Y S = 72838840, p-value < 2.2e-16 alternative hypothesis: true rho is not equal to 0 sample estimates:rho -0.5840626

S是Spearman秩相关检验的统计量,对应的p值是非常小的,所以可以拒绝相关性为0的原假设,认同名次与工资之间存在相关性,最后一个数-0.5840626告诉我们他们之间的相关性为负。这两个检验进一步说明了名次和工资之间是存在相关性的,之所以模型解释力不足可能是模型假设不成立或者模型设定不合理。

《新程序员》:云原生和全面数字化实践50位技术专家共同创作,文字、视频、音频交互阅读

总结

以上是生活随笔为你收集整理的UA MATH571A R语言回归分析实践 一元回归2 NBA球员的工资的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。