欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程语言 > python >内容正文

python

pearsonr() python_Python 来算算一线城市的二手房价格指数相关性

发布时间:2025/3/19 python 30 豆豆
生活随笔 收集整理的这篇文章主要介绍了 pearsonr() python_Python 来算算一线城市的二手房价格指数相关性 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

Python中有很多方法计算相关性,scipy中有自带的分析工具,pandas里也有非常方便的多变量相关性分析。我们今天就讲讲这两个工具的用法。

1.数据收集

本文北上广深的数据采集自东方财富网,以二手房价格指数为例:

数据从2011年1月1日开始,每个数据点是当时一个月的价格指数,采集方法是用开发者工具找到请求发回来的JSON数据,方法如下:

数据如下(2011/1/1-2019/10/1):

# 北京:

2.准备工作

首先,你要确保你的电脑安装了Python,如果没有可以看这篇文章:超详细安装Python指南。

然后,打开CMD(开始-运行-cmd),或者Terminal(macOS) 输入以下指令安装scipy和pandas.

pip install scipy pip install pandas

3.编写代码

3.1 scipy计算相关性

scipy计算相关性其实非常简单,引入包的stats模块:

import scipy.stats as stats

然后调用函数进行计算:

# 计算广州和深圳二手房价格指数相关性 print(stats.pearsonr(gz, sz))

结果如下:

F:push20191130>python 1.py (0.4673289851643741, 4.4100775485723706e-07)

什么?!!广州和深圳的二手房价格指数相关性竟然才0.46?那其他一线城市和深圳对比呢?

不过,stats麻烦的地方就在于,它一次只能对比两个值,不能一次性两两对比四个一线城市,别着急,有个模块可以。

3.2 pandas一次性两两对比计算相关性

首先引入pandas:

import pandas as pd

创建DataFrame存放四个数据:

df = pd.DataFrame() df['北京'] = bj df['上海'] = sh df['广州'] = gz df['深圳'] = sz

最后相关性计算:

print(df.corr())

来看看结果:

wow,看来深圳的二手房价还真是与众不同,不过从下面这个图看,确实,深圳的二手房价格和北京的二手房价格已经出现了背离的情况。

个人认为,这个背离和最近的一系列政策及香港局势有关,但当前严峻的金融形势下,不会持续太久。

我们的文章到此就结束啦,如果你希望我们今天的Python 教程,请持续关注我们,如果对你有帮助,麻烦在下面点一个赞/在看哦

有任何问题都可以在下方留言区留言,我们都会耐心解答的!


​Python实用宝典 (pythondict.com)
不只是一个宝典
欢迎关注公众号:Python实用宝典

总结

以上是生活随笔为你收集整理的pearsonr() python_Python 来算算一线城市的二手房价格指数相关性的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。