欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程语言 > python >内容正文

python

python观察日志(part28)--数据的加载与存储

发布时间:2023/12/19 python 33 豆豆
生活随笔 收集整理的这篇文章主要介绍了 python观察日志(part28)--数据的加载与存储 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

学习笔记,仅供参考,有错必究
参考文献:编码问题:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb3 in position;


数据的加载与存储

文本文件的加载与存储

# 导入常用的包 import numpy as np import matplotlib.pyplot as plt # 支持多行输出 from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = 'all' #默认为'last'# windows环境下中文的正常显示(Linux中不够的,需要修改字体后重新加载) plt.rcParams['font.sans-serif']=['SimHei'] #用来正常坐标轴的数字的负号 plt.rcParams['axes.unicode_minus']=False

读取csv文件

# 利用pandas读取csv文件 import pandas as pd data = pd.read_csv('./data/test.csv', encoding='gb18030') # 读取前5行 data.head() 城市人均地区生产总值(元)第三产业占GDP比重人均地方财政收入对外贸易系数01234
上海7898959.3618135.9134701.292077
南京市6745551.316899.4712360.558394
无锡市10736541.308931.9080850.615872
徐州市2510037.291716.1892630.065778
常州市7013839.625999.9110670.418762
# 跳过第2行读取(注意,第一行为行名) data = pd.read_csv('./data/test.csv', encoding='gb18030', skiprows=[1]) data.head() 城市人均地区生产总值(元)第三产业占GDP比重人均地方财政收入对外贸易系数01234
南京市6745551.316899.4712360.558394
无锡市10736541.308931.9080850.615872
徐州市2510037.291716.1892630.065778
常州市7013839.625999.9110670.418762
苏州市12256539.4111766.8051001.821834
# 指定分隔符读取 data = pd.read_csv('./data/test.csv', encoding='gb18030', sep = ',') data.head() 城市人均地区生产总值(元)第三产业占GDP比重人均地方财政收入对外贸易系数01234
上海7898959.3618135.9134701.292077
南京市6745551.316899.4712360.558394
无锡市10736541.308931.9080850.615872
徐州市2510037.291716.1892630.065778
常州市7013839.625999.9110670.418762
# 读取文件时指定列名 data = pd.read_csv('./data/test.csv', encoding='gb18030', names = ['city', 'a', 'b', 'c', 'd']) data.head() cityabcd01234
城市人均地区生产总值(元)第三产业占GDP比重人均地方财政收入对外贸易系数
上海7898959.3618135.913471.292076869
南京市6745551.316899.4712360.558393574
无锡市10736541.38931.9080850.615871884
徐州市2510037.291716.1892630.065778095

存储csv文件

# 使用to_csv函数存储csv文件 df = pd.DataFrame(np.array(range(12)).reshape((6, 2)), columns = ['A', 'B']) df.to_csv('./output/test_output.csv') df.to_csv('./output/test_output2.csv', '|')

除了读取csv文件以外,还可以通过read_json(),read_html等方式读取json,html等文件;to_json(),to_html()等方式写出json,html等文件.

Excel表格

读取Excel文件

# 利用pandas读取excel文件 # 方式1 data1 = pd.read_excel("./data/test_excel.xlsx", 'Sheet1') # 方式2 excel = pd.ExcelFile("./data/test_excel.xlsx") data2 = pd.read_excel(excel, "Sheet2") print("data1: \n", data1) print("data2: \n", data2) data1: ID Name Age 0 1 Ada 19 1 2 Tim 20 2 3 Huang 21 3 4 Black 22 4 5 Jam 23 5 6 Pick 24 6 7 Julia 25 7 8 Kattle 26 data2: ID Wage 0 1 15000 1 2 12000 2 3 13000 3 4 10000 4 5 3000 5 6 5000 6 7 8000 7 8 9000

写出Excel文件

data1 = data1[:5] data1 data2 = data2[:6] data2# 创建新的Excel excel = pd.DataFrame() excel.to_excel("./output/test_output3.xlsx")# 打开Excel,写入数据 writer = pd.ExcelWriter("./output/test_output3.xlsx") data1.to_excel(writer, "Sheet1") data2.to_excel(writer, "Sheet2")# 最后一定要保存writer中的数据至Excel writer.save() IDNameAge01234
1Ada19
2Tim20
3Huang21
4Black22
5Jam23
IDWage012345
115000
212000
313000
410000
53000
65000

总结

以上是生活随笔为你收集整理的python观察日志(part28)--数据的加载与存储的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。