生活随笔
收集整理的这篇文章主要介绍了
python观察日志(part28)--数据的加载与存储
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
学习笔记,仅供参考,有错必究
参考文献:编码问题:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb3 in position;
数据的加载与存储
文本文件的加载与存储
import numpy
as np
import matplotlib
.pyplot
as plt
from IPython
.core
.interactiveshell
import InteractiveShell
InteractiveShell
.ast_node_interactivity
= 'all'
plt
.rcParams
['font.sans-serif']=['SimHei']
plt
.rcParams
['axes.unicode_minus']=False
读取csv文件
import pandas
as pd
data
= pd
.read_csv
('./data/test.csv', encoding
='gb18030')
data
.head
()
城市人均地区生产总值(元)第三产业占GDP比重人均地方财政收入对外贸易系数
0| 上海 | 78989 | 59.36 | 18135.913470 | 1.292077 |
1| 南京市 | 67455 | 51.31 | 6899.471236 | 0.558394 |
2| 无锡市 | 107365 | 41.30 | 8931.908085 | 0.615872 |
3| 徐州市 | 25100 | 37.29 | 1716.189263 | 0.065778 |
4| 常州市 | 70138 | 39.62 | 5999.911067 | 0.418762 |
data
= pd
.read_csv
('./data/test.csv', encoding
='gb18030', skiprows
=[1])
data
.head
()
城市人均地区生产总值(元)第三产业占GDP比重人均地方财政收入对外贸易系数
0| 南京市 | 67455 | 51.31 | 6899.471236 | 0.558394 |
1| 无锡市 | 107365 | 41.30 | 8931.908085 | 0.615872 |
2| 徐州市 | 25100 | 37.29 | 1716.189263 | 0.065778 |
3| 常州市 | 70138 | 39.62 | 5999.911067 | 0.418762 |
4| 苏州市 | 122565 | 39.41 | 11766.805100 | 1.821834 |
data
= pd
.read_csv
('./data/test.csv', encoding
='gb18030', sep
= ',')
data
.head
()
城市人均地区生产总值(元)第三产业占GDP比重人均地方财政收入对外贸易系数
0| 上海 | 78989 | 59.36 | 18135.913470 | 1.292077 |
1| 南京市 | 67455 | 51.31 | 6899.471236 | 0.558394 |
2| 无锡市 | 107365 | 41.30 | 8931.908085 | 0.615872 |
3| 徐州市 | 25100 | 37.29 | 1716.189263 | 0.065778 |
4| 常州市 | 70138 | 39.62 | 5999.911067 | 0.418762 |
data
= pd
.read_csv
('./data/test.csv', encoding
='gb18030', names
= ['city', 'a', 'b', 'c', 'd'])
data
.head
()
cityabcd
0| 城市 | 人均地区生产总值(元) | 第三产业占GDP比重 | 人均地方财政收入 | 对外贸易系数 |
1| 上海 | 78989 | 59.36 | 18135.91347 | 1.292076869 |
2| 南京市 | 67455 | 51.31 | 6899.471236 | 0.558393574 |
3| 无锡市 | 107365 | 41.3 | 8931.908085 | 0.615871884 |
4| 徐州市 | 25100 | 37.29 | 1716.189263 | 0.065778095 |
存储csv文件
df
= pd
.DataFrame
(np
.array
(range(12)).reshape
((6, 2)), columns
= ['A', 'B'])
df
.to_csv
('./output/test_output.csv')
df
.to_csv
('./output/test_output2.csv', '|')
除了读取csv文件以外,还可以通过read_json(),read_html等方式读取json,html等文件;to_json(),to_html()等方式写出json,html等文件.
Excel表格
读取Excel文件
data1
= pd
.read_excel
("./data/test_excel.xlsx", 'Sheet1')
excel
= pd
.ExcelFile
("./data/test_excel.xlsx")
data2
= pd
.read_excel
(excel
, "Sheet2")
print("data1: \n", data1
)
print("data2: \n", data2
)
data1: ID Name Age
0 1 Ada 19
1 2 Tim 20
2 3 Huang 21
3 4 Black 22
4 5 Jam 23
5 6 Pick 24
6 7 Julia 25
7 8 Kattle 26
data2: ID Wage
0 1 15000
1 2 12000
2 3 13000
3 4 10000
4 5 3000
5 6 5000
6 7 8000
7 8 9000
写出Excel文件
data1
= data1
[:5]
data1
data2
= data2
[:6]
data2
excel
= pd
.DataFrame
()
excel
.to_excel
("./output/test_output3.xlsx")
writer
= pd
.ExcelWriter
("./output/test_output3.xlsx")
data1
.to_excel
(writer
, "Sheet1")
data2
.to_excel
(writer
, "Sheet2")
writer
.save
()
IDNameAge
0| 1 | Ada | 19 |
1| 2 | Tim | 20 |
2| 3 | Huang | 21 |
3| 4 | Black | 22 |
4| 5 | Jam | 23 |
IDWage
0| 1 | 15000 |
1| 2 | 12000 |
2| 3 | 13000 |
3| 4 | 10000 |
4| 5 | 3000 |
5| 6 | 5000 |
总结
以上是生活随笔为你收集整理的python观察日志(part28)--数据的加载与存储的全部内容,希望文章能够帮你解决所遇到的问题。
如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。