Python使用pandas处理CSV文件的实例讲解
作者:CosetteQi 时间:2021-01-31 18:23:37
Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。
CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。
我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。
Pandas读取本地CSV文件并设置Dataframe(数据格式)
import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值
数据读取示例
图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。
2017年4月28日更新
使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:
import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df
此时打印出的文件信息如下,列索引已经被重命名:
来源:https://blog.csdn.net/atnanyang/article/details/70832257
标签:pandas,CSV,Python
![](/images/zang.png)
![](/images/jiucuo.png)
猜你喜欢
IE9四大渲染引擎模式
2010-04-20 16:57:00
![](https://img.aspxhome.com/file/UploadPic/20104/20/01-76s.jpg)
django2.2安装错误最全的解决方案(小结)
2022-06-14 20:37:19
Pandas读取csv时如何设置列名
2023-11-25 19:54:55
Django restful framework生成API文档过程详解
2021-08-10 16:37:16
![](https://img.aspxhome.com/file/2023/5/76005_0s.png)
Python第三方库的几种安装方式(小结)
2021-11-01 19:34:09
Python绘制正余弦函数图像的方法
2022-09-22 19:59:06
![](https://img.aspxhome.com/file/2023/8/104888_0s.png)
python用pandas读写和追加csv文件
2021-12-19 20:47:15
![](https://img.aspxhome.com/file/2023/3/115173_0s.png)
PyCharm在新窗口打开项目的方法
2023-06-14 23:00:29
![](https://img.aspxhome.com/file/2023/9/86219_0s.jpg)
Keras构建神经网络踩坑(解决model.predict预测值全为0.0的问题)
2023-03-28 04:05:22
将TensorFlow的模型网络导出为单个文件的方法
2022-11-11 07:30:13
Python实现遗传算法(虚拟机中运行)
2022-07-10 18:48:07
![](https://img.aspxhome.com/file/2023/1/66881_0s.jpg)
asp生成带有样式的word文件方法
2011-04-18 10:30:00
深入理解Python爬虫代理池服务
2022-11-05 17:20:29
![](https://img.aspxhome.com/file/2023/9/100819_0s.png)
Python使用win32com.client的方法示例
2021-03-22 14:32:48
Date对象格式化方法
2009-11-16 13:17:00
Django自定义分页效果
2023-12-06 00:09:04
![](https://img.aspxhome.com/file/2023/1/84001_0s.png)
举例讲解Python中的算数运算符的用法
2022-03-30 22:14:49
![](https://img.aspxhome.com/file/2023/5/120435_0s.jpg)
在vscode中启动conda虚拟环境的思路详解
2022-01-13 02:43:32
![](https://img.aspxhome.com/file/2023/9/87589_0s.png)
Python借助with语句实现代码段只执行有限次
2022-08-07 15:52:29
Web标准学习:CSS样式书写风格
2008-03-25 09:37:00
![](https://img.aspxhome.com/file/UploadPic/20083/25/200832593821947s.gif)