使用pandas库对csv文件进行筛选保存

作者:笛在月明楼 时间:2022-12-25 04:55:10 

这个操作现在看来真没啥难的,但是我找相关的资料真的找了好久。

多数大佬都是直接pandas官网甩我脸上,然后举一个入门级的例子。

https://pandas.pydata.org/docs/reference/index.html

首先导入pandas库

import pandas as pd

然后使用read_csv来打开指定的csv文件

df = pd.read_csv('./IP2LOCATION.csv',encoding= 'utf-8')

这个函数里面需要写入csv文件的路径,如果是把csv文件保存到了python的工程文件夹下,则只需要./文件名即可,然后encoding='utf-8'是使用utf-8方式编码,有时候需要换成gbk。

虽然我们读取的是csv文件,但其实由于我们使用的是pandas库,所以我们实际获得的是一个DataFrame的数据结构。

可以使用print(type(df))进行检验

print(type(df))

使用pandas库对csv文件进行筛选保存

DataFrame 是表格型的数据结构。因此,我们可以将其当做表格。DataFrame 是以表格类似展示,而且还包含行标签、列标签。

我们可以添加一个列标签,使用方法为pandas.DataFrame.columns

在我们的例子中DataFrame类型的变量为df,因此使用方法为df.columns,我们添加的列标签为a、b、c、d、e、f

df.columns = ['a','b','c','d','e','f']

然后,我们想把某一列中等于特定值的那些行提取出来

可以将读出来的内容当做一个列表,然后这个列表的元素是表中的每一行,然后这每一行也是一个列表,也就是列表中的列表。

比如,我想将表中第5列中值为Andhra Pradesh的行提取出来,并且由于我们之前定义了第五列的列标签为e

因此代码为:

data = df[df['e'] == 'Andhra Pradesh']

最后我们可以通过pandas中的to_csv,来将筛选出来的数据保存到新的csv文件中。

data.to_csv('my_IP2LOCATION.csv')

用法为表名.to_csv('所要保存地方的路径/表名.csv')

最后总结一下我们的代码


import pandas as pd

df = pd.read_csv('./IP2LOCATION.csv',encoding= 'utf-8')
# print(type(df))
df.columns = ['a','b','c','d','e','f']
data = df[df['e'] == 'Andhra Pradesh']
data.to_csv('my_IP2LOCATION.csv')

IP2LOCATION.csv内容如下:

使用pandas库对csv文件进行筛选保存

总共有759727行

然后经过我们的筛选后的my_IP2LOCATION.csv

使用pandas库对csv文件进行筛选保存

只有3461行

PS:可以使用print(len(df.values))来查看行数

来源:https://www.cnblogs.com/cyx-b/p/12897807.html

标签:pandas,csv,文件
0
投稿

猜你喜欢

  • python得到windows自启动列表的方法

    2023-12-18 14:49:13
  • 定义列表 dt dl

    2008-08-03 17:14:00
  • python 输入一个数n,求n个数求乘或求和的实例

    2022-06-06 01:44:36
  • 解析ROC曲线绘制(python+sklearn+多分类)

    2021-04-06 12:16:16
  • Python中的exec、eval使用实例

    2022-07-05 21:01:41
  • python多进程实现进程间通信实例

    2023-01-30 10:39:35
  • php操作SVN版本服务器类代码

    2023-09-08 07:22:41
  • python不同系统中打开方法

    2021-04-03 20:40:48
  • SQL Server和Oracle并行处理方法对比

    2009-01-20 15:48:00
  • 如何在django中实现分页功能

    2021-10-21 03:29:49
  • python爬虫基础之简易网页搜集器

    2023-08-25 14:05:17
  • Python 实现判断图片格式并转换,将转换的图像存到生成的文件夹中

    2023-07-19 04:13:23
  • C#数据导入/导出Excel文件及winForm导出Execl总结

    2023-07-18 04:04:43
  • oracle应用程序实现打包 的方法

    2009-03-02 10:32:00
  • PHP函数之error_reporting(E_ALL ^ E_NOTICE)详细说明

    2023-11-14 19:42:56
  • 线程安全及Python中的GIL原理分析

    2022-09-06 11:16:20
  • 一些文档中没有介绍的SQL Server DBCC命令

    2008-12-09 14:24:00
  • 解决python3中cv2读取中文路径的问题

    2023-05-17 18:52:10
  • pycharm最新免费激活码至2099年(21.3.18亲测可用)

    2023-10-02 09:53:20
  • asp如何获知Connection对象更多的信息?

    2009-11-23 20:53:00
  • asp之家 网络编程 m.aspxhome.com