使用 Python 读取电子表格中的数据实例详解

作者:Paul W. Frields 时间:2023-10-15 02:40:57 

Python 是最流行、功能最强大的编程语言之一。由于它是自由开源的,因此每个人都可以使用。大多数 Fedora 系统都已安装了该语言。Python 可用于多种任务,其中包括处理逗号分隔值(CSV)数据。CSV文件一开始往往是以表格或电子表格的形式出现。本文介绍了如何在 Python 3 中处理 CSV 数据。

CSV 数据正如其名。CSV 文件按行放置数据,数值之间用逗号分隔。每行由相同的字段定义。简短的 CSV 文件通常易于阅读和理解。但是较长的数据文件或具有更多字段的数据文件可能很难用肉眼解析,因此在这种情况下计算机做得更好。

这是一个简单的示例,其中的字段是 NameEmail Country。在此例中,CSV 数据将字段定义作为第一行,尽管并非总是如此。


Name,Email,Country
John Q. Smith,jqsmith@example.com,USA
Petr Novak,pnovak@example.com,CZ
Bernard Jones,bjones@example.com,UK

从电子表格读取 CSV

Python 包含了一个 csv 模块,它可读取和写入 CSV 数据。大多数电子表格应用,无论是原生(例如 Excel 或 Numbers)还是基于 Web 的(例如 Google Sheet),都可以导出 CSV 数据。实际上,许多其他可发布表格报告的服务也可以导出为 CSV(例如,PayPal)。

Python csv 模块有一个名为 DictReader 的内置读取器方法,它可以将每个数据行作为有序字典 (OrderedDict) 处理。它需要一个文件对象访问 CSV 数据。因此,如果上面的文件在当前目录中为 example.csv,那么以下代码段是获取此数据的一种方法:


f = open('example.csv', 'r')
from csv import DictReader
d = DictReader(f)
data = []
for row in d:
 data.append(row)


现在,内存中的 data 对象是 OrderedDict 对象的列表:




[OrderedDict([('Name', 'John Q. Smith'),
       ('Email', 'jqsmith@example.com'),
       ('Country', 'USA')]),
OrderedDict([('Name', 'Petr Novak'),
       ('Email', 'pnovak@example.com'),
       ('Country', 'CZ')]),
OrderedDict([('Name', 'Bernard Jones'),
       ('Email', 'bjones@example.com'),
       ('Country', 'UK')])]


引用这些对象很容易:




>>> print(data[0]['Country'])
USA
>>> print(data[2]['Email'])
bjones@example.com

顺便说一句,如果你需要处理没有字段名标题行的 CSV 文件,那么 DictReader 类可以让你定义它们。在上面的示例中,添加 fieldnames 参数并传递一系列名称:


d = DictReader(f, fieldnames=['Name', 'Email', 'Country'])

真实例子

我最近想从一长串人员名单中随机选择一个中奖者。我从电子表格中提取的 CSV 数据是一个简单的名字和邮件地址列表。

幸运的是,Python 有一个有用的 random 模块,可以很好地生成随机值。该模块 Random 类中的 randrange 函数正是我需要的。你可以给它一个常规的数字范围(例如整数),以及它们之间的步长值。然后,该函数会生成一个随机结果,这意味着我可以在数据的总行数范围内获得一个随机整数(或者说是行号)。

这个小程序运行良好:


from csv import DictReader
from random import Random
d = DictReader(open('mydata.csv'))
data = []
for row in d:
 data.append(row)
r = Random()
winner = data[r.randrange(0, len(data), 1)]
print('The winner is:', winner['Name'])
print('Email address:', winner['Email'])

显然,这个例子非常简单。电子表格本身包含了复杂的分析数据的方法。但是,如果你想在电子表格应用之外做某事,Python 或许是一种技巧!

来源:https://linux.cn/article-12099-1.html

标签:python,csv,数据
0
投稿

猜你喜欢

  • Pytorch 使用CNN图像分类的实现

    2023-04-01 03:24:21
  • 程序员的八种境界,你在哪一境?

    2022-07-19 11:22:19
  • Vue2.0实现购物车功能

    2023-07-02 16:54:22
  • python k-近邻算法实例分享

    2022-03-26 14:47:17
  • echarts折线图流动特效的实现全过程(非平滑曲线)

    2024-05-02 16:28:55
  • mysql5.6.zip格式压缩版安装图文教程

    2024-01-17 20:13:53
  • python实现实时监控文件的方法

    2021-08-18 21:17:06
  • Python实现列表删除重复元素的三种常用方法分析

    2022-02-17 20:21:36
  • python的环境conda简介

    2022-12-24 18:40:30
  • ASP.NET web.config中 数据库连接字符串加密解密

    2024-01-14 07:02:09
  • 微信小程序访问mysql数据库流程详解

    2024-01-23 10:34:43
  • python 3.74 运行import numpy as np 报错lib\\site-packages\\numpy\\__init__.py

    2023-11-03 07:25:24
  • python+mysql实现教务管理系统

    2024-01-26 11:43:03
  • Python单元测试的9个技巧技巧

    2023-03-22 09:58:57
  • python实现126邮箱发送邮件

    2022-07-29 23:37:56
  • Python中的推导式使用详解

    2022-10-30 00:42:49
  • java.sql.SQLException: 内部错误: Unable to construct a Datum from the specified input

    2010-07-16 13:23:00
  • Go REFLECT Library反射类型详解

    2024-04-26 17:25:15
  • Python Matplotlib绘制箱线图boxplot()函数详解

    2021-03-09 11:16:07
  • 细化解析:Mysql数据库对文件操作的封装

    2008-11-27 16:32:00
  • asp之家 网络编程 m.aspxhome.com