利用Python第三方库xlrd读取Excel中数据实例代码

作者:华仔仔coding 时间:2023-02-17 05:28:58 

1. 安装 xlrd 库

Python 读取 Excel 中的数据主要用到 xlrd 第三方库。xlrd 其实就是两个单词的简化拼接,我们可以把它拆开来看,xl 代表 excel, rd 代表 read, 合并起来就是 xlrd, 意思就是读 excel 的第三方库。

这种命名风格也正是我们推荐使用的,要做到 “顾名思义”,不要使用晦涩难懂,与所实现的功能毫无关联的名称。

OK, 废话不多说了,下面我们就着手安装 xlrd 库,pip 命令如下:

pip install xlrd==1.2.0 -i https://mirrors.aliyun.com/pypi/simple

值得注意的是,我在安装 xlrd 库的时候,指定了 xlrd 的版本,即 xlrd==1.2.0, 这也是在实践中积累的经验哦,因为不指定版本总是会有各种状况,为了确保不出错,大家尽量按照我这样安装吧。否则,出错可别找我哦!

2. 使用 xlrd 库

2.1 打开 Excel 工作表对象

(咳咳,战术咳嗽!) 首先,我们先梳理一下思路,把概念搞清楚。什么概念呢?就是大家知道什么是工作簿,什么是工作表,什么是单元格吗?

平时我们说的 Excel 工作表文件,其实严格来说它是个工作簿。然后打开工作簿,里面有多个 Sheet, 我们把这个称作 ”工作表“。之后,我们的数据是放在单元格里面的。

下面,让我们再用图片的形式展示,一起要分清概念。

工作簿:

利用Python第三方库xlrd读取Excel中数据实例代码

工作表:

利用Python第三方库xlrd读取Excel中数据实例代码

单元格:

利用Python第三方库xlrd读取Excel中数据实例代码

好的,那么使用 xlrd 读取 Excel 表中的数据的时候也应按照:工作簿 -> 工作表 -> 单元格,这样的过程去读取数据的。

那么,打开工作对象的代码如下:

import xlrd

# 打开工作簿
workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx')
# 三种方式获取工作表
# worksheet = workbook.sheet_by_index(0)
# worksheet = workbook.sheets()[0]        
worksheet = workbook.sheet_by_name('Sheet1')

代码解析:

  1. 首先导入安装的第三方库 xlrd.

  2. 之后,使用 xlrd 库下的方法 open_workbook(), 打开一个工作簿,方法里的参数为工作簿的路径。

  3. 最后,根据拿到的工作簿对象,指定获取的工作表。当然了,获取工作表的方法有三种,分别是根据索引和根据工作表名称获取,索引是从0开始的。只要使用一种方式即可,这里我推荐使用根据工作表名称获取。

2.2 读取单个单元格数据

那么我们在上一小节打开了工作表对象之后,下面就要获取表里的单元格数据了呀!如何获取单元格数据呢?请看下面的代码:

import xlrd

# 打开工作簿
workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx')
# 获取工作表
worksheet = workbook.sheet_by_name('Sheet1')
# 获取单元格数据的两种方式
# cell_value = worksheet.cell(0, 0).value
cell_value = worksheet.cell_value(0, 0)
print(cell_value)

代码解析:

获取单元格数据的方法也很简单。这里提供了两种方法,都可以获取单元格数据,大家只要根据自己习惯,掌握一种即可。例如,我这里使用的是 cell_value() 方法,方法里传递的是单元格的索引。单元格的索引是二维的,第一个参数是所在行,第二个参数是所在列。需要注意的是,所有的索引都是从 0 开始计数的。

2.3 读取多个单元格数据

上一小节中,我们使用了 cell_value() 方法获取单个单元格数据,但是这种方式未免效率过于低下了,现在我们想一次性获取整行或者整列的数据,该如何去做呢 ?请看下面的代码:

import xlrd

# 打开工作簿
workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx')
# 获取工作表
worksheet = workbook.sheet_by_name('Sheet1')
# 获取第一行所有单元格数据
row_value = workbookt.row(0)
# 获取第一列所有单元格数据
col_value = workbook.col(0)

代码解析:

与 2.2 小节不同的是,我们通过调用方法 row() 和 col() 分别获取某行和某列所有单元格数据,row() 和 col() 内传入的参数为索引,索引从 0 开始计数。例如,row(0) 表示获取第一行所有单元格数据,row(1) 表示获取第二行所有单元格数据。

那么我们运行上面的代码段,运行结果如下所示:

[text:'班级', text:'学号', text:'姓名', text:'成绩']  # row(0) 的结果值
[text:'班级']     # col(0) 的结果值

通过观察运行结果,我们发现运行的结果都是以列表的形式展示的。值得注意的是,列表的数值并不是字典格式,尽管这和 Python 中字典格式完全一样,实际上列表中元素的类型应该是 <class 'xlrd.sheet.Cell'>, 这是 xlrd 中的 cell 对象,即单元格对象。单元格对象有 value 属性,因此我们可以通过遍历列表获得每一个 cell 对象,然后通过 value 属性取出每一个 cell 的值。

改造后的代码如下所示:

import xlrd

# 打开工作簿
workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx')
# 获取工作表
worksheet = workbook.sheet_by_name('Sheet1')

for i in worksheet.row(0):
   print(i.value)  # 获取单元格数据
for i in worksheet.col(0):
   print(i.value)  # 获取单元格数据

2.3 读取所有单元格数据

在上一小节中,我们学习了获取多个单元格数据,也就是整行或整列获取数据,这样获取数据的粒度更大,效率自然也更高。那么如果说,我想获取 Sheet 表中所有的数据又该怎么做呢?

要想获取 Sheet 表中所有单元格数据,就得知道 Sheet 表有多少行以及多少列。这样,我们根据行数和列数,才能获取 Sheet 表所有数据啊。xlrd 中 worksheet 对象有两个属性 nrows 和 ncols, 它们分别表示当前的 Sheet 表的行数和列数。

获取所有单元格数据的代码如下所示:

import xlrd

# 打开工作簿
workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx')
# 获取工作表
worksheet = workbook.sheet_by_name('Sheet1')
# 根据行获取所有单元格数据
for row in range(worksheet.nrows):
   for i in worksheet.row(row):
       print(i.value)
# 根据列获取单元格数据  
for col in range(worksheet.ncols):
   for i in worksheet.col(col):
       print(i.value)

代码解析:

上面的代码中,输出的结果应该都是所有单元格数据,只不过分别从行和列的角度出发获取单元格数据。其实,还可以用 cell_value() 方法结合 nrows 和 ncols 属性获取所有单元格数据,这种方法留给大家自己去尝试吧!

附:行、列操作

获取全行数据、切片、全行类型、行的有效单元格数等

# # 获取整行和整列的值(数组)
k = 2
rows = sheet1_content1.row_values(k); # 获取第3行内容  row_values(rowx=2, start_colx=0, end_colx=None)
cols = sheet1_content1.col_values(k); # 获取第3列内容

###   行操作 对应列操作把 row 换成 col
print(sheet1Name,'第',k+1,'行内容为',rows)
print(sheet1_content1.row_slice(rowx=k))#返回由该行中所有的单元格对象类型及对象组成的列表
print(sheet1_content1.row_types(rowx=k, start_colx=0, end_colx=None))#返回由该行中所有的单元格对象类型及对象组成的列表
print(sheet1_content1.row(rowx=k))#返回由该行中所有的单元格对象类型及对象组成的列表
print(sheet1_content1.row_len(rowx=k)) #返回该行的有效单元格长度
   # # 5. 获取单元格内容(三种方式)
print(sheet1_content1.cell(0, 1).value)
print(sheet1_content1.cell_value(0, 1))
print(sheet1_content1.row(0)[1].value)
# print(sheet1_content1.row(10)[10].value) ## 超出索引长度会报错

3. 总结

通过上面的学习,相信大家对 xlrd 第三方库的安装以及使用第三方库读取 Excel 中的数据的方法有了一定的掌握。学习了读取操作之后,可以通过下一篇博客《使用 Python 第三方库 xlwt 写入数据到 Excel 工作表》学习向 Excel 工作表写入数据。

来源:https://blog.csdn.net/weixin_43252521/article/details/122173961

标签:python,xlrd,excel
0
投稿

猜你喜欢

  • pytorch实现mnist分类的示例讲解

    2022-03-30 09:17:19
  • php实现比较全的数据库操作类

    2023-11-22 02:15:10
  • Python脚本实现下载合并SAE日志

    2023-04-13 06:41:41
  • 基于idea操作hbase数据库并映射到hive表

    2024-01-19 23:22:57
  • 打造设计你自己的字体 Ⅲ

    2008-03-14 07:52:00
  • Python 实现12306登录功能实例代码

    2021-04-07 08:55:35
  • Python 通配符删除文件的实例

    2022-04-24 03:00:22
  • Python实现迪杰斯特拉算法过程解析

    2022-08-14 09:55:42
  • 能介绍一下NameSpace常用的地方吗?

    2009-11-01 18:11:00
  • Mootools 1.2教程(22)——同时进行多个形变动画

    2008-12-29 14:11:00
  • JavaScript之Getters和Setters 平台支持等详细介绍

    2024-04-19 09:45:18
  • mysql 8.0.27 安装配置方法图文教程(Windows64位)

    2024-01-19 07:37:59
  • Python中shape计算矩阵的方法示例

    2022-04-09 20:34:06
  • 浅析PEP570新语法: 只接受位置参数

    2022-12-22 09:36:28
  • MySQL索引之聚集索引介绍

    2024-01-24 10:02:44
  • python实现的系统实用log类实例

    2022-08-02 18:50:57
  • ServerXMLHTTP的超时设置(setTimeouts)参数含义

    2009-02-12 12:51:00
  • TensorFlow Autodiff自动微分详解

    2021-06-02 10:33:02
  • Python实现FLV视频拼接功能

    2021-09-19 02:41:48
  • 17个Python小技巧分享

    2022-04-17 23:26:53
  • asp之家 网络编程 m.aspxhome.com