python 使用openpyxl读取excel数据

作者:miki的测试笔记 时间:2021-02-10 07:32:10 

目录
  • openpyxl介绍

  • openpyxl安装

  • openpyxl基本概念

  • openpyxl对excel进行操作

    • 新建excel

    • 打开已存在的文件

    • 读取单个单元格

    • 读取多个单元格

    • 其他相关操作

  • openpyxl封装

    openpyxl介绍

    openpyxl是一个开源项目,它是一个用于读取/写入Excel 2010文档(如xlsx 、xlsm 、xltx 、xltm文件 )的Python库,如果要处理更早格式的Excel文档(xls),需要用到其它库(如:xlrd、xlwt等),这是openpyxl比较其他模块的不足之处。openpyxl是一款比较综合的工具,不仅能够同时读取和修改Excel文档,而且可以对Excel文件内单元格进行详细设置,包括单元格样式等内容,甚至还支持图表插入、打印设置等内容。

    python中与excel操作相关的模块:

    • 📔 xlrd库:从excel中读取数据,支持xls、xlsx格式

    • 📔 xlwt库:对excel进行修改操作,但不支持对xlsx格式的修改

    • 📔 xlutils库:在xlwt和xlrd中,对一个已存在文件进行修改

    • 📘 openpyxl库:主要针对xlsx格式的excel进行读取和编辑

    openpyxl安装


    pip install openpyxl

    openpyxl基本概念

    • WorkBook:工作簿对象

    • Sheet:表单对象

    • Cell:表格对象

    也就是我们使用excel时可以看到的三个对象,我们操作excel的步骤是打开工作簿,选中表单,对单元格进行操作,而openpyxl的工作原理也是如此。

    python 使用openpyxl读取excel数据

    openpyxl对excel进行操作

    新建excel


    import openpyxl

    # 创建一个工作簿
    workbook = openpyxl.Workbook()
    # 创建一个表单
    sheet = workbook.create_sheet('表单1')
    # 写入一个数据
    sheet.cell(row=1, column=1, value="python")
    # 保存
    workbook.save('test.xlsx')

    🎈 注意点:如果保存的文件名已存在,将会覆盖原来的文件

    打开已存在的文件

    • 打开已存在的文件:load_workbook()

    • 获取表单:workbook['表单名']

    • 读取指定表格:cell(row, column).value


    import openpyxl

    # 打开工作簿
    workbook = openpyxl.load_workbook('test.xlsx')
    # 获取表单
    sheet = workbook['表单1']
    # 读取指定的单元格数据
    cell = sheet.cell(row=1, column=1).value
    print(cell)

    运行结果:


    C:\software\python\python.exe D:/learn/python24/python_base/test.py
    python

    Process finished with exit code 0

    读取单个单元格


    # 方式一:读取A6单元格的值
    cell1 = sheet['A6'].value

    # 方式二:读取第3行,第4列单元格的值
    cell2 = sheet.cell(row=3, column=4).value

    读取多个单元格


    # 方式一:读取A6单元格的值
    cell1 = sheet['A6'].value

    # 方式二:读取第3行,第4列单元格的值
    cell2 = sheet.cell(row=3, column=4).value

    读取多个单元格时,都是以元组的形式返回

    其他相关操作

    关键代码相关描述
    cell(row, column, value)写入数据,三个参数分别是行,列,值
    cell(row, column).value获取指定单元格的值,两个参数分别是行,列
    workbook.remove('表单名')删除表单
    del workbook['表单名']删除表单
    workbook.save('文件名')保存工作簿
    sheet.max_row获取表单数据的总行数
    sheet.max_column获取表单数据的总列数
    sheet.rows获取按行所有的数据
    sheet.columns获取按列所有的数据

    🎈 注意点:

    • openpyxl中列和行的起始标识都是1,不是从0开始

    • 从excel中读取出来的数据只有两种类型,即数值类型和字符串类型

    • 不要随便在表格中敲空格,会影响判断最大行数和最大列数

    • 运行操作excel的代码时,要先关闭在操作系统中打开的相关excel表,否则可能会无法读取/写入数据

    • 写入数据时要执行保存


    import openpyxl

    # 打开工作簿
    wb = openpyxl.load_workbook('test.xlsx')
    # 获取表单
    sh = wb['表单1']
    # 读取指定的单元格数据
    res1 = sh.cell(row=1, column=1).value
    print(res1)

    # 获取最大行数
    print(sh.max_row)
    # 获取最大列数
    print(sh.max_column)

    # 按列读取所有数据,每一列的单元格放入一个元组中
    print(sh.columns) # 直接打印,打印结果是一个可迭代对象,我们可以转换成列表来查看

    # 按行读取所有数据,每一行的单元格放入一个元组中
    rows = sh.rows
    # print(list(rows)) # 转换成列表之后打印结果为具体的单元格,如下
    # [(<Cell '表单1'.A1>, <Cell '表单1'.B1>, <Cell '表单1'.C1>, <Cell '表单1'.D1>, <Cell '表单1'.E1>, <Cell '表单1'.F1>, <Cell '表单1'.G1>),
    # (<Cell '表单1'.A2>, <Cell '表单1'.B2>, <Cell '表单1'.C2>, <Cell '表单1'.D2>, <Cell '表单1'.E2>, <Cell '表单1'.F2>, <Cell '表单1'.G2>),
    # (<Cell '表单1'.A3>, <Cell '表单1'.B3>, <Cell '表单1'.C3>, <Cell '表单1'.D3>, <Cell '表单1'.E3>, <Cell '表单1'.F3>, <Cell '表单1'.G3>)]

    # 我们可以通过for循环以及value来查看单元格的值
    for row in list(rows): # 遍历每行数据
    case = [] # 用于存放一行数据
    for c in row: # 把每行的每个单元格的值取出来,存放到case里
     case.append(c.value)
    print(case)

    运行结果:


    C:\software\python\python.exe D:/learn/python24/python_base/test.py
    case_id
    3
    7
    <generator object Worksheet._cells_by_col at 0x0000012FEF90D8B8>
    ['case_id', 'interface', 'title', 'method', 'url', 'data', 'expected']
    [1, 'login', '登录成功', 'post', '/member/login', '{"mobile_phone":"15692004245","pwd":"miki12345"}', "{'code': 0, 'msg': 'OK'}"]
    [2, 'login', '登录失败-手机号为空', 'post', '/member/login', '{"mobile_phone":"","pwd":"miki12345"}', "{'code': 2, 'msg': '手机号码为空'}"]

    excel表中的原数据如下图:

    python 使用openpyxl读取excel数据

    openpyxl封装

    在测试过程中,我们会经常需要访问excel读取测试数据,如果毎访问一次我们就调用一次openpyxl,进行打开excel,选取表单,读取数据等操作,将会增加我们的工作量和代码量。凡是需要重复使用的,我们都可以对它进行二次封装,写成我们自己的版本,还可以在封装过程中加入我们想要的内容,使用的时候直接调用即可。

    在封装openpyxl时,读取excel时我写了两种实现方法,第一种是读取数据后,把每条测试数据的键值保存到一个字典中,再把字典存到一个列表,这种方式比较容易理解,但是调用的时候需要多敲几个括号或者引号;第二种是把每条测试数据的键值存到一个实例对象的属性中,再把每个实例存到一个列表。实际上他们的作用是一样,只是第二种方式调用时更简单。


    # read_excel.py
    import openpyxl

    class CasesData:
    """用于保存测试用例数据"""
    pass

    class ReadExcel:

    def __init__(self, file_name, sheet_name):
     self.file_name = file_name
     self.sheet_name = sheet_name

    def open(self):
     self.wb = openpyxl.load_workbook(self.file_name)
     self.sh = self.wb[self.sheet_name]

    def close(self):
     self.wb.close()

    def read_data(self):
     """按行读取数据,最后返回一个存储字典的列表"""
     self.open()
     rows = list(self.sh.rows)
     titles = []
     for t in rows[0]:
      title = t.value
      titles.append(title)
     cases = []
     for row in rows[1:]:
      case = []
      for r in row:
       case.append(r.value)
      cases.append(dict(zip(titles, case))) # 通过zip聚合打包用例的标题和数据
     self.close()
     return cases

    def read_data_obj(self):
     """按行读取数据,最后返回的是一个存储实例对象的列表"""
     self.open()
     rows = list(self.sh.rows)
     titles = []
     for t in rows[0]:
      title = t.value
      titles.append(title)
     cases = []
     for row in rows[1:]:
      case_obj = CasesData() # 创建一个对象用来保存该行用例数据
      case = []
      for r in row:
       case.append(r.value)
      case_info = dict(zip(titles, case))
      for k, v in case_info.items():
       setattr(case_obj, k, v)
      cases.append(case_obj)
     self.close()
     return cases

    def write_data(self, row, column, msg):
     self.open()
     self.sh.cell(row=row, column=column, value=msg)
     self.wb.save(self.file_name)
     self.close()

    if __name__ == '__main__':
    # 直接运行本文件时执行,下面是一个应用实例
    # 需要读取excel时直接调用ReadExcel类
    test = ReadExcel('cases.xlsx', 'login')
    res = test.read_data_obj()# 最后返回的是一个存储实例对象的列表
    print(res[0].case_id)# 打印第1个用例的case_id
    print(res[3].title)# 打印第4个用例的title

    test2 = ReadExcel('cases.xlsx', 'login')
    res2 = test2.read_data()# 最后返回一个存储字典的列表
    print(res2[0]['case_id'])# 打印第1个用例的case_id
    print(res2[3]['title'])# 打印第4个用例的title

    上面封装的openpyxl中,应用实例的excel表结构如下:

    python 使用openpyxl读取excel数据

    来源:https://www.cnblogs.com/miki-peng/p/12904383.html#4676720

    标签:python,openpyxl,excel
    0
    投稿

    猜你喜欢

  • Python3使用turtle绘制超立方体图形示例

    2021-02-01 14:21:07
  • 不错的广告定位效果代码

    2009-06-05 18:51:00
  • MySQL数据库本地备份和双机相互备份

    2008-05-27 12:25:00
  • Python使用自带的ConfigParser模块读写ini配置文件

    2022-04-01 00:07:01
  • win10系统中安装scrapy-1.1

    2021-07-28 07:41:28
  • 利用Python+OpenCV三步去除水印

    2021-09-17 10:32:30
  • python生成n个元素的全组合方法

    2023-11-10 20:35:08
  • python实现bucket排序算法实例分析

    2023-09-17 17:54:07
  • 关于《回访确认》的几个问题

    2009-08-24 12:43:00
  • Python 遍历列表里面序号和值的方法(三种)

    2022-11-29 14:01:06
  • Python 图片转数组,二进制互转操作

    2023-10-07 17:46:04
  • ASP.NET 2.0中的数据操作之九:跨页面的主/从报表

    2023-07-19 20:28:42
  • django配置DJANGO_SETTINGS_MODULE的实现

    2023-06-18 20:14:26
  • Python安装及Pycharm安装使用教程图解

    2023-08-01 05:38:06
  • 加快Firefox 3.5启动速度的方法

    2009-07-16 15:22:00
  • 使用PowerShell实现批量修改或替换文件名

    2023-02-08 05:02:10
  • ASP的错误代码都有哪些?

    2009-10-28 18:15:00
  • Python正则表达式中的量词符号与组问题小结

    2022-12-14 15:24:24
  • 浅谈Python中的函数(def)及参数传递操作

    2023-01-20 20:13:54
  • 用ASP实现txt,doc,jpg等文件下载的函数

    2007-08-17 13:17:00
  • asp之家 网络编程 m.aspxhome.com