python读取word 中指定位置的表格及表格数据

作者:Chelseady 时间:2021-04-10 02:42:21 

1.Word文档如下:

python读取word 中指定位置的表格及表格数据

2.代码


# -*- coding: UTF-8 -*-
from docx import Document
def readSpecTable(filename, specText):
document = Document(filename)
paragraphs = document.paragraphs
allTables = document.tables
specText = specText.encode('utf-8').decode('utf-8')
for aPara in paragraphs:
 if aPara.text == specText:
  ele = aPara._p.getnext()
  while (ele.tag != '' and ele.tag[-3:] != 'tbl'):
   ele = ele.getnext()
  if ele.tag != '':
   for aTable in allTables:
    if aTable._tbl == ele:
     for i in range(len(aTable.rows)):
      for j in range(len(aTable.columns)):
       print(aTable.cell(i, j).text)
if __name__ == '__main__':
readSpecTable('test.docx', '符号约定')

3.结果

符号
符号
含义
数据域取值符号
M
必须填写的域
数据域取值符号
C
某条件成立时必须填写的域
数据域取值符号
O
可选,非必须填写的域
数据域取值符号

必须与先前报文中对应域的值相同的域
数据域取值符号
-
必须去除的域
数据域属性符号
 
基本数据域
数据域属性符号
[]
标识为消息组件名称数据域
数据域属性符号
{}
标识为消息组件中重复的数据域
数据域属性符号

标识为消息组件中包含的基础数据域
数据域属性符号
→[]
标识为消息组件中的子消息组件
数据域属性符号
→{}
标识为子消息组件中重复的数据域块
数据域属性符号
→→
标识为子消息组件中包含的基础数据域

PS:python读取word文档表格里的数据

首先需要安装相应的支持库:

直接在命令行执行pip install python-docx

示例代码如下:


import docx
from docx import Document #导入库
path = "E:\\python_data\\1234.docx" #文件路径
document = Document(path) #读入文件
tables = document.tables #获取文件中的表格集
table = tables[0 ]#获取文件中的第一个表格
for i in range(1,len(table.rows)):#从表格第二行开始循环读取表格数据
result = table.cell(i,0).text + "" +table.cell(i,1).text+
table.cell(i,2).text + table.cell(i,3).text
#cell(i,0)表示第(i+1)行第1列数据,以此类推
print(result)

总结

以上所述是小编给大家介绍的python读取word 中指定位置的表格及表格数据,网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

来源:https://blog.csdn.net/Chelseady/article/details/102689683

标签:python,word,表格
0
投稿

猜你喜欢

  • python正则表达式之re.match()与re.search()的用法及区别

    2022-05-14 13:21:46
  • 分享9个好用的Python技巧

    2021-03-15 18:43:05
  • Python使用matplotlib绘制随机漫步图

    2022-02-20 08:34:43
  • django将网络中的图片,保存成model中的ImageField的实例

    2023-12-23 01:11:33
  • 详细介绍Python进度条tqdm的使用

    2022-12-13 19:45:08
  • python实现KNN近邻算法

    2022-08-13 08:24:58
  • 两个元祖T1=('a', 'b'),T2=('c', 'd')使用匿名函数将其转变成[{'a': 'c'},{'b': 'd'}]的几种方法

    2023-06-25 12:44:15
  • python散点图实例之随机漫步

    2021-01-19 21:05:58
  • JavaScript极简入门教程(三):数组

    2024-05-03 15:04:25
  • 深入理解Go语言中的Dispatcher

    2024-02-03 03:27:18
  • Python的Flask项目中获取请求用户IP地址 addr问题

    2021-09-08 08:38:47
  • 学习XHTML和HTML之间的区别

    2007-08-22 11:02:00
  • python 读取目录下csv文件并绘制曲线v111的方法

    2022-08-21 16:05:34
  • 使用python爬取taptap网站游戏截图的步骤

    2021-09-17 07:44:34
  • python+opencv实现阈值分割

    2023-05-19 11:23:50
  • asp如何动态生成WBMP?

    2009-11-18 20:36:00
  • python的构建工具setup.py的方法使用示例

    2022-11-02 12:31:31
  • 大数据量分页存储过程效率测试附测试代码与结果

    2024-01-15 00:49:21
  • perl的cgi高级编程介绍

    2022-10-04 23:41:28
  • python之excel文件(.xls文件)处理方式

    2021-08-22 15:58:14
  • asp之家 网络编程 m.aspxhome.com