Python实现批量读取word中表格信息的方法
作者:hcycheer 时间:2023-03-25 19:02:05
本文实例讲述了Python实现批量读取word中表格信息的方法。分享给大家供大家参考。具体如下:
单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个python小程序把所需的信息打印出来
#coding:utf-8
import os
import win32com
from win32com.client import Dispatch, constants
from docx import Document
def parse_doc(f):
"""读取doc,返回姓名和行业
"""
doc = w.Documents.Open( FileName = f )
t = doc.Tables[0] # 根据文件中的图表选择信息
name = t.Rows[0].Cells[1].Range.Text
situation = t.Rows[0].Cells[5].Range.Text
people = t.Rows[1].Cells[1].Range.Text
title = t.Rows[1].Cells[3].Range.Text
print name, situation, people,title
doc.Close()
def parse_docx(f):
"""读取docx,返回姓名和行业
"""
d = Document(f)
t = d.tables[0]
name = t.cell(0,1).text
situation = t.cell(0,8).text
people = t.cell(1,2).text
title = t.cell(1,8).text
print name, situation, people,title
if __name__ == "__main__":
w = win32com.client.Dispatch('Word.Application')
# 遍历文件
PATH = "H:\work\\aaa" # windows文件路径
doc_files = os.listdir(PATH)
for doc in doc_files:
if os.path.splitext(doc)[1] == '.docx':
try:
parse_docx(PATH+'\\'+doc)
except Exception as e:
print e
elif os.path.splitext(doc)[1] == '.doc':
try:
parse_doc(PATH+'\\'+doc)
except Exception as e:
print e
希望本文所述对大家的Python程序设计有所帮助。
标签:Python,word
0
投稿
猜你喜欢
JavaScript HTML DOM元素 节点操作汇总
2024-04-29 14:08:12
MobaXterm入门使用教程
2023-11-23 12:26:53
python判断文件夹内是否存在指定后缀文件的实例
2021-12-27 23:05:19
Python企业编码生成系统之主程序模块设计详解
2023-11-18 18:44:37
在python中list作函数形参,防止被实参修改的实现方法
2022-11-15 19:27:25
Flask框架工厂函数用法实例分析
2023-03-08 08:14:30
Python调用腾讯API实现人脸身份证比对功能
2023-11-27 20:18:06
Python搭建HTTP服务器和FTP服务器
2022-05-06 14:21:54
利用Python求阴影部分的面积实例代码
2021-10-05 15:18:03
Pycharm中的Python Console用法解读
2021-02-20 06:27:36
PyTorch基础之torch.nn.CrossEntropyLoss交叉熵损失
2022-01-12 19:39:19
详解Python操作Excel之openpyxl
2021-10-13 05:13:21
Python字典删除键值对和元素的四种方法(小结)
2021-06-12 22:58:24
前端html+css实现动态生日快乐代码
2024-05-10 10:58:12
用python写爬虫简单吗
2024-01-02 08:03:26
自定义数据库自动编号初始值和步进值
2009-05-19 10:00:00
基于Python Numpy的数组array和矩阵matrix详解
2022-04-22 10:52:28
基于Python os模块常用命令介绍
2023-09-09 01:53:43
解决Django no such table: django_session的问题
2022-04-13 22:06:21
Python实现印章代码的算法解析
2023-10-14 15:18:24