Python实现批量读取word中表格信息的方法

作者:hcycheer 时间:2023-03-25 19:02:05 

本文实例讲述了Python实现批量读取word中表格信息的方法。分享给大家供大家参考。具体如下:

单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个python小程序把所需的信息打印出来


#coding:utf-8
import os
import win32com
from win32com.client import Dispatch, constants
from docx import Document
def parse_doc(f):
 """读取doc,返回姓名和行业
 """
 doc = w.Documents.Open( FileName = f )
 t = doc.Tables[0] # 根据文件中的图表选择信息
 name = t.Rows[0].Cells[1].Range.Text  
 situation = t.Rows[0].Cells[5].Range.Text
 people = t.Rows[1].Cells[1].Range.Text
 title = t.Rows[1].Cells[3].Range.Text  
 print name, situation, people,title
 doc.Close()
def parse_docx(f):
 """读取docx,返回姓名和行业
 """
 d = Document(f)
 t = d.tables[0]
 name = t.cell(0,1).text
 situation = t.cell(0,8).text
 people = t.cell(1,2).text
 title = t.cell(1,8).text
 print name, situation, people,title
if __name__ == "__main__":
 w = win32com.client.Dispatch('Word.Application')
 # 遍历文件
 PATH = "H:\work\\aaa" # windows文件路径
 doc_files = os.listdir(PATH)
 for doc in doc_files:
   if os.path.splitext(doc)[1] == '.docx':
     try:
       parse_docx(PATH+'\\'+doc)
     except Exception as e:
       print e
   elif os.path.splitext(doc)[1] == '.doc':
     try:
       parse_doc(PATH+'\\'+doc)
     except Exception as e:
       print e

希望本文所述对大家的Python程序设计有所帮助。

标签:Python,word
0
投稿

猜你喜欢

  • JavaScript HTML DOM元素 节点操作汇总

    2024-04-29 14:08:12
  • MobaXterm入门使用教程

    2023-11-23 12:26:53
  • python判断文件夹内是否存在指定后缀文件的实例

    2021-12-27 23:05:19
  • Python企业编码生成系统之主程序模块设计详解

    2023-11-18 18:44:37
  • 在python中list作函数形参,防止被实参修改的实现方法

    2022-11-15 19:27:25
  • Flask框架工厂函数用法实例分析

    2023-03-08 08:14:30
  • Python调用腾讯API实现人脸身份证比对功能

    2023-11-27 20:18:06
  • Python搭建HTTP服务器和FTP服务器

    2022-05-06 14:21:54
  • 利用Python求阴影部分的面积实例代码

    2021-10-05 15:18:03
  • Pycharm中的Python Console用法解读

    2021-02-20 06:27:36
  • PyTorch基础之torch.nn.CrossEntropyLoss交叉熵损失

    2022-01-12 19:39:19
  • 详解Python操作Excel之openpyxl

    2021-10-13 05:13:21
  • Python字典删除键值对和元素的四种方法(小结)

    2021-06-12 22:58:24
  • 前端html+css实现动态生日快乐代码

    2024-05-10 10:58:12
  • 用python写爬虫简单吗

    2024-01-02 08:03:26
  • 自定义数据库自动编号初始值和步进值

    2009-05-19 10:00:00
  • 基于Python Numpy的数组array和矩阵matrix详解

    2022-04-22 10:52:28
  • 基于Python os模块常用命令介绍

    2023-09-09 01:53:43
  • 解决Django no such table: django_session的问题

    2022-04-13 22:06:21
  • Python实现印章代码的算法解析

    2023-10-14 15:18:24
  • asp之家 网络编程 m.aspxhome.com