Python实现将Word表格嵌入到Excel中

作者:酸菜鱼编程 时间:2022-02-10 06:21:49 

今日需求

Python实现将Word表格嵌入到Excel中

其实就是把Word中的表格转到Excel中,顺便做一个调整。这个需求在实际工作中,很多人还是经常碰到的!

如果单单是两个表格,那只要简单的复制黏贴即可,但如果上百了呢?那就得考虑自动化了。好在今天碰到的需求中的原文件格式是比较有规律的,那直接来尝试一下。


# 首先要pip install python-docx
# 如果原文件是doc格式,那就先转成docx
from docx import Document
import pandas as pd

path = "./word表格转excel.docx"
docx = Document(path)
table_s = docx.tables  # 返回一个Table对象的列表

len(table_s) --> 2 # 返回值是2,因为原文件中只有两个表格

list_ = []  # 初始化一个空列表,用来装后面的dict_

for table in table_s:  # 循环所有的表格列表
   dict_ = {}
   dict_['名称'] = table.cell(0, 1).text  # 表格的索引是从(0行,0列)开始
   dict_['身份'] = table.cell(0, 3).text
   dict_['简介'] = table.cell(1, 1).text
   for i in range(3, len(table.rows)):  # 后续的内容格式不固定,所以循环获取
       dict_[table.cell(i, 0).text] = table.cell(i, 1).text
   list_.append(dict_)

当完成上述操作后,list_就会是一个字典列表。

Python实现将Word表格嵌入到Excel中

接下来,将列表转为DataFrame进行操作即可。


df = pd.DataFrame(list_)

# 先将前三列作为索引,然后逆透视其他列,其实这就是个一维表转二维表的过程
df = df.set_index(['名称', '身份', '简介']).stack(level=0).to_frame()

# 重新设置一下行列索引的名字
df.index.names = ['名称', '身份', '简介', '物质']
df.columns = ['现状']

此时的df就跟需求结果相差不大了。

Python实现将Word表格嵌入到Excel中

最后将DataFrame导出,稍作美化即可完成需求。


# 导出的时候一定要设置index=True不然只会保留一列Series
df.to_excel("data3.xlsx", index=True, merge_cells=True)

完整代码 


# 首先要pip install python-docx
# 如果原文件是doc格式,那就先转成docx
from docx import Document
import pandas as pd

path = "./word表格转excel.docx"
docx = Document(path)
table_s = docx.tables  # 返回一个Table对象的列表

list_ = []  # 初始化一个空列表,用来装后面的dict_

for table in table_s:  # 循环所有的表格列表
   dict_ = {}
   dict_['名称'] = table.cell(0, 1).text  # 表格的索引是从(0行,0列)开始的
   dict_['身份'] = table.cell(0, 3).text
   dict_['简介'] = table.cell(1, 1).text
   for i in range(3, len(table.rows)):  # 循环获得后面的内容
       dict_[table.cell(i, 0).text] = table.cell(i, 1).text
   list_.append(dict_)

df = pd.DataFrame(list_)

# 先将前三列作为索引,然后逆透视其他列,就是个一维表转二维表的过程
df = df.set_index(['名称', '身份', '简介']).stack(level=0).to_frame()

# 重新设置一下行列索引的名字
df.index.names = ['名称', '身份', '简介', '物质']
df.columns = ['现状']

# 导出的时候一定要设置index=True不然只会保留一列Series
df.to_excel("data3.xlsx", index=True, merge_cells=True)

来源:https://blog.csdn.net/pythonxuexi123/article/details/115027653

标签:Python,Word,Excel
0
投稿

猜你喜欢

  • Python面向对象编程之类的封装

    2022-10-20 05:29:49
  • 用命令创建MySQL数据库(de1)的方法

    2024-01-22 16:12:11
  • 浅谈keras2 predict和fit_generator的坑

    2021-05-13 16:30:36
  • 分别用marquee和div+js实现首尾相连循环滚动效果,仅3行代码

    2024-04-18 10:55:26
  • Vue父子传递实例讲解

    2023-07-02 17:03:29
  • python list count统计个数的实现

    2022-11-08 06:51:24
  • python实现书法碑帖图片分割

    2023-09-12 16:08:02
  • SQL Server数据库实用小技巧集合

    2008-11-25 11:35:00
  • 一文让你快速了解JavaScript栈

    2024-04-29 13:22:04
  • python 变量初始化空列表的例子

    2022-09-03 08:14:42
  • Python 读取某个目录下所有的文件实例

    2022-08-27 20:04:13
  • 详解go语言单链表及其常用方法的实现

    2024-02-21 03:13:41
  • mssql2005字符串连接方法 避免无效的连接错误

    2024-01-14 20:45:05
  • 深入分析MySQL数据类型 DECIMAL

    2024-01-26 04:07:59
  • Python中的defaultdict模块和namedtuple模块的简单入门指南

    2022-01-21 07:10:20
  • Python实现的特征提取操作示例

    2023-02-07 06:08:04
  • python复制文件代码实现

    2022-08-29 09:28:11
  • 深度学习入门之Pytorch 数据增强的实现

    2021-04-05 22:26:07
  • Python 如何截取字符函数

    2023-02-08 11:39:04
  • Python真题案例之小学算术 阶乘精确值 孪生素数 6174问题详解

    2022-12-02 11:09:33
  • asp之家 网络编程 m.aspxhome.com