python办公之python编辑word
作者:??斜月???? 发布时间:2022-03-31 08:48:40
标签:python,办公,编辑,word
1 前言
在工作中时常会有繁重的文案工作,接触了python 之后,就会觉得这个比较简单了,python 操作word 和 excel 是比较常用的操作,相对比较简单,在本文中,我们就以 python 操作 word 为例来介绍一些简单的操作。
2 前提准备
2.1 python-docx 的安装
需要操作的前提是下载 docx 相关的操作类库 python-docx
,操作的环境和 IDE 环境如下所示
#使用的python 版本 python3.7.6 IDE pycharm2019
# 安装命令
pip install python-docx
# 查看安装版本
pip list | grep python-docx
2.2 docx 文档的结构说明
事先声明一下,python 操作的word版本必须是 docx
的版本,doc
的文档暂不支持。另外 docx 文档也是一种 xml 的数据组织格式, 首先了解一下其格式情况,
在word文档中,其主要结构如下所述:
1 每个document包含多个paragraph,每个paragraph有多个run,每个run包含有(text文本,font字体,color颜色,字号)
2 每个document包含多个tables,table中有多个rows,每个row包含多个cells,每个cell中包含多个paragraph。对于写word表格不论是 head 还是paragraph 基本操作都是先添加对象,然后再添加run就好了
3 word表格的结构包含head标题、normal 正文、Caption表
3 具体使用
3.1 创建标题
# 创建一个document
document = Document()
# 创建一个标题 默认是一级标题
head = document.add_heading(level=4)
run = head.add_run("这是一个四级标题 this is a title")
# font.name 只能设置西文字体
run.font.name = 'Times New Roman'
# 中文字体需要使用这种方式设置
run._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')
# 设置大小为11磅
run.font.size = Pt(16)
# 段落字体颜色
run.font.color.rgb = RGBColor(128, 0, 128)
# 是否加粗
run.bold = False
# 是否斜体
run.italic = False
3.2 创建段落
# 创建一个段落
ph = document.add_paragraph()
# 添加段落 段落间距段落前13磅 段落后13磅 行间距固定值18磅
ph.paragraph_format.space_before = Pt(13)
ph.paragraph_format.space_after = Pt(13)
ph.paragraph_format.line_spacing = Pt(18)
# 设置2.5倍行间距
ph.paragraph_format.line_spacing = 2.5
# 段落缩进 段落左缩进0.5英寸 left_indent right_indent
# p.paragraph_format.left_indent = Inches(0.5)
# 首行缩进 首行缩进0.9cm
ph.paragraph_format.first_line_indent = Cm(0.9)
# 段落左对齐
ph.alignment = WD_PARAGRAPH_ALIGNMENT.LEFT
run1 = ph.add_run("历史上第一个儿子当皇帝,老爹还活着的,当属刘太公,也就是刘邦的父亲。刘邦建立汉朝,称帝,"
"每天还去拜见刘太公,后来有大臣进言讲,虽然刘太公贵为皇帝父亲,但也为人臣,不应该由皇帝前去拜见。")
run1.font.size = Pt(12)
run1.font.color.rgb = RGBColor(128, 128, 128)
run1.font.name = 'Times New Roman'
run1._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')
3.3 创建表格
# 创建一个表格 3行四列 也可以不设置
table = document.add_table(rows=1, cols=3)
# 自动调整表格
table.autofit = True
# 设置表格样式
table.style = 'Table Grid'
# 表头
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Qty'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
# 准备数据
records = (
(3, '101', 'Spam'),
(7, '422', 'Eggs'),
(4, '631', 'Spam, spam, eggs, and spam')
)
# 添加内容
for qty, id, desc in records:
row_cells = table.add_row().cells
row_cells[0].text = str(qty)
row_cells[1].text = id
row_cells[2].text = desc
3.4 文档保存
# 保存文档 指定保存位置
document.save(r"demo_word.docx")
3.5 获取文档操作
#获取文档中所有段落的样式根据样式进行修改文档
docu = Document(r'D:/xxx.docx')
for p in docu.paragraphs:
style_name = p.style.name
print(style_name)
#获取文档中所有的表格
for tb in docu.tables:
# tb.rows 文档中所有的行 tb.rows[0].cells 某一行的所有单元格
# 循环单元格进行编辑样式操作
3.6 其它操作
# word表格单元格背景颜色
def set_cell_background_color(cell, color):
# print(colorStr)
shading_elm_1 = parse_xml(r'<w:shd {} w:fill="{color_value}"/>'.format(nsdecls('w'), color_value=color))
cell._tc.get_or_add_tcPr().append(shading_elm_1)
cells1[i].paragraphs[0].style = "表格体"
# 修改背景颜色为白色
set_cell_background_color(rows.cells[0], "#FFFFFF")
# 查看文档内所有的样式
for sts in document.styles:
print(sts)
# 查看word文档结构
print(document._element.xml)
4 总结
最终产生的效果如下图所示:
在本章中,介绍了怎么使用python-docx创建wor文档,并举例说明了创建段落,表格,标题,图片等要点。
来源:https://juejin.cn/post/7035867058642354207
0
投稿
猜你喜欢
- Oracle公司6月9日宣布同意收购TimesTen公司,TimesTen是一家私营软件企业,其产品能提高用于股市和机票预订等需要快速响应时
- 本文实例讲述了python中迭代器(iterator)用法。分享给大家供大家参考。具体如下:#-----------------------
- 提到sa弱口令,我们首先就会想到,许多数据库都有1个类似的超级管理员账号,比如:Oracle是"system"和&quo
- 大家都知道当任务过多,任务量过大时如果想提高效率的一个最简单的方法就是用多线程去处理,比如爬取上万个网页中的特定数据,以及将爬取数据和清洗数
- 前言最近需要源码部署一个项目,因此探索一下保护源码的方式,由简单到复杂主要总结为以下三大类:代码混淆:主要是改变一些函数名、变量名代码打包:
- 最近做接口对接,遇到了.net开发的webservice接口,因为python第一次与webservice对接,连问带查,最后使用suds库
- 1、定义和使用列表在Python中,列表是由一系列元素按照特定的顺序构成的数据结构,也就是说列表类型的变量可以存储多个数据,且可以重复。1.
- 前言通常执行 python 程序要有相应的 Python 环境,但某些特定场景下,我们可能并不愿意这么麻烦的去配置这些环境(比如将写好的脚本
- 目录:分析和设计组件编码实现和算法用 Ant 构建组件测试 JavaScript 组件本期,我们要讨论的话题是 JavaScript 的测试
- 这段时间在用libev的python版本事件模型,总共只有一个py.so文件,没有.py文件查看源码查看接口,最开始用shell命令直接查看
- sql server端口,我们可以通过\"服务器端网络试用工具\"和\"客户端实用工具\"来设定,设
- 1、遍历 json 对象的属性//定义json对象 var person= { name: 'zhangsan', pass
- 如果你是我的长期读者,那么你应该知道我在寻找一个完美备份程序,最后我写了一个基于bup的我自己的加密层。在写encbup的时候,我对仅仅恢复
- 本文实例为大家分享了js实现九宫格抽奖的具体代码,供大家参考,具体内容如下<div id="contaner"&g
- 做图像识别的时候需要在图片中画出特定大小和角度的矩形框,自己写了一个函数,给定的输入是图片名称,矩形框的位置坐标,长宽和角度,直接输出画好矩
- matlab程序读取单片机通过串口传来的IMU角度数据,并用曲线显示出来。上传的值为float型,每个数据后有回车符。范围90~-90主文件
- 大家都知道,IE中的现代事件绑定(attachEvent)与W3C标准的(addEventListener)相比存在很多问题,例如:内存泄漏
- 做设计的时候,如何配色是经常让人头痛的问题,尽管很多时候,很多人都说对于色彩的掌握更多的是靠感觉,但是不得不说,感觉也是要有依据的。所以颜色
- 1.静态方法(staticmethod)静态方法:@staticmethod也是一个类方法,是可以直接类调用的。个人认为的使用场景是:只要要
- 本文实例讲述了Python使用正则表达式抓取网页图片的方法。分享给大家供大家参考,具体如下:#!/usr/bin/pythonimport