python办公之python编辑word

作者:??斜月???? 时间:2022-03-31 08:48:40 

1 前言

在工作中时常会有繁重的文案工作,接触了python 之后,就会觉得这个比较简单了,python 操作word 和 excel 是比较常用的操作,相对比较简单,在本文中,我们就以 python 操作 word 为例来介绍一些简单的操作。

2 前提准备

2.1 python-docx 的安装

需要操作的前提是下载 docx 相关的操作类库 python-docx ,操作的环境和 IDE 环境如下所示

#使用的python 版本 python3.7.6 IDE pycharm2019  
# 安装命令
pip install python-docx
# 查看安装版本
pip list | grep python-docx

2.2 docx 文档的结构说明

事先声明一下,python 操作的word版本必须是 docx 的版本,doc 的文档暂不支持。另外 docx 文档也是一种 xml 的数据组织格式, 首先了解一下其格式情况,

python办公之python编辑word

在word文档中,其主要结构如下所述:

  • 1 每个document包含多个paragraph,每个paragraph有多个run,每个run包含有(text文本,font字体,color颜色,字号)

  • 2 每个document包含多个tables,table中有多个rows,每个row包含多个cells,每个cell中包含多个paragraph。对于写word表格不论是 head 还是paragraph 基本操作都是先添加对象,然后再添加run就好了

  • 3 word表格的结构包含head标题、normal 正文、Caption表

3 具体使用

3.1 创建标题

# 创建一个document
document = Document()
# 创建一个标题 默认是一级标题
head = document.add_heading(level=4)
run = head.add_run("这是一个四级标题 this is a title")
# font.name 只能设置西文字体
run.font.name = 'Times New Roman'
# 中文字体需要使用这种方式设置
run._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')
# 设置大小为11磅
run.font.size = Pt(16)
# 段落字体颜色
run.font.color.rgb = RGBColor(128, 0, 128)
# 是否加粗
run.bold = False
# 是否斜体
run.italic = False

3.2 创建段落

# 创建一个段落
ph = document.add_paragraph()
# 添加段落 段落间距段落前13磅 段落后13磅 行间距固定值18磅
ph.paragraph_format.space_before = Pt(13)
ph.paragraph_format.space_after = Pt(13)
ph.paragraph_format.line_spacing = Pt(18)
# 设置2.5倍行间距
ph.paragraph_format.line_spacing = 2.5
# 段落缩进 段落左缩进0.5英寸 left_indent right_indent
# p.paragraph_format.left_indent = Inches(0.5)
# 首行缩进 首行缩进0.9cm
ph.paragraph_format.first_line_indent = Cm(0.9)
# 段落左对齐
ph.alignment = WD_PARAGRAPH_ALIGNMENT.LEFT
run1 = ph.add_run("历史上第一个儿子当皇帝,老爹还活着的,当属刘太公,也就是刘邦的父亲。刘邦建立汉朝,称帝,"
                 "每天还去拜见刘太公,后来有大臣进言讲,虽然刘太公贵为皇帝父亲,但也为人臣,不应该由皇帝前去拜见。")
run1.font.size = Pt(12)
run1.font.color.rgb = RGBColor(128, 128, 128)
run1.font.name = 'Times New Roman'
run1._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')

3.3 创建表格

# 创建一个表格 3行四列 也可以不设置
table = document.add_table(rows=1, cols=3)
# 自动调整表格
table.autofit = True
# 设置表格样式
table.style = 'Table Grid'
# 表头
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Qty'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
# 准备数据
records = (
   (3, '101', 'Spam'),
   (7, '422', 'Eggs'),
   (4, '631', 'Spam, spam, eggs, and spam')
)
# 添加内容
for qty, id, desc in records:
   row_cells = table.add_row().cells
   row_cells[0].text = str(qty)
   row_cells[1].text = id
   row_cells[2].text = desc

3.4 文档保存

# 保存文档 指定保存位置
document.save(r"demo_word.docx")

3.5 获取文档操作

#获取文档中所有段落的样式根据样式进行修改文档
docu = Document(r'D:/xxx.docx')
for p in docu.paragraphs:
   style_name = p.style.name
   print(style_name)
#获取文档中所有的表格
for tb in docu.tables:
   # tb.rows 文档中所有的行 tb.rows[0].cells 某一行的所有单元格
   # 循环单元格进行编辑样式操作

3.6 其它操作

# word表格单元格背景颜色
def set_cell_background_color(cell, color):
   # print(colorStr)
   shading_elm_1 = parse_xml(r'<w:shd {} w:fill="{color_value}"/>'.format(nsdecls('w'), color_value=color))
   cell._tc.get_or_add_tcPr().append(shading_elm_1)
   cells1[i].paragraphs[0].style = "表格体"
# 修改背景颜色为白色
set_cell_background_color(rows.cells[0], "#FFFFFF")

# 查看文档内所有的样式
for sts in document.styles:
   print(sts)
# 查看word文档结构
print(document._element.xml)

4 总结

最终产生的效果如下图所示:

python办公之python编辑word

在本章中,介绍了怎么使用python-docx创建wor文档,并举例说明了创建段落,表格,标题,图片等要点。

来源:https://juejin.cn/post/7035867058642354207

标签:python,办公,编辑,word
0
投稿

猜你喜欢

  • asp.net微信开发(永久素材管理)

    2023-07-21 13:02:45
  • python如何发布自已pip项目的方法步骤

    2023-01-22 01:17:36
  • 什么样的图标更具有可用性

    2007-10-16 17:47:00
  • 一个JSP页面导致的tomcat内存溢出的解决方法

    2023-06-30 04:14:41
  • PSD to CSS —— CSS布局实战新概念系列教程

    2009-05-30 16:40:00
  • 解决图片撑大问题

    2009-09-22 14:51:00
  • Python理解递归的方法总结

    2022-06-10 03:31:08
  • golang实现分页算法实例代码

    2023-07-09 20:50:51
  • Python基于socket模块实现UDP通信功能示例

    2023-08-25 06:45:27
  • php异步:在php中使用fsockopen curl实现类似异步处理的功能方法

    2023-07-21 14:48:58
  • Python实现动态添加类的属性或成员函数的解决方法

    2021-05-13 17:13:41
  • JS分割字符串并放入数组的函数

    2023-08-05 15:31:03
  • 如何把数据库记录显示到列表框里去?

    2009-11-06 13:48:00
  • Python中使用双下划线防止类属性被覆盖问题

    2021-05-04 04:02:44
  • python直接获取API传递回来的参数方法

    2023-11-10 18:01:59
  • Dreamweaver基础技巧全面接触

    2010-03-25 12:23:00
  • 对python 多线程中的守护线程与join的用法详解

    2021-08-11 10:56:51
  • DateDiff函数在Sql与Access中的区别

    2009-06-04 18:02:00
  • python基础教程项目五之虚拟茶话会

    2022-10-25 02:08:47
  • Python入门之后再看点什么好?

    2023-07-17 07:04:29
  • asp之家 网络编程 m.aspxhome.com