Python读写docx文件的方法

作者:杨仕航 时间:2023-08-16 21:15:11 

Python读写word文档有现成的库可以处理。我这里采用 python-docx。可以用pip install python-docx安装一下。

这里说一句,ppt和excel也有类似的库哦,而且是直接读取文件里面的xml数据。所以doc格式得另找其他库处理,doc格式不是基于xml的。

帮助文档:http://python-docx.readthedocs.org/en/latest/

1、新建或打开文件。这个比较简单用docx的Document类,若指定路径则是打开文档;若没有指定路径则是新建文档


#coding:utf-8
import docx

#新建文档
doc_new = docx.Document()

#读取文档
doc = docx.Document(ur'C:\1.docx')

2、保存文件。有打开,就有保存。用Document类的save方法,其中参数是保存的文件路径,或者要保存的文件流。一般指定路径即可。


doc.save(path_or_stream)

3、对象集合。python-docx包含了word文档的相关对象集合。


doc.paragraphs #段落集合
doc.tables #表格集合
doc.sections #节 集合
doc.styles #样式集合
doc.inline_shapes #内置图形 等等...

4、插入段落。段落是word最基本的对象之一。


doc.add_paragraph(u'第一段',style=None) #插入一个段落,文本为“第一段”
#默认是不应用样式,这里也可以不写style参数,或者指定一个段落样式
doc.add_paragraph(u'第二段',style='Heading 2')

#这些样式都是word默认带有的样式,可以直接罗列出来有哪些段落样式
print [s.name for s in doc.styles if s.type==1]

5、新增样式。这个帮助文档里面说得不仔细,而且还是英文的。我手头上的项目用到这个,就自己琢磨出怎么使用,如下。


#coding:utf-8
from docx import Document
from docx.shared import RGBColor #这个是docx的颜色类

#新建文档
doc = Document()

#新增样式(第一个参数是样式名称,第二个参数是样式类型:1代表段落;2代表字符;3代表表格)
style = doc.styles.add_style('style name 1', 2)

#设置具体样式(修改样式字体为蓝色,当然还可以修改其他的,大家自己尝试)
style.font.color.rgb = RGBColor(0x0, 0x0, 0xff)

6、应用字符样式。字符自然是在段落里面的,可以采用下面方法给段落追加文字和设置字符样式。


#插入一个空白段落
p = doc.add_paragraph('')
p.add_run('123', style="Heading 1 Char")
p.add_run('456')
p.add_run('789', style="Heading 2 Char")

#这样一个段落就应用了两个字符样式,中间“456”就没应用样式
print p.text #输出结果是u'123456789' 也还是连续的

7、设置字体。当然可以不用通过设置样式对某些字进行设置,也可以直接设置。


p = doc.add_paragraph('')
r = p.add_run('123')
r.font.bold = True #加粗
r.font.italic = True #倾斜 等等...

8、表格操作。表格也是经常用到的一种对象类型。


#新建一个2x3的表格,style可以不写
table=doc.add_table(rows=2,cols=3,style=None)

#可以用table 的rows和columns得到这个表格的行数和列数
print len(table.rows)
print len(table.columns)

#遍历表格
for row in table.rows:
row.cells[0].text = '1'
#print row.cells[0].text

#新增行或列
table.add_row()
table.add_column()

Word常见操作差不多就是这些。大家可以查看帮助文档,也可以用dir和help查看对象的方法属性和帮助。

来源:http://yshblog.com/blog/40

标签:Python,读写,docx
0
投稿

猜你喜欢

  • Django使用Channels实现WebSocket的方法

    2023-12-10 16:20:05
  • go语言分布式id生成器及分布式锁介绍

    2024-01-30 21:20:43
  • MySQL 逻辑备份与恢复测试的相关总结

    2024-01-19 14:19:20
  • python如何读取.mtx文件

    2023-11-17 21:26:55
  • PyTorch搭建CNN实现风速预测

    2022-09-11 17:40:19
  • Python Pygame实战之赛车游戏的实现

    2022-09-17 12:12:14
  • pytorch finetuning 自己的图片进行训练操作

    2023-03-17 00:46:53
  • 讲解MaxDB数据库和MySQL数据库的主要差别

    2009-01-04 13:04:00
  • 深入了解Python enumerate和zip

    2021-11-15 12:08:23
  • Vue组件渲染与更新实现过程浅析

    2023-07-02 17:00:43
  • js/jq仿window文件夹框选操作插件

    2024-04-16 09:50:23
  • Win10下python 2.7与python 3.7双环境安装教程图解

    2022-12-14 06:03:16
  • python中的zip模块

    2023-09-13 07:49:56
  • python如何导入自己的模块

    2022-05-21 08:14:57
  • 通过python的matplotlib包将Tensorflow数据进行可视化的方法

    2023-04-21 17:37:43
  • 在Python中操作文件之read()方法的使用教程

    2021-10-28 19:23:46
  • Mybatis出现ORA-00911: invalid character的解决办法

    2024-01-19 02:41:21
  • PHP中重启php-fpm的几种方法汇总

    2023-06-12 21:05:24
  • XML 增、删、改和查示例

    2008-09-05 17:12:00
  • Python编写合并字典并实现敏感目录的小脚本

    2023-05-28 18:36:29
  • asp之家 网络编程 m.aspxhome.com