Python3 读取Word文件方式
作者:医然 时间:2021-03-21 22:36:37
我的环境,Windows10,Python3.6.3
查询了很多有关资料,发现都是Python2版本操作Word文件的,所以就写了这篇短小的文章。
一、安装 docx
pip install docx
完了之后,导入:import docx
发现报错:ModuleNotFoundError: No module named ‘exceptions'
说没有 exceptions 这个模块,由于Python3已经取消了这个模块,而 PendingDeprecationWarning 是内置
可以直接使用的,所以我们直接进入文件(这个要看你报错显示的路径):
D:\ProgramFiles\Anaconda3\lib\site-packages\docx.py
把 from exceptions import PendingDeprecationWarning 注释掉即可
示例代码:
import docx
def get_docx(file_name):
d = docx.opendocx(file_name)
doc = docx.getdocumenttext(d)
return doc
doc = get_docx('tt.docx')
print(doc) # 输出行数:1075
for d in doc[:5]:
print(d) # 打印前5行
'''输出:
一、补益之剂
1.四君子汤
四君子汤中和义,参术茯苓甘草比
益以夏陈名六君,祛痰补气阳虚饵
除却半夏名异功,或加香砂胃寒使
'''
来源:https://blog.csdn.net/a649344475/article/details/81162381
标签:Python3,读取,Word
0
投稿
猜你喜欢
thinkPHP学习笔记之安装配置篇
2023-09-27 18:32:03
python字典序问题实例
2023-07-31 05:46:58
三达不溜:www
2009-03-28 11:44:00
python类继承与子类实例初始化用法分析
2023-03-31 17:14:24
详解Python3的TFTP文件传输
2023-06-01 22:29:17
Firebox 3 后退后按钮 diasabled 状态不恢复的一个解决方案
2008-11-06 12:28:00
PHP实现获取两个以逗号分割的字符串的并集
2023-06-01 03:24:53
简介Python中用于处理字符串的center()方法
2021-04-15 20:47:17
Python使用RPC例子
2021-04-11 23:26:51
微软建议的ASP性能优化28条守则(4)
2008-02-26 17:57:00
python使用BeautifulSoup分页网页中超链接的方法
2023-11-21 07:24:49
快速创建python 虚拟环境
2023-10-04 08:58:31
Oracle常用dump命令,记录一下备查。
2009-03-04 10:27:00
解析zend studio中直接导入svn中的项目的方法步骤
2023-09-05 02:21:01
从 msxml6.dll 中获取 DOMDocument 对象的方法与属性
2009-02-22 18:46:00
Flask web上传获取图像Image读取并使用方式
2021-06-14 11:37:58
Python报错SyntaxError:unexpected EOF while parsing的解决办法
2023-10-01 10:29:54
python Pandas之DataFrame索引及选取数据
2023-01-01 02:27:10
Python基础之模块相关知识总结
2021-09-06 21:39:39
JavaScript 获取客户端计算机硬件及系统信息
2009-01-13 17:59:00