Python3 读取Word文件方式

作者:医然 时间:2021-03-21 22:36:37 

我的环境,Windows10,Python3.6.3

查询了很多有关资料,发现都是Python2版本操作Word文件的,所以就写了这篇短小的文章。

一、安装 docx

pip install docx

完了之后,导入:import docx

发现报错:ModuleNotFoundError: No module named ‘exceptions'

说没有 exceptions 这个模块,由于Python3已经取消了这个模块,而 PendingDeprecationWarning 是内置

可以直接使用的,所以我们直接进入文件(这个要看你报错显示的路径):

D:\ProgramFiles\Anaconda3\lib\site-packages\docx.py

把 from exceptions import PendingDeprecationWarning 注释掉即可

示例代码:


import docx

def get_docx(file_name):
d = docx.opendocx(file_name)
doc = docx.getdocumenttext(d)
return doc

doc = get_docx('tt.docx')
print(doc) # 输出行数:1075
for d in doc[:5]:
print(d) # 打印前5行

'''输出:
一、补益之剂
1.四君子汤
四君子汤中和义,参术茯苓甘草比
益以夏陈名六君,祛痰补气阳虚饵
除却半夏名异功,或加香砂胃寒使
'''

来源:https://blog.csdn.net/a649344475/article/details/81162381

标签:Python3,读取,Word
0
投稿

猜你喜欢

  • thinkPHP学习笔记之安装配置篇

    2023-09-27 18:32:03
  • python字典序问题实例

    2023-07-31 05:46:58
  • 三达不溜:www

    2009-03-28 11:44:00
  • python类继承与子类实例初始化用法分析

    2023-03-31 17:14:24
  • 详解Python3的TFTP文件传输

    2023-06-01 22:29:17
  • Firebox 3 后退后按钮 diasabled 状态不恢复的一个解决方案

    2008-11-06 12:28:00
  • PHP实现获取两个以逗号分割的字符串的并集

    2023-06-01 03:24:53
  • 简介Python中用于处理字符串的center()方法

    2021-04-15 20:47:17
  • Python使用RPC例子

    2021-04-11 23:26:51
  • 微软建议的ASP性能优化28条守则(4)

    2008-02-26 17:57:00
  • python使用BeautifulSoup分页网页中超链接的方法

    2023-11-21 07:24:49
  • 快速创建python 虚拟环境

    2023-10-04 08:58:31
  • Oracle常用dump命令,记录一下备查。

    2009-03-04 10:27:00
  • 解析zend studio中直接导入svn中的项目的方法步骤

    2023-09-05 02:21:01
  • 从 msxml6.dll 中获取 DOMDocument 对象的方法与属性

    2009-02-22 18:46:00
  • Flask web上传获取图像Image读取并使用方式

    2021-06-14 11:37:58
  • Python报错SyntaxError:unexpected EOF while parsing的解决办法

    2023-10-01 10:29:54
  • python Pandas之DataFrame索引及选取数据

    2023-01-01 02:27:10
  • Python基础之模块相关知识总结

    2021-09-06 21:39:39
  • JavaScript 获取客户端计算机硬件及系统信息

    2009-01-13 17:59:00
  • asp之家 网络编程 m.aspxhome.com