Python格式化文本段落之textwrap库

作者:李元静 时间:2023-11-23 00:40:56 

一、前言

前文是针对普通的字符串数据进行处理。今天,我们要讲解的textwrap库,是对多文本进行处理的库。比如对于段落的缩进,填充,截取等,都可以通过textwrap库进行操作。

特别是自己编写打印程序的时候,可以使用该库进行校正文档非常便捷,大大的加快了文本格式的处理。话不多说,我们来一步步学习textwrap库。

二、切割文档

一般来说,一篇英文文档在不考虑换行的情况下,默认是填充整个文档行才切换至下一行的。现在,我们需要保证每行必须有且仅有50个字符怎么办?

我们可以使用textwrap.fill方法,具体代码如下:


import textwrap

content = ""
with open('英文文档.txt', 'r', encoding='utf-8') as f:
   content = f.read()
print(content)
print("----")
print(textwrap.fill(content, width=50))

运行之后,分割线上下分别为原文档与textwrap.fill处理后的文档:

Python格式化文本段落之textwrap库

读者可以自行测试,保证每行加上空格不多于50个字符,而且也没有任何的缩进效果。

三、文本缩进

既然通过textwrap.fill达不到文档缩进的效果。下面我们再来认识一个新的函数textwrap.indent()函数。


import textwrap

content = ""
with open('英文文档.txt', 'r', encoding='utf-8') as f:
   content = f.read()
print(textwrap.indent(content,"  "))

textwrap.indent()函数具有两个参数,一个是需要缩进的字符串,另一个是匹配的缩进字符。比如这里就是空了2格,那么字符串每行前面都会缩进2格。

Python格式化文本段落之textwrap库

当然,我们还可以选择特定的行进行缩进,textwrap.indent()函数还有第3个参数predicate,需要给它提供一个方法设置特定的规则。具体代码如下:


import textwrap

def choice_line(line):
   return len(line) % 2 == 0

content = ""
with open('英文文档.txt', 'r', encoding='utf-8') as f:
   content = f.read()
indent_str = textwrap.indent(content, "  ",predicate=choice_line)
print(indent_str)

这里,博主设置的规则是,当某行的字符串个数除2取余数等于0时,就缩进。否则便不缩进。运行之后,效果如下:

Python格式化文本段落之textwrap库

四、文本去缩进

既然有缩进文本,那么肯定就也有反向的操作去除缩进。下面,我们来通过函数textwrap.dedent()来去除缩进。


import textwrap

content = ""
with open('英文文档.txt', 'r', encoding='utf-8') as f:
   content = f.read()
indent_str = textwrap.indent(content, "  ")
print(textwrap.dedent(indent_str))

textwrap.dedent()函数只有需要操作的文本一个参数,效果如下:

Python格式化文本段落之textwrap库

这样,我们就实现了去除缩进。

五、截断文本

除了缩进与截断之外,我们还可以通过textwrap库截断文本进行操作。比如,我们常常看到某些资讯App简介会这样写“某某什么什么等等[…]”描述,这就是截取某文开头文字形成的结果字符串,textwrap.shorten正好可以完整实现,而且不会截断英文。


import textwrap

content = ""
with open('英文文档.txt', 'r', encoding='utf-8') as f:
   content = f.read()
print(textwrap.shorten(content, 100))

运行之后,效果如下:

Python格式化文本段落之textwrap库

来源:https://liyuanjinglyj.blog.csdn.net/article/details/115492265

标签:Python,textwrap,库,格式化
0
投稿

猜你喜欢

  • PHP生成HTML静态页面实例代码

    2023-10-28 12:05:01
  • Centos7中MySQL数据库使用mysqldump进行每日自动备份的编写

    2024-01-17 11:52:41
  • 将Python脚本打包成exe文件

    2021-06-08 12:21:55
  • Hibernate4在MySQL5.1以上版本创建表出错 type=InnDB

    2024-01-14 23:45:17
  • Python实现定时任务的八种方案详解

    2022-04-19 06:54:03
  • Javascript Math对象

    2024-05-03 15:59:39
  • Python对口红进行数据分析来选定情人节礼物

    2022-01-23 07:38:08
  • 实例讲解Access数据库在线压缩的实现方法

    2008-11-28 14:29:00
  • Python Django切换MySQL数据库实例详解

    2024-01-21 02:02:47
  • 浅析Python 序列化与反序列化

    2023-05-01 14:36:16
  • Django自定义分页效果

    2023-12-06 00:09:04
  • PHP获取表单所有复选框的值的方法

    2024-05-13 09:24:34
  • Python处理json字符串转化为字典的简单实现

    2022-05-15 01:42:58
  • python高斯分布概率密度函数的使用详解

    2023-08-18 15:07:24
  • 十个节省时间的MySQL命令小结

    2024-01-13 07:18:14
  • 详解tensorflow训练自己的数据集实现CNN图像分类

    2023-02-28 10:47:04
  • python生成验证码图片代码分享

    2021-08-24 11:52:14
  • Python小游戏之300行代码实现俄罗斯方块

    2023-10-09 17:35:33
  • python中有帮助函数吗

    2021-06-15 15:50:02
  • javascript代码实现简易计算器

    2024-04-16 08:57:46
  • asp之家 网络编程 m.aspxhome.com