Python打印不合法的文件名

作者:David Beazley 时间:2021-06-29 03:40:19 

问题

你的程序获取了一个目录中的文件名列表,但是当它试着去打印文件名的时候程序崩溃, 出现了 UnicodeEncodeError 异常和一条奇怪的消息—— surrogates not allowed 。

解决方案

当打印未知的文件名时,使用下面的方法可以避免这样的错误:


def bad_filename(filename):
 return repr(filename)[1:-1]

try:
 print(filename)
except UnicodeEncodeError:
 print(bad_filename(filename))

如果你有代码需要操作文件名或者将文件名传递给 open() 这样的函数,一切都能正常工作。 只有当你想要输出文件名时才会碰到些麻烦(比如打印输出到屏幕或日志文件等)。 特别的,当你想打印上面的文件名列表时,你的程序就会崩溃:


>>> for name in files:
...   print(name)
...
spam.py
Traceback (most recent call last):
 File "<stdin>", line 2, in <module>
UnicodeEncodeError: 'utf-8' codec can't encode character '\udce4' in
position 1: surrogates not allowed
>>>

>>> for name in files:
... try:
...   print(name)
... except UnicodeEncodeError:
...   print(bad_filename(name))
...
spam.py
b\udce4d.txt
foo.txt
>>>

在 bad_filename() 函数中怎样处置取决于你自己。 另外一个选择就是通过某种方式重新编码,示例如下:


def bad_filename(filename):
 temp = filename.encode(sys.getfilesystemencoding(), errors='surrogateescape')
 return temp.decode('latin-1')

译者注:

surrogateescape:
这种是Python在绝大部分面向OS的API中所使用的错误处理器,
它能以一种优雅的方式处理由操作系统提供的数据的编码问题。
在解码出错时会将出错字节存储到一个很少被使用到的Unicode编码范围内。
在编码时将那些隐藏值又还原回原先解码失败的字节序列。
它不仅对于OS API非常有用,也能很容易的处理其他情况下的编码错误。

使用这个版本产生的输出如下:


>>> for name in files:
...   try:
...     print(name)
...   except UnicodeEncodeError:
...     print(bad_filename(name))
...
spam.py
b&auml;d.txt
foo.txt
>>>

这一小节主题可能会被大部分读者所忽略。但是如果你在编写依赖文件名和文件系统的关键任务程序时, 就必须得考虑到这个。否则你可能会在某个周末被叫到办公室去调试一些令人费解的错误。

来源:https://python3-cookbook.readthedocs.io/zh_CN/latest/c05/p15_printing_bad_filenames.html

标签:Python,打印,不合法,文件名
0
投稿

猜你喜欢

  • python 通过dict(zip)和{}的方式构造字典的方法

    2023-10-03 00:05:12
  • Python中的Decorator装饰器的使用示例

    2023-07-02 10:37:44
  • Python实现PS滤镜中马赛克效果示例

    2021-05-25 20:56:59
  • 数据库连接字符串的常见问题和解决方法

    2008-11-28 15:16:00
  • Python字典遍历的陷阱

    2022-11-16 21:59:11
  • Python使用matplotlib实现交换式图形显示功能示例

    2023-04-25 06:10:49
  • asp智能脏话过滤系统v1.0

    2011-04-14 11:00:00
  • 在windows下Python打印彩色字体的方法

    2023-05-19 07:03:32
  • 非常全面的Python常见基础面试题及答案

    2022-11-14 17:03:33
  • 解决pycharm启动后总是不停的updating indices...indexing的问题

    2023-03-05 07:35:38
  • 基于python实现删除指定文件类型

    2022-02-16 06:19:48
  • Yii2 rbac权限控制之菜单menu实例教程

    2023-11-14 10:41:19
  • python利用beautifulSoup实现爬虫

    2022-05-17 21:10:34
  • 瀑布流布局浅析

    2011-09-16 20:18:09
  • python实现Windows电脑定时关机

    2021-05-17 02:46:58
  • SQL Server 2008 到底需要使用哪些端口?

    2012-11-30 20:29:41
  • 对python实时得到鼠标位置的示例讲解

    2022-02-21 10:01:25
  • 柳永法:vbs或asp采集文章时网页编码问题

    2009-02-04 10:50:00
  • 官方是这样定义 DOCTYPE HTML PUBLIC 的

    2007-05-31 09:43:00
  • 零基础学习python偏函数语法的推导方法步骤

    2021-07-17 20:59:18
  • asp之家 网络编程 m.aspxhome.com