对Python中 \\r, \\n, \\r\\n的彻底理解
作者:脱离低级趣味 时间:2022-09-14 07:00:15
回车和换行的历史:
机械打字机有回车和换行两个键作用分别是:
换行就是把滚筒卷一格,不改变水平位置。 (即移到下一行,但不是行首,而是和上一行水平位置一样)
回车就是把水平位置复位,不卷动滚筒。 (即将光标移到行首,但是不会移到下一行,如果继续输入的话会覆盖掉前面的内容)
Enter = 回车+换行(\r\n)
理解:
\n是换行,英文是New line
\r是回车,英文是Carriage return
unix换行:\n(0x0A)
MAC回车:\r(0x0D)
WIN回车换行:\r\n(0x0D,0x0A)
补充知识: python文件输出unicode转码
有时候利用python爬虫获得的文件是Unicode的编码格式。输出大概是:
{"\u5185\u5bb9": "\u5c11\u5e74\u4e0d\u8bc6\u6101\u6ecb\u5473\uff0c\u7231\u4e0a\u5c42\u697c\u3002\u7231\u4e0a\u5c42\u697c\u3002\u4e3a\u8d4b\u65b0\u8bcd\u5f3a\u8bf4\u6101\u3002 \u800c\u4eca\u8bc6\u5c3d\u6101\u6ecb\u5473\uff0c\u6b32\u8bf4\u8fd8\u4f11\u3002\u6b32\u8bf4\u8fd8\u4f11\u3002\u5374\u9053\u5929\u51c9\u597d\u4e2a\u79cb\u3002scrapy\u4e2d\u6587\u7f51\uff08http://www.scrapyd.cn\uff09\u6574\u7406", "\u4f5c\u8005": "\u8f9b\u5f03\u75be"},
类似这种。
根据不同的编码,读取文件输出的时候,加上对应的解码方式就行了。如:
with open("mingyan.json",'r',encoding='unicode_escape')as file:
message = file.read()
print(message)
print(type(message))
encoding = ‘编码方式'
编码方式其实有很多。一般文件上面有个
# test for with.py
# -*- coding: utf-8 -*-
# __author__ = 'Carina'
这就是指出了编码方式。方便以后的该文件的处理操作
来源:https://www.cnblogs.com/yc3110/p/10809564.html