浅谈Python2之汉字编码为unicode的问题(即类似\\xc3\\xa4)
作者:mighty13 时间:2021-12-14 07:07:19
Python2中编码相关的问题很是让人蛋疼,特别是中文字符。
比如本文所述的中文网页GBK编码的诡异问题。
现象
例如:盲录職氓聭聵,其实网页里面正常的应该是会员
分析
接着上面的例子,会员这部分乱码通过repr()函数求值得到如下结果
\xc3\xa4\xc2\xbc\xc2\x9a\xc3\xa5\xc2\x91\xc2\x98
使用type()函数求值得到的结果为unicode
eval(repr())出来值为
盲录職氓聭聵
通过查表上述6个汉字对应
c3a4 c2bc c29a c3a5 c291 c298
而上面内容对应的UTF-8值就是会员
解决方法
相当诡异的是本身是unicode编码,却被当作GBK系列来解码,结果导致乱码。因此将这些字符先编码再解决解决问题。
encode('raw_unicode_escape').decode()
来源:https://blog.csdn.net/mighty13/article/details/78231678
标签:Python2,汉字编码,unicode
0
投稿
猜你喜欢
SQL Server 2022 AlwaysOn新特性之包含可用性组详解
2024-01-26 07:51:49
python list语法学习(带例子)
2023-08-20 05:36:40
Mysql性能优化案例 - 覆盖索引分享
2024-01-27 15:16:59
Keras设置以及获取权重的实现
2021-11-22 10:04:09
python字符串拼接+和join的区别详解
2021-10-19 01:26:39
python 实现存储数据到txt和pdf文档及乱码问题的解决
2023-02-05 03:40:00
分享11个Python自动化操作Excel的方法
2022-11-18 08:10:39
python安装dlib库报错问题及解决方法
2023-01-27 16:24:41
使用Python编程分析火爆全网的鱿鱼游戏豆瓣影评
2023-10-11 00:35:26
Vue3响应式对象是如何实现的(2)
2024-05-09 15:10:01
使用Title提升可访问性二
2009-11-16 12:53:00
JavaScript实现星座查询功能 附详细代码
2024-05-05 09:15:43
jquery实现表单验证并阻止非法提交
2023-07-02 05:31:28
Windows下将Python文件打包成.EXE可执行文件的方法
2021-08-04 02:47:59
asp如何编写翻页函数?
2009-11-07 18:46:00
Mysql 数据库结构及索引类型
2024-01-20 23:40:35
django修改models重建数据库的操作
2024-01-12 21:58:07
Python中使用jpype调用Jar包中的实现方法
2023-04-24 13:48:05
MySQL通透详解架构设计
2024-01-27 19:00:51
Python基于smtplib协议实现发送邮件
2021-03-02 07:26:36