浅谈Python2之汉字编码为unicode的问题(即类似\\xc3\\xa4)

作者:mighty13 时间:2021-12-14 07:07:19 

Python2中编码相关的问题很是让人蛋疼,特别是中文字符。

比如本文所述的中文网页GBK编码的诡异问题。

现象

例如:盲录職氓聭聵,其实网页里面正常的应该是会员

分析

接着上面的例子,会员这部分乱码通过repr()函数求值得到如下结果


\xc3\xa4\xc2\xbc\xc2\x9a\xc3\xa5\xc2\x91\xc2\x98

使用type()函数求值得到的结果为unicode

eval(repr())出来值为


盲录職氓聭聵

通过查表上述6个汉字对应


c3a4 c2bc c29a c3a5 c291 c298

而上面内容对应的UTF-8值就是会员

解决方法

相当诡异的是本身是unicode编码,却被当作GBK系列来解码,结果导致乱码。因此将这些字符先编码再解决解决问题。


encode('raw_unicode_escape').decode()

来源:https://blog.csdn.net/mighty13/article/details/78231678

标签:Python2,汉字编码,unicode
0
投稿

猜你喜欢

  • SQL Server 2022 AlwaysOn新特性之包含可用性组详解

    2024-01-26 07:51:49
  • python list语法学习(带例子)

    2023-08-20 05:36:40
  • Mysql性能优化案例 - 覆盖索引分享

    2024-01-27 15:16:59
  • Keras设置以及获取权重的实现

    2021-11-22 10:04:09
  • python字符串拼接+和join的区别详解

    2021-10-19 01:26:39
  • python 实现存储数据到txt和pdf文档及乱码问题的解决

    2023-02-05 03:40:00
  • 分享11个Python自动化操作Excel的方法

    2022-11-18 08:10:39
  • python安装dlib库报错问题及解决方法

    2023-01-27 16:24:41
  • 使用Python编程分析火爆全网的鱿鱼游戏豆瓣影评

    2023-10-11 00:35:26
  • Vue3响应式对象是如何实现的(2)

    2024-05-09 15:10:01
  • 使用Title提升可访问性二

    2009-11-16 12:53:00
  • JavaScript实现星座查询功能 附详细代码

    2024-05-05 09:15:43
  • jquery实现表单验证并阻止非法提交

    2023-07-02 05:31:28
  • Windows下将Python文件打包成.EXE可执行文件的方法

    2021-08-04 02:47:59
  • asp如何编写翻页函数?

    2009-11-07 18:46:00
  • Mysql 数据库结构及索引类型

    2024-01-20 23:40:35
  • django修改models重建数据库的操作

    2024-01-12 21:58:07
  • Python中使用jpype调用Jar包中的实现方法

    2023-04-24 13:48:05
  • MySQL通透详解架构设计

    2024-01-27 19:00:51
  • Python基于smtplib协议实现发送邮件

    2021-03-02 07:26:36
  • asp之家 网络编程 m.aspxhome.com