python中文编码问题小结

作者:shichen2014 时间:2022-12-22 23:14:14 

中文编码问题一直是Python程序设计中很头痛的问题,本文对此较为详细的进行了总结归纳。具体如下:
 
当字符串是:'\u4e2d\u56fd' 


>>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66']
>>>str=s[0].decode('unicode_escape') #.encode("EUC_KR")
>>>print str
中国

当字符串是:' 东亚学团一中'


>>>print unichr(19996)

ord()支持unicode,可以显示特定字符的unicode号码,如:


>>>print ord('A')
65

只要和Unicode连接,就会产生Unicode字串。如:


>>> 'help'
'help'
>>> 'help,' + u'python'  
u'help,python'

对于ASCII(7位)兼容的字串,可和内置的str()函数把Unicode字串转换成ASCII字串。如:


>>> str(u'hello world')
'hello world'

对几个概念的理解:

ASCII码 用数据字 对应 相应的字符 如下图所示:

python中文编码问题小结

而中文 就是区位码对应汉字。如:“好” 的ASCII码为: 22909
 
unicode 编码 每个国家分一块。它有UTF-8、UTF-16、UTF-32等形式
中文范围 4E00-9FBF:这个范围内有 gbk,gb2312,
 
utf-8是基于unicode的 国际化的场合适合使用

gb2312和gb2312都是国标码 出现的较早 主要用于编解码常用汉字

希望本文所述对大家的Python程序设计有所帮助。

标签:python,中文,编码
0
投稿

猜你喜欢

  • Python栈的实现方法示例【列表、单链表】

    2023-07-20 15:51:42
  • Python调用C语言的方法【基于ctypes模块】

    2021-03-08 20:31:24
  • vue单页开发父子组件传值思路详解

    2024-04-28 10:54:15
  • Python中json库的操作指南

    2021-10-11 11:04:43
  • python自动化之Ansible的安装教程

    2023-06-28 13:58:23
  • 浅谈python numpy中nonzero()的用法

    2021-09-23 00:06:01
  • Linux系统中MySQL的常用操作命令

    2024-01-18 22:00:10
  • Python显示进度条的方法

    2023-05-25 07:38:30
  • getAllResponseHeaders获取网页的http头信息代码

    2010-03-31 14:31:00
  • python 实现控制鼠标键盘

    2023-08-04 09:37:56
  • 在Linux命令行终端中使用python的简单方法(推荐)

    2021-10-27 23:29:21
  • python里的条件语句和循环语句你了解多少

    2022-07-19 02:27:49
  • python批量下载网站马拉松照片的完整步骤

    2023-08-31 19:00:27
  • electron-vite新一代electron开发构建工具

    2023-07-02 17:03:57
  • python 随机生成10位数密码的实现代码

    2021-08-01 23:49:02
  • 白鸦:内容设计,初始内容

    2008-03-04 16:23:00
  • SQL Server 分页查询存储过程代码

    2024-01-21 04:53:40
  • Django获取该数据的上一条和下一条方法

    2022-12-07 13:36:35
  • Python深入浅出分析元类

    2022-01-10 09:09:00
  • 详解用webpack把我们的业务模块分开打包的方法

    2024-04-27 15:18:07
  • asp之家 网络编程 m.aspxhome.com