字符,字节和编码(3)

来源:我想网 时间:2009-12-09 15:59:00 

1.4 常用的编码简介

简单介绍一下常用的编码规则,为后边的章节做一个准备。在这里,我们根据编码规则的特点,把所有的编码分成三类:

分类编码标准说明
单字节字符编码ISO-8859-1最简单的编码规则,每一个字节直接作为一个 UNICODE 字符。比如,[0xD6, 0xD0] 这两个字节,通过 iso-8859-1 转化为字符串时,将直接得到 [0x00D6, 0x00D0] 两个 UNICODE 字符,即 “ÖД。


反之,将 UNICODE 字符串通过 iso-8859-1 转化为字节串时,只能正常转化 0~255 范围的字符。

ANSI 编码GB2312,
BIG5,
Shift_JIS,
ISO-8859-2 ……
把 UNICODE 字符串通过 ANSI 编码转化为“字节串”时,根据各自编码的规定,一个 UNICODE 字符可能转化成一个字节或多个字节。


反之,将字节串转化成字符串时,也可能多个字节转化成一个字符。比如,[0xD6, 0xD0] 这两个字节,通过 GB2312 转化为字符串时,将得到 [0x4E2D] 一个字符,即 ‘中’ 字。

“ANSI 编码”的特点:
1. 这些“ANSI 编码标准”都只能处理各自语言范围之内的 UNICODE 字符。
2. “UNICODE 字符”与“转换出来的字节”之间的关系是人为规定的。

UNICODE 编码UTF-8,
UTF-16, UnicodeBig ……
与“ANSI 编码”类似的,把字符串通过 UNICODE 编码转化成“字节串”时,一个 UNICODE 字符可能转化成一个字节或多个字节。


与“ANSI 编码”不同的是:
1. 这些“UNICODE 编码”能够处理所有的 UNICODE 字符。
2. “UNICODE 字符”与“转换出来的字节”之间是可以通过计算得到的。

我 们实际上没有必要去深究每一种编码具体把某一个字符编码成了哪几个字节,我们只需要知道“编码”的概念就是把“字符”转化成“字节”就可以了。对于 “UNICODE 编码”,由于它们是可以通过计算得到的,因此,在特殊的场合,我们可以去了解某一种“UNICODE 编码”是怎样的规则。

标签:字符,编码,乱码,字节
0
投稿

猜你喜欢

  • jQuery点击改变链接的文本

    2010-03-19 18:11:00
  • 详述如何提高MySQL中数据装载效率

    2009-10-26 10:27:00
  • HTML5拿什么取代Flash?

    2010-05-10 20:37:00
  • Dhtml网页实例教程

    2007-10-09 13:39:00
  • MySQL中SQL的单字节注入与宽字节注入

    2009-03-25 14:49:00
  • 聚族索引、非聚族索引、组合索引的含义和用途

    2010-07-02 21:51:00
  • 科学与艺术兼顾的有效网页视觉设计

    2007-09-18 18:03:00
  • Linux mysql安装修改root密码服务

    2010-10-14 13:59:00
  • JavaScript 全半角转换

    2010-02-04 17:14:00
  • web2.0中流行的设计元素:颜色

    2007-12-10 12:16:00
  • javascript拼音搜索引擎

    2011-08-29 15:42:14
  • 简易CSS相册源代码

    2008-04-18 12:28:00
  • MySQL故障:mysqld-nt: Sort aborted错误的原因及解决办法

    2009-11-03 14:32:00
  • AJAX实现web页面中级联菜单的设计

    2007-09-26 13:37:00
  • 加密SQL Anywhere 提升政府行业数据安全

    2008-12-03 15:25:00
  • 详解MySQL数据类型之数字类型正确使用

    2010-06-20 15:02:00
  • PHP工厂模式Factory Pattern的实现及特点

    2023-05-25 05:19:24
  • SQL语句练习实例之二——找出销售冠军

    2011-10-24 19:52:45
  • asp好用的函数集分享

    2011-09-13 12:49:07
  • div + ajax + 分页函数

    2009-10-18 11:28:00
  • asp之家 网络编程 m.aspxhome.com