字符,字节和编码(2)
来源:我想网 时间:2009-12-09 15:59:00
1.2 字符,字节,字符串
理解编码的关键,是要把字符的概念和字节的概念理解准确。这两个概念容易混淆,我们在此做一下区分:
概念描述 | 举例 | |
字符 | 人们使用的记号,抽象意义上的一个符号。 | ‘1′, ‘中’, ‘a’, ‘$’, ‘¥’, …… |
字节 | 计算机中存储数据的单元,一个8位的二进制数,是一个很具体的存储空间。 | 0×01, 0×45, 0xFA, …… |
ANSI 字符串 | 在内存中,如果“字符”是以 ANSI 编码形式存在的,一个字符可能使用一个字节或多个字节来表示,那么我们称这种字符串为 ANSI 字符串或者多字节字符串。 | “中文123″ |
UNICODE 字符串 | 在内存中,如果“字符”是以在 UNICODE 中的序号存在的,那么我们称这种字符串为 UNICODE 字符串或者宽字节字符串。 | L”中文123″ |
由于不同 ANSI 编码所规定的标准是不相同的,因此,对于一个给定的多字节字符串,我们必须知道它采用的是哪一种编码规则,才能够知道它包含了哪些“字符”。而对于 UNICODE 字符串来说,不管在什么环境下,它所代表的“字符”内容总是不变的。
1.3 字符集与编码
各个国家和地区所制定的不同 ANSI 编码标准中,都只规定了各自语言所需的“字符”。比如:汉字标准(GB2312)中没有规定韩国语字符怎样存储。这些 ANSI 编码标准所规定的内容包含两层含义:
使用哪些字符。也就是说哪些汉字,字母和符号会被收入标准中。所包含“字符”的集合就叫做“字符集”。
规定每个“字符”分别用一个字节还是多个字节存储,用哪些字节来存储,这个规定就叫做“编码”。
各个国家和地区在制定编码标准的时候,“字符的集合”和“编码”一般都是同时制定的。因此,平常我们所说的“字符集”,比如:GB2312, GBK, JIS 等,除了有“字符的集合”这层含义外,同时也包含了“编码”的含义。
“UNICODE 字符集”包含了各种语言中使用到的所有“字符”。用来给 UNICODE 字符集编码的标准有很多种,比如:UTF-8, UTF-7, UTF-16, UnicodeLittle, UnicodeBig 等。
标签:字符,编码,乱码,字节
0
投稿
猜你喜欢
用CSS3和HTML5五步打造便签效果
2012-04-25 20:47:51
为什么要登录?
2010-11-30 21:41:00
网站制作流程及界面交互设计
2007-10-26 12:00:00
asp datediff 时间相减
2011-03-25 10:34:00
asp javascript picasa相册外链批量导出
2011-03-30 10:52:00
解决Microsoft VBScript 运行时错误 (0x800A0046) 没有权限的解决方案
2009-09-03 13:28:00
Oracle PL/SQL入门案例实践
2010-07-18 13:13:00
搜索结果页(SERP):前言
2009-07-22 20:56:00
用VBS语言实现的网页计算器源代码
2007-12-26 17:09:00
discuz 2.0整合asp系统,用户添加函数
2011-04-02 11:08:00
Oracle学习笔记(一)
2012-01-05 18:51:44
css2.1实现多重背景和边框效果
2010-06-23 19:02:00
Oracle11.2 命令行手工最简创建数据库的过程
2009-09-14 12:07:00
建立三层结构的ASP应用程序
2009-01-21 19:41:00
详解如何用SQLyog来分析MySQL数据库
2008-10-13 12:35:00
Asp中如何快速分页的技巧
2008-05-17 12:02:00
使用php数据缓存技术提高执行效率
2023-05-24 23:14:24
T-SQL 查询语句的执行顺序解析
2011-11-03 17:04:06
ASP四级联动做法
2009-07-03 15:35:00
javascript 常见汉字转换成拼音工具
2008-03-03 16:54:00