字符,字节和编码(2)

来源:我想网 时间:2009-12-09 15:59:00 

1.2 字符,字节,字符串

理解编码的关键,是要把字符的概念和字节的概念理解准确。这两个概念容易混淆,我们在此做一下区分:


概念描述举例
字符人们使用的记号,抽象意义上的一个符号。‘1′, ‘中’, ‘a’, ‘$’, ‘¥’, ……
字节计算机中存储数据的单元,一个8位的二进制数,是一个很具体的存储空间。0×01, 0×45, 0xFA, ……
ANSI
字符串
在内存中,如果“字符”是以 ANSI 编码形式存在的,一个字符可能使用一个字节或多个字节来表示,那么我们称这种字符串为 ANSI 字符串或者多字节字符串“中文123″
UNICODE
字符串
在内存中,如果“字符”是以在 UNICODE 中的序号存在的,那么我们称这种字符串为 UNICODE 字符串或者宽字节字符串L”中文123″

由于不同 ANSI 编码所规定的标准是不相同的,因此,对于一个给定的多字节字符串,我们必须知道它采用的是哪一种编码规则,才能够知道它包含了哪些“字符”。而对于 UNICODE 字符串来说,不管在什么环境下,它所代表的“字符”内容总是不变的。

1.3 字符集与编码

各个国家和地区所制定的不同 ANSI 编码标准中,都只规定了各自语言所需的“字符”。比如:汉字标准(GB2312)中没有规定韩国语字符怎样存储。这些 ANSI 编码标准所规定的内容包含两层含义:

  1. 使用哪些字符。也就是说哪些汉字,字母和符号会被收入标准中。所包含“字符”的集合就叫做“字符集”。

  2. 规定每个“字符”分别用一个字节还是多个字节存储,用哪些字节来存储,这个规定就叫做“编码”。

各个国家和地区在制定编码标准的时候,“字符的集合”和“编码”一般都是同时制定的。因此,平常我们所说的“字符集”,比如:GB2312, GBK, JIS 等,除了有“字符的集合”这层含义外,同时也包含了“编码”的含义。

UNICODE 字符集”包含了各种语言中使用到的所有“字符”。用来给 UNICODE 字符集编码的标准有很多种,比如:UTF-8, UTF-7, UTF-16, UnicodeLittle, UnicodeBig 等。

标签:字符,编码,乱码,字节
0
投稿

猜你喜欢

  • 用CSS3和HTML5五步打造便签效果

    2012-04-25 20:47:51
  • 为什么要登录?

    2010-11-30 21:41:00
  • 网站制作流程及界面交互设计

    2007-10-26 12:00:00
  • asp datediff 时间相减

    2011-03-25 10:34:00
  • asp javascript picasa相册外链批量导出

    2011-03-30 10:52:00
  • 解决Microsoft VBScript 运行时错误 (0x800A0046) 没有权限的解决方案

    2009-09-03 13:28:00
  • Oracle PL/SQL入门案例实践

    2010-07-18 13:13:00
  • 搜索结果页(SERP):前言

    2009-07-22 20:56:00
  • 用VBS语言实现的网页计算器源代码

    2007-12-26 17:09:00
  • discuz 2.0整合asp系统,用户添加函数

    2011-04-02 11:08:00
  • Oracle学习笔记(一)

    2012-01-05 18:51:44
  • css2.1实现多重背景和边框效果

    2010-06-23 19:02:00
  • Oracle11.2 命令行手工最简创建数据库的过程

    2009-09-14 12:07:00
  • 建立三层结构的ASP应用程序

    2009-01-21 19:41:00
  • 详解如何用SQLyog来分析MySQL数据库

    2008-10-13 12:35:00
  • Asp中如何快速分页的技巧

    2008-05-17 12:02:00
  • 使用php数据缓存技术提高执行效率

    2023-05-24 23:14:24
  • T-SQL 查询语句的执行顺序解析

    2011-11-03 17:04:06
  • ASP四级联动做法

    2009-07-03 15:35:00
  • javascript 常见汉字转换成拼音工具

    2008-03-03 16:54:00
  • asp之家 网络编程 m.aspxhome.com