小谈MySQL字符集

作者:IT专家网 来源:叶金荣 时间:2009-02-13 13:30:00 

首先,这片文章纯粹是我的个人经验之谈,适用于我常见的环境及项目中。

个人建议,数据库字符集尽量使用utf8(HTML页面对应的是utf-8),以使你的数据能很顺利的实现迁移,因为utf8字符集是目前最适合于实现多种不同字符集之间的转换的字符集,尽管你在命令行工具上可能无法正确查看数据库中的内容,我依然强烈建议使用utf8作为默认字符集。

接下来是完整的一个例子:

1、创建数据库表

mysql>CREATE DATABASE IF NOT EXISTS my_db default charset utf8 COLLATE utf8_general_ci;

#注意后面这句话 "COLLATE utf8_general_ci",大致意思是在排序时根据utf8校验集来排序

#那么在这个数据库下创建的所有数据表的默认字符集都会是utf8了

mysql>create table my_table (name varchar(20) not null default '')type=myisam default charset utf8;

#这句话就是创建一个表了,制定默认字符集为utf8

2、写数据

例子1是通过php直接插入数据:

a.phpmysql_connect('localhost','user','password');mysql_select_db('my_db');//请注意,这步很关键,如果没有这步,所有的数据读写都会不正确的//它的作用是设置本次数据库联接过程中,数据传输的默认字符集//其他编程语言/接口也类似,例如 .net/c#/odbc//jdbc则设置连接字符串为类似"jdbc:mysql://localhost/db?user=user&password=123456&useUnicode=true&characterEncoding=UTF-8"mysql_query("set names utf8;");//必须将gb2312(本地编码)转换成utf-8,也可以使用iconv()函数mb_convert_encoding("insert into my_table values('测试');", "utf-8", "gb2312");?>b.php//输出本页编码为utf-8header("content-type:text/html; charset=utf-8");mysql_connect('localhost','user','password');mysql_select_db('my_db');mysql_query("set names utf8;");if(isset($_REQUEST['name')){//由于上面已经指定本页字符集为utf-8了,因此无需转换编码mysql_query(sprintf("insert into my_table values('%s');", $_REQUEST['name']));}$q = mysql_query("select * from my_table");while($r = mysql_fetch_row($q)){print_r($r);}?>

自此,使用utf8字符集的完整的例子结束了.

如果你想使用gb2312编码,那么建议你使用latin1作为数据表的默认字符集,这样就能直接用中文在命令行工具中插入数据,并且可以直接显示出来.而不要使用gb2312或者gbk等字符集,如果担心查询排序等问题,可以使用binary属性约束,例如:

create table my_table ( name varchar(20) binary not null default '')type=myisam default charset latin1;

附1:旧数据升级办法

以原来的字符集为latin1为例,升级成为utf8的字符集。原来的表: old_table (default charset=latin1),新表:new_table(default charset=utf8)。

第一步:导出旧数据

mysqldump --default-character-set=latin1 -hlocalhost -uroot -B my_db --tables old_table > old.sql

第二步:转换编码(类似unix/linux环境下)

iconv -t utf-8 -f gb2312 -c old.sql > new.sql

或者可以去掉 -f 参数,让iconv自动判断原来的字符集

iconv -t utf-8 -c old.sql > new.sql

在这里,假定原来的数据默认是gb2312编码。

第三步:导入

修改old.sql,在插入/更新语句开始之前,增加一条sql语句:

"SET NAMES utf8;"

,保存。

mysql -hlocalhost -uroot my_db < new.sql

大功告成!!

附2:支持查看utf8字符集的MySQL客户端有

1.) MySQL-Front,据说这个项目已经被MySQL AB勒令停止了,不知为何,如果国内还有不少破解版可以下载(不代表我推荐使用破解版 :-P)。

2.) Navicat,另一款非常不错的MySQL客户端,汉化版刚出来,还邀请我试用过,总的来说还是不错的,不过也需要付费。

3.) PhpMyAdmin,开源的php项目,非常好。

4.) Linux下的终端工具(Linux terminal),把终端的字符集设置为utf8,连接到MySQL之后,执行 SET NAMES UTF8; 也能读写utf8数据了。

标签:
0
投稿

猜你喜欢

  • 初探MS SQL CE+Codesmith

    2009-05-11 09:03:00
  • JavaScript 判断日期格式是否正确的实现代码

    2011-07-05 12:37:44
  • Opera浏览器简介

    2009-02-05 20:56:00
  • 十个简单好用的设计技巧[译]

    2009-04-08 12:56:00
  • 随机显示图片

    2009-07-26 10:13:00
  • FrontPage XP中的设计技巧

    2008-07-17 10:49:00
  • 设计稿标注首屏线的确定始末

    2011-03-30 12:36:00
  • 十六则Dreamweaver使用快技法

    2009-07-05 18:55:00
  • 使用 JScript 创建 .exe 或 .dll 文件

    2011-06-04 15:37:00
  • 在XPath查询中指定轴(转自MSSQL手册)

    2008-09-04 14:23:00
  • 网页iframe元素应用浅析

    2009-04-11 18:11:00
  • FrontPage XP设计制作网页小技巧八则

    2008-06-04 12:43:00
  • Sql Server 2000 一些安全设置

    2008-02-13 18:57:00
  • asp最简单的生成验证码代码

    2011-03-07 11:05:00
  • 用Dreamweaver设计实现网页过渡转换功能

    2008-09-04 10:09:00
  • 内容呈现的减法

    2007-11-16 16:22:00
  • 在flash中使用XML动态菜单

    2007-09-06 19:16:00
  • Oracle 语句优化分析说明第1/2页

    2009-09-18 13:23:00
  • asp开发中textarea常见问题

    2008-04-13 06:34:00
  • 一起感受HTML5和CSS3的能量[译]

    2009-09-04 16:29:00
  • asp之家 网络编程 m.aspxhome.com