设置MySQL中的数据类型来优化运行速度的实例

作者:吴炳锡 时间:2024-01-25 07:40:04 

今天看了一个优化案例觉的挺有代表性,这里记录下来做一个标记,来纪念一下随便的字段定义的问题。

回忆一下,在表的设计中很多人习惯的把表的结构设计成Varchar(64),Varchar(255)之类的,虽然大多数情况只存了5-15个字节.那么我看一下下面这个案例.
查询语句:
 


SELECT SQL_NO_CACHE channel, COUNT(channel) AS visitors FROM xxx_sources WHERE client_id = 1301 GROUP BY client_id, channel;

该表(client_id,channel)是一个组合索引.
利用explain,看一下执行计划,对于索引使用上看上非常完美
 


mysql> explain SELECT SQL_NO_CACHE channel, COUNT(channel) AS visitors FROM xxx_sources WHERE client_id = 1301 GROUP BY client_id, channel;
+----+-------------+-------------+-------+--------------------+--------------------+---------+------+----------+--------------------------+
| id | select_type | table  | type | possible_keys  | key    | key_len | ref | rows  | Extra     |
+----+-------------+-------------+-------+--------------------+--------------------+---------+------+----------+--------------------------+
| 1 | SIMPLE  | xxx_sources | index | idx_client_channel | idx_client_channel | 1032 | NULL | 20207319 | Using where; Using index |
+----+-------------+-------------+-------+--------------------+--------------------+---------+------+----------+--------------------------+
1 row in set (0.00 sec)

看一下实际执行:
 


mysql> SELECT SQL_NO_CACHE channel, COUNT(channel) AS visitors FROM xxx_sources WHERE client_id = 1301 GROUP BY client_id, channel;
+---------+----------+
| channel | visitors |
+---------+----------+
| NULL |  0 |
+---------+----------+
1 row in set (11.69 sec)

实际执行的情况非常的糟糕.传通的想法,这个执行从索引上执行计划上看非常完美了,好象和MySQL没什么关系了. 在去看一下表的设计会发现client_id也是设计成了
varchar(255).看到这里不防可以使用下面的方法试一下:


mysql> explain SELECT SQL_NO_CACHE channel, COUNT(channel) AS visitors FROM xxx_sources WHERE client_id = '1301' GROUP BY client_id, channel;
+----+-------------+-------------+------+--------------------+--------------------+---------+-------+--------+--------------------------+
| id | select_type | table  | type | possible_keys  | key    | key_len | ref | rows | Extra     |
+----+-------------+-------------+------+--------------------+--------------------+---------+-------+--------+--------------------------+
| 1 | SIMPLE  | xxx_sources | ref | idx_client_channel | idx_client_channel | 258  | const | 457184 | Using where; Using index |
+----+-------------+-------------+------+--------------------+--------------------+---------+-------+--------+--------------------------+
1 row in set (0.00 sec)

从执行计划上来看,差不多,但实际差多了.具体上来看key_len从1032降到了258,执行计划变成了const基于等于的查找,行数从原来千万级到了十万级了.不算也能明白IO
节省了很多.
再来看实际执行:

 


mysql> SELECT SQL_NO_CACHE channel, COUNT(channel) AS visitors FROM xxx_sources WHERE client_id = '1301' GROUP BY client_id, channel;
+---------+----------+
| channel | visitors |
+---------+----------+
| NULL |  0 |
+---------+----------+
1 row in set (0.25 sec)

哇,从11.69秒变成了0.25秒,这是什么概念,优化了多少倍,算一下吧.

看到这里在想什么呢,记住这个案例,嗯,不错,以后还可以加引号优化一下.那为什么不问一下,能不能在优化了,为什么会这样呢?
我们先来看一下第一个问题:
能不能在优化了?
答案是当然可以了.从索引的长度上来看258还是一个非常大的数据,对于client_id这个字段从名字上来看,也只会存数据型的值,那为什么不用的一个int unsigned去存呢,
索引的长度马上会从258降到4。这样不是又节省了很多吗?
接下来看一下第二个问题,为什么会这样呢?
原因有两点,同时基于一个原则,基于成本的优化器。对于client_id在表的定义时定义成了字符型的值,在查询时传入了数值型的值,需要经过一个数值转换,悲剧的开始,最终
导致MySQL选择了一个完成的索引去扫描。

从这个案例上,我们需要注意什么呢?
合理的选择数据类型,基本工太重要了,就这叫赢在起跑线,一切都不能随便了,别把一个表定义成了降了主建外其它全是Varchar(255)。对数据库的double/float这种字段做索引时一定要小心。

标签:MySQL
0
投稿

猜你喜欢

  • SQL Server并行操作优化避免并行操作被抑制而影响SQL的执行效率

    2024-01-23 10:55:50
  • python之如何查找多层嵌套字典的值

    2021-12-05 08:57:07
  • Python 多个图同时在不同窗口显示的实现方法

    2022-07-02 01:20:35
  • GoLang切片相关问题梳理讲解

    2024-04-29 13:06:11
  • asp采集常用的几个FUCTION

    2007-09-05 19:45:00
  • Python基于随机采样一至性实现拟合椭圆

    2022-11-25 01:44:35
  • MySQL索引之主键索引

    2024-01-25 01:52:04
  • 符合网站标准的图片切换代码(天极软件)

    2008-02-20 08:23:00
  • Vue自定义Form组件实现方法介绍

    2024-04-28 09:21:14
  • python 统计列表中不同元素的数量方法

    2023-10-16 05:22:33
  • 定制FileField中的上传文件名称实例

    2022-06-07 14:21:05
  • PyQt实现界面翻转切换效果

    2023-12-27 04:49:46
  • 使用Python脚本对Linux服务器进行监控的教程

    2022-06-19 18:27:26
  • 基于python图书馆管理系统设计实例详解

    2023-06-28 23:44:13
  • Python利用requests模块下载图片实例代码

    2023-11-18 16:10:13
  • Python2.x与Python3.x的区别

    2022-03-24 18:36:46
  • 形象化的reflow

    2008-06-08 13:33:00
  • python中subprocess实例用法及知识点详解

    2022-12-03 00:27:39
  • 将Django项目迁移到linux系统的详细步骤

    2021-02-11 02:13:09
  • 详解Pycharm出现out of memory的终极解决方法

    2021-12-08 18:14:23
  • asp之家 网络编程 m.aspxhome.com