由浅入深讲解MySQL数据库索引的选择性

作者:Anna 时间:2008-12-17 15:06:00 

在MySQL中,对于索引的使用并是一直都采用正确的决定。

简单表的示例:

CREATE TABLE `r2` (

ID` int(11) DEFAULT NULL,

ID1` int(11) DEFAULT NULL,

CNAME` varchar(32) DEFAULT NULL,

KEY `ID1` (`ID1`)

) ENGINE=MyISAM DEFAULT CHARSET=latin1

SELECT COUNT(*) FROM r2;

250001 (V1)

SELECT COUNT(*) FROM r2 WHERE ID1=1;

83036 (V2)

(execution time = 110 ms)

(ID1=1)条件查询索引的选择性是 V2/V1 = 0.3321 或 33.21%

一般来说(例如书 “SQL Tuning“),如果选择性超过 20% 那么全表扫描比使用索引性能更优。

我知道Oracle一直是在选择性超过25%时会选择全表扫描。

而MySQL呢:

mysql> EXPLAIN SELECT COUNT(SUBNAME) FROM r2 WHERE ID1=1;

+----+-------------+-------+------+---------------+-----

| id | select_type | TABLE | type | possible_keys | KEY | key_len | ref | rows | Extra |

+----+-------------+-------+------+---------------+-----

| 1 | SIMPLE | t2 | ref | ID1 | ID1 | 5 | const | 81371 | USING WHERE |

+----+-------------+-------+------+---------------+-----

这就是MySQL将会使用索引来完成这个查询。

让我们来对比索引查询和全表扫描的执行时间:

SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 410 ms

SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 200 ms

如你所看到全表扫描要快2倍。

参考更特殊的例子:选择性 ~95%:

SELECT cnt2 / cnt1 FROM (SELECT count(*) cnt1 FROM r2) d1, (SELECT count(*) cnt2 FROM r2 WHERE ID1=1) d2;

0.9492 = 94.92%;

说明MySQL将会用索引来完成查询。

执行时间:

SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 1200 ms

SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 260 ms

这次全表扫描要快4.6倍。

为什么MySQL选择索引访问查询?

MySQL没有计算索引的选择性,只是预测逻辑IO操作的数量,并且我们的例子中间的逻辑IO数量,索引访问要少于全表扫描。

最后我们得出结论,对于索引要小心使用,因为它们并不能帮助所有的查询。

标签:
0
投稿

猜你喜欢

  • Asp定时执行操作、各种网页定时操作详解

    2008-06-10 17:32:00
  • php投票系统之增加与删除投票(管理员篇)

    2023-10-14 09:44:53
  • python的numpy模块实现逻辑回归模型

    2022-10-01 07:05:59
  • Python 中如何将十六进制转换为 Base64

    2022-09-07 01:20:14
  • 详解Python下Flask-ApScheduler快速指南

    2023-12-25 07:37:34
  • python在windows和linux下获得本机本地ip地址方法小结

    2023-12-18 16:52:03
  • Dreamweaver行为体验

    2007-02-03 11:39:00
  • 详细解析Webpack是怎么运行的

    2022-09-07 04:00:50
  • Python facenet进行人脸识别测试过程解析

    2021-03-27 14:24:04
  • python实现简单登陆系统

    2023-05-25 06:50:49
  • Python+Opencv实现图像匹配功能(模板匹配)

    2022-06-28 08:56:35
  • python中xlrd模块的使用详解

    2021-02-13 12:05:27
  • 详解Python变量与注释高级用法

    2022-08-06 08:17:08
  • Python后台管理员管理前台会员信息的讲解

    2023-11-06 09:59:41
  • tensorflow:指定gpu 限制使用量百分比,设置最小使用量的实现

    2021-06-03 17:02:32
  • sql语句查询重复的数据(最新推荐)

    2024-01-13 08:01:23
  • MySQL实战记录之如何快速定位慢SQL

    2024-01-27 07:58:12
  • python浪漫表白源码

    2023-11-22 05:16:39
  • SSM框架把日志信息保存到数据库过程详解

    2024-01-19 12:56:27
  • 简单谈谈Python中的模块导入

    2021-02-24 20:28:17
  • asp之家 网络编程 m.aspxhome.com