详解mysql中的冗余和重复索引

作者:寻找风口的猪 时间:2024-01-27 12:59:32 

mysql允许在相同列上创建多个索引,无论是有意还是无意,mysql需要单独维护重复的索引,并且优化器在优化查询的时候也需要逐个地进行考虑,这会影响性能。

重复索引是指的在相同的列上按照相同的顺序创建的相同类型的索引,应该避免这样创建重复索引,发现以后也应该立即删除。但,在相同的列上创建不同类型的索引来满足不同的查询需求是可以的。


CREATE TABLE test(
ID INT NOT NULL PRIMARY KEY,
A INT NOT NULL,
B INT NOT NULL,
UNIQUE(ID),
INDEX(ID),
) ENGINE=InnoDB;

这段SQL创建了3个重复索引。通常并没有理由这么做。

冗余索引和重复索引有一些不同,如果创建了索引(a,b),再创建索引(a)就是冗余索引,因为这只是前面一个索引的前缀索引,因此(a,b)也可以当作(a)来使用,但是(b,a)就不是冗余索引,索引(b)也不是,因为b不是索引(a,b)的最左前缀列,另外,其他不同类型的索引在相同列上创建(如哈希索引和全文索引)不会是B-Tree索引的冗余索引,而无论覆盖的索引列是什么。

冗余索引通常发生再为表添加新索引的时候。例如,有人可能会增加一个新的索引(A,B)而不是扩展以后的索引(A)。还有一种情况是将一个索引扩展为(A,ID),其中ID是主键,对于InnoDB来说主键已经包含在二级索引中了,所以这也是冗余的。

大多数情况下都不需要冗余索引,应该尽量扩展已有的索引而不是创建新索引,但也有时候处于性能方面的考虑需要冗余索引,因为扩展已有的索引会导致其变得太大,从而影响其他使用该索引的查询性能。如:如果在整数列上有一个索引,现在需要额外增加一个很长的varchar列来扩展该索引,那么性可能会急剧下降,特别是有查询把这个索引当作覆盖索引,或者这是myisam表并且有很多范围查询的时候(由于myisam的前缀压缩)

比如,有一张userinfo表。这个表有1000000条数据,对每个state_id值大概有20000条记录。在state_id有一个索引,那么下面的SQL我们称之为Q1


SELECT count(*) FROM userinfo WHERE state_id=5; --Q1

改查询的执行速度大概是每秒115次(QPS)

还有一个SQL,我们称之为Q2


SELECT state_id,city,address FROM userinfo WHERE state_id=5; --Q2

这个查询的QPS是10,提升该索引性能最简单的办法就是狂战索引为(state_id,city,address),让索引能覆盖查询:


ALERT TABLE userinfo ADD KEY state_id_2(state_id,city,address);

注:state_id已经有索引了,根据前面的概念,这是一个冗余索引而不是重复索引)

怎么找出冗余索引和重复索引呢?

1.可以使用Shlomi Noach的common_schema中的一些试图来定位,common_schema是一系列可以安装到服务器上的常用的存储和试图。

2.可以使用Percona Toolkit中的pt_duplicate-key-checker,该工具通过分析表结构来找出冗余和重复的索引。

来源:http://www.cnblogs.com/happyflyingpig/p/7663000.html

标签:mysql,索引
0
投稿

猜你喜欢

  • Python中的Decorator装饰器的使用示例

    2023-07-02 10:37:44
  • Python Opencv使用ann神经网络识别手写数字功能

    2023-11-03 02:44:52
  • Python 面向对象之封装、继承、多态操作实例分析

    2021-04-09 10:03:54
  • python中return如何写

    2023-11-17 21:44:56
  • MySQL ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: NO) 的原因分解决办法

    2024-01-22 10:02:03
  • MySQL窗口函数实现榜单排名

    2024-01-16 20:22:22
  • SQL 特殊语句(学习笔记)

    2012-06-06 19:51:33
  • pytorch如何冻结某层参数的实现

    2021-02-03 11:49:36
  • 深入了解Python中的变量

    2022-03-15 06:31:24
  • Node.js中环境变量process.env的一些事详解

    2024-05-13 09:28:41
  • Python如何把十进制数转换成ip地址

    2023-02-20 21:36:55
  • 深入了解python的函数参数

    2023-07-24 08:19:01
  • Python Pandas学习之series的二元运算详解

    2023-12-16 01:58:30
  • MySQL UPDATE 语句的非标准实现代码

    2024-01-16 19:08:57
  • vue cli+axios踩坑记录+拦截器使用方式,代理跨域proxy

    2023-07-02 16:38:30
  • JSON+JavaScript处理JSON的简单例子

    2023-10-09 09:39:56
  • 用python统计代码行的示例(包括空行和注释)

    2022-06-28 02:15:30
  • MySQL单表查询常见操作实例总结

    2024-01-20 05:47:17
  • python ipset管理 增删白名单的方法

    2021-02-10 17:38:19
  • python中统计相同字符的个数方法实例

    2021-04-21 00:28:58
  • asp之家 网络编程 m.aspxhome.com