MySQL中索引优化distinct语句及distinct的多字段操作

作者:Linux运维 时间:2024-01-18 20:43:38 

MySQL通常使用GROUPBY(本质上是排序动作)完成DISTINCT操作,如果DISTINCT操作和ORDERBY操作组合使用,通常会用到临时表.这样会影响性能. 在一些情况下,MySQL可以使用索引优化DISTINCT操作,但需要活学活用.本文涉及一个不能利用索引完成DISTINCT操作的实例.

 

实例1 使用索引优化DISTINCT操作


create table m11 (a int, b int, c int, d int, primary key(a)) engine=INNODB;

insert into m11 values (1,1,1,1),(2,2,2,2),(3,3,3,3),(4,4,4,4),(5,5,5,5),(6,6,6,6),(7,7,7,7),(8,8,8,8);

explain select distinct(a) from m11;


mysql> explain select distinct(a) from m11;

+----+-------------+-------+------------+-------+---------------+---------+---------+------+------+----------+-------------+| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |+----+-------------+-------+------------+-------+---------------+---------+---------+------+------+----------+-------------+| 1 | SIMPLE | m11 | NULL | index | PRIMARY | PRIMARY | 4 | NULL | 1 | 100.00 | Using index |+----+-------------+-------+------------+-------+---------------+---------+---------+------+------+----------+-------------+


说明:
1 'a'列上存在主键索引,MySQL可以利用索引(key列值表明使用了主键索引)完成了DISTINCT操作.

2 这是使用索引优化DISTINCT操作的典型实例.

 

实例2 使用索引不能优化DISTINCT操作


create table m31 (a int, b int, c int, d int, primary key(a)) engine=MEMORY;

insert into m31 values (1,1,1,1),(2,2,2,2),(3,3,3,3),(4,4,4,4),(5,5,5,5),(6,6,6,6),(7,7,7,7),(8,8,8,8);

explain select distinct(a) from m31;

mysql> explain select distinct(a) from m31;


+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------+| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------+| 1 | SIMPLE | m31 | NULL | ALL | NULL | NULL | NULL | NULL | 8 | 100.00 | NULL |+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------+



说明:
1 从查询执行计划看,索引没有被使用.

2 对比实例1的建表语句,只是存储引擎不同.

3 为什么主键索引没有起作用? 难道MEMORY存储引擎上的索引不可使用?

 

实例3 使用索引可以优化DISTINCT操作的Memory表


create table m33 (a int, b int, c int, d int, INDEX USING BTREE (a)) engine=MEMORY;

insert into m33 values (1,1,1,1),(2,2,2,2),(3,3,3,3),(4,4,4,4),(5,5,5,5),(6,6,6,6),(7,7,7,7),(8,8,8,8);

explain select distinct(a) from m33;

 


mysql> explain select distinct(a) from m33;

+----+-------------+-------+------------+-------+---------------+------+---------+------+------+----------+-------+| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |+----+-------------+-------+------------+-------+---------------+------+---------+------+------+----------+-------+| 1 | SIMPLE | m33 | NULL | index | NULL | a | 5 | NULL | 8 | 100.00 | NULL |+----+-------------+-------+------------+-------+---------------+------+---------+------+------+----------+-------+
说明:
1 'a'列上存在主键索引,MySQL可以利用索引(key列值表明使用了主键索引)完成了DISTINCT操作.

2 对比实例2,可以发现,二者都使用了Memory引擎. 但实例3指名使用Btree类型的索引.

3 实例2没有指定使用什么类型的索引,MySQL将采用默认值. MySQL手册上说:

As indicated by the engine name, MEMORY tables are stored in memory. They use hash indexes by default, which makes them very fast for single-value lookups, and very useful for creating temporary tables.

 

结论:

1 看索引对查询的影响,要注意索引的类型.

2 HASH索引适合等值查找,但不适合需要有序的场景,而Btree却适合有序的场景.

3 看查询执行计划,发现索引没有被使用,需要进一步考察索引的类型.

 

DISTINCT不能选择多个字段的解决方法
在实际应用中,我们经常要选择数据库某表中重复数据,通常我们是使用DISTINCT函数。

但DISTINCT只能对一个字段有效,比如:


sql="select DISTINCT title from Table where id>0"

当我们需要列出数据中的另一列,比如:


sql="select DISTINCT title,posttime from Table where id>0"

得出的结果就不是我们想要的了,所以我们需要用另外的方法来解决这个问题。

下面的是我写的SQL语句,我不知道是不是很好,但愿有更好的人拿出来分享一下:

写法一:


sql = "Select DISTINCT(title),posttime From Table1 Where id>0"

写法二:


sql = "Select title,posttime From Table1 Where id>0 group by title,posttime"

写法三:


sql="select title,posttime from Table where id in (select min(id) from Table group by title)"
标签:MySQL,distinct
0
投稿

猜你喜欢

  • python3.4下django集成使用xadmin后台的方法

    2022-05-09 19:36:42
  • mybatis连接MySQL8出现的问题解决方法

    2024-01-22 08:27:59
  • Python代码注释规范代码实例解析

    2023-03-15 04:59:56
  • 在Python中操作时间之tzset()方法的使用教程

    2022-10-28 22:22:01
  • 利用Python实现多种风格的照片处理

    2021-05-04 13:26:27
  • Python绘制专业的K线图 源代码解析

    2023-09-02 09:51:35
  • 解决Vue2.0自带浏览器里无法打开的原因(兼容处理)

    2023-07-02 16:59:02
  • Python Web框架Tornado运行和部署

    2021-04-14 09:17:57
  • python导入时小括号大作用

    2021-09-07 19:11:09
  • JSP读取文件实例

    2023-07-10 05:16:20
  • python和php哪个更适合写爬虫

    2023-10-28 00:51:14
  • 107条javascript(js)常用小技巧

    2007-10-30 12:40:00
  • 设置密码保护的SqlServer数据库备份文件与恢复文件的方法

    2011-11-03 16:55:30
  • python和java哪个学起来更简单

    2023-06-11 22:49:59
  • Python+Selenium定位不到元素常见原因及解决办法(报:NoSuchElementException)

    2022-06-05 22:03:00
  • Python第三方库h5py_读取mat文件并显示值的方法

    2022-06-24 15:48:57
  • MySQL8新特性:降序索引详解

    2024-01-14 10:03:43
  • Python爬虫之获取心知天气API实时天气数据并弹窗提醒

    2023-04-17 14:40:58
  • 详解python中的线程与线程池

    2022-02-02 18:27:19
  • Python编程之基于概率论的分类方法:朴素贝叶斯

    2023-10-08 10:15:52
  • asp之家 网络编程 m.aspxhome.com