一次Mysql使用IN大数据量的优化记录

作者：chenjunbiao 时间：2024-01-29 07:49:19　

mysql版本号是5.7.28，表A有390W条记录，使用InnoDB引擎，其中varchar类型字段mac已建立索引，索引方法为B-tree。B表仅有5000+条记录。

有一条SQL指令是这样写的：

SELECT * FROM A WHERE mac IN("aa:aa:aa:aa:aa:aa","bb:bb:bb:bb:bb:b",...此外省略900+条)

通过查询出来的结果耗时294.428s。没错，将近5分钟。

使用EXPLAIN分析下：

访问类型type是range，且已命中索引，rows行也只有587776，可为什么查询耗时要这么久？

mac的索引方法使用了B-tree，那对比下它与HASH的区别，简单地总结下：B-tree索引可以用于进行 =,>,>=,<,<=和between的计算，而HASH只能进行等值运算，不能进行范围查找。那IN是等值运算，两种索引方法都适用。即然这样，把mac的索引方法修改为HASH，同样的查询耗时为。

既然调整索引方法并不能明显地提升语句的查询性能，那只能从语句本身中进行处理。其实明眼人刚开始一看就知道，SELECT * 是很耗性能的，那我们只查业务上需要的字段，语句调整为：

SELECT id,mileage FROM A WHERE mac IN("aa:aa:aa:aa:aa:aa","bb:bb:bb:bb:bb:b",...此外省略900+条)

耗时并没有明显的提升。

竟然IN的方式这么难优化，是不是可以放弃使用LEFT JOIN呢？语句调整为：

SELECT a.id,a.mileage FROM A a LEFT JOIN B b ON b.mac = a.mac WHERE b.create_time >= '2020-01-01'

耗时超过5分钟，放弃。

我们知道，在条件量少的情况，EXISTS和IN的效果没有显示的差别。但条件多的时候，IN要比EXISTS的效率也高，来试下EXISTS：

SELECT id,mileage FROM A a WHERE EXISTS(SELECT mac FROM B WHERE create_time >= '2020-01-01' AND mac = a.mac)

耗时也是超过5分钟，IN的效率确实要比EXISTS高，放弃。

所以最后的结论是，如果IN后接大数据量的String，要慎重。

在项目中我把mac作为唯一标识建立与id的对应表，在A表使用mac_id代替mac，查询的时候使用IN(1,2,3...)。效率会提高一些。当前使用NoSQL也是一种方式。

来源：https://segmentfault.com/a/1190000025135805

标签：mysql,优化,in

投稿

一次Mysql使用IN大数据量的优化记录

猜你喜欢

python连接PostgreSQL数据库的过程详解

python logging模块的使用详解

MySQL查询性能优化七种方式索引潜水

Go语言并发编程互斥锁详情

MySQL模糊查询用法大全(正则、通配符、内置函数)

Python实现的ini文件操作类分享

显示你个性的鼠标指针

Python自动重新加载模块详解(autoreload module)

解决django FileFIELD的编码问题

SQL语句操作主从关系表

网站的视觉设计

JS实战篇之收缩菜单表单布局

Tensorflow 2.4加载处理图片的三种方式详解

Python实现简单的代理服务器

关于捕获用户何时点击window.onbeforeunload的取消事件

Python实现对adb命令封装

python time时间库详解

php简单浏览目录内容的实现代码

PHP魔术方法ISSET、UNSET使用实例

Java操作MongoDB数据库方法详解

一次Mysql使用IN大数据量的优化记录

猜你喜欢

python连接PostgreSQL数据库的过程详解

python logging模块的使用详解

MySQL查询性能优化七种方式索引潜水

Go语言并发编程 互斥锁详情

MySQL模糊查询用法大全(正则、通配符、内置函数)

Python实现的ini文件操作类分享

显示你个性的鼠标指针

Python自动重新加载模块详解(autoreload module)

解决django FileFIELD的编码问题

SQL语句操作主从关系表

网站的视觉设计

JS实战篇之收缩菜单表单布局

Tensorflow 2.4加载处理图片的三种方式详解

Python实现简单的代理服务器

关于捕获用户何时点击window.onbeforeunload的取消事件

Python实现对adb命令封装

python time时间库详解

php简单浏览目录内容的实现代码

PHP魔术方法__ISSET、__UNSET使用实例

Java操作MongoDB数据库方法详解

Go语言并发编程互斥锁详情

PHP魔术方法ISSET、UNSET使用实例