几个常见的MySQL的可优化点归纳总结

作者:goldensun 时间:2024-01-13 11:32:14 

索引相关

1. 查询(或更新,删除,可以转换为查询)没有用到索引
这是最基础的步骤,需要对sql执行explain查看执行计划中是否用到了索引,需要重点关注type=ALL, key=NULL的字段。

2.  在索引字段上施加函数


to_char(gmt_created, ‘mmdd') = '0101′

正确的写法


gmt_created between to_date(“20090101″, “yyyymmdd”) and to_date(“20090102″, “yyyymmdd”)

3. 在索引字段上使用全模糊


member_id like ‘%alibab%'

B树无法解决此类问题,可以考虑搜索引擎。
但是member_id like ‘alibab%'可以用到索引。
其实,对任何一个字段使用 like ‘%xxxx%'都是一种不规范的做法,需要能检查到这种错误用法。

4.  多列字段的索引,没有用到前导索引
索引:(memeber_id, group_id)
where group_id=9234,实际上,这个条件是没有办法用到上面的索引的。这是一个很常见的误用。要理解为什么不能用到这个索引,需要理解mysql如何构造多列索引的。
索引是一棵B树,问题是,对于多列索引,mysql将索引字段按照索引建立的顺序进行拼装,组成一个新的字符串,这个字符串被用来做为构建B树的键。所以,在查询条件里,如果没有用到前导列,就没办法访问多列索引的B树。
应该建立索引:(group_id, member_id)

5. 访问到了索引之外的字段
索引(member_id, subject)


select subject from offer where member_id=234

在member_id=234记录数很多的情况下,会优于


select subject, gmt_created from offer where member_id=234

原因是第二条sql会根据索引查找到的rowid访问表里的记录。第一条sql使用索引范围扫描就可以得到结果。
如果某个sql执行次数很多,但是读取的字段没有被索引覆盖,那么,可能需要建立覆盖性索引。

6.  计数count(id)有时比count(*)慢


count(id) === count(1) where id is not null

如果没有(id)索引,那么会用全表扫描,而count(*)会使用最优的索引进行用索引快速全扫描
计数统一使用count(*)

7.  正确使用stop机制
判断member_id在offer表中是否存在记录:


select count(*) from offer where member_id=234 limit 1

优于


select count(*) from offer where member_id=234

原因是第一条sql会在得到第一条符合条件的记录后停止。


高效分页
1.  高效的分页
使用join技术,利用索引查找到符合条件的id,构造成临时表,用这个小的临时表与原表做join


select *
from
(
select t.*, rownum AS rn
from
(select * from blog.blog_article
where domain_id=1
and draft=0
order by domain_id, draft, gmt_created desc) t
where rownum >= 2
) a
where a.rn <= 3

应该改写成


select blog_article.*
from
(
select rid, rownum as rn
from
(
select rowid as id from blog.blog_article
where domain_id=1
and draft=0
order by domain_id, draft, gmt_created desc
) t
where rownum >= 2
) a, blog_article
where a.rn >= 3
and a.rid = blog_article.rowid

2. order by没有用到索引
有索引(a, b,c )
混合排序规则


ORDER BY a ASC, b DESC, c DESC /* mixed sort direction */

缺失了前导列


WHERE g = const ORDER BY b, c /* a prefix is missing */

缺失了中间列


WHERE a = const ORDER BY c /* b is missing */

使用了不在索引中的列进行排序


WHERE a = const ORDER BY a, d /* d is not part of index */

高效地利用primary key
随机查询
一个错误的做法:


select * from title where kind_id=1 order by rand() limit 1;
create index k on title(kind_id);

这个sql执行过程中需要全表扫描,并且将数据保存到临时表,这是一个非常耗时的操作。
改进的做法,利用偏移量。


select round(rand() * count(*)) from title where kind_id=1;
select * from title where kind_id=1 limit 1 offset $random;
create index k on title(kind_id);

相比上面的做法,这种写法能够利用到kind_id上的索引,减少了需要扫描的数据块。但是,如果offset非常大,那么需要扫描的数据块也非常大,极端情况是扫描索引k的所有数据块。
最优的做法,利用主键进行范围查找


select round(rand() * count(*)) from title where kind_id=1;
select * from title where kind_id = and id > $random limit 1;

这个sql利用primary key进行范围查询,完全走索引,并且只读取一条记录,速度非常快。但是,这种用法的限制是primary key必须是int型,并且是连续自增长的。


高效join
1. 小表驱动大表进行join
2. 避免子查询

子查询是一个影响性能的隐患。应该使用join改写sql。


数据类型
1.  避免隐式转换


CREATE TABLE `user` (
`id` smallint(5) unsigned NOT NULL AUTO_INCREMENT,
`account` char(11) NOT NULL COMMENT ”,
`email` varchar(128),
PRIMARY KEY (`id`),
UNIQUE KEY `username` (`account`)
) ENGINE=InnoDB CHARSET=utf8;
mysql> explain select * from user where account=123 \G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: user
type: ALL
possible_keys: username
key: NULL
key_len: NULL
ref: NULL
rows: 2
Extra: Using where
1 row in set (0.00 sec)

可以看到,account=123的条件并没有用到唯一索引`username`。mysql的server从storage engine中读取所有的记录,使用to_number()函数,将记录中的account转换成数字,被转换后的数字用来和参数比较。我们的测试表里有2条记录,而执行计划中rows的值也是2,并且type的值为ALL,这也说明索引`username`并没有被用到。

mysql> explain select * from user where account='123′ \G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: user
type: const
possible_keys: username
key: username
key_len: 33
ref: const
rows: 1
Extra:
1 row in set (0.00 sec)


参数为字符串类型,我们可以看到索引`username`,被使用到了。
这是一个经常被误用的做法。

2. 主键不是自增列
自增列的主键有多个好处:

  • 插入性能高。

  • 减小page的碎片。

  • 提供二级索引的性能,降低二级索引的空间,因为二级索引存储的是主键的值,并不是page中的行id。


标签:MySQL
0
投稿

猜你喜欢

  • Python可视化库之HoloViews的使用教程

    2023-11-05 17:09:03
  • 整理Python中的赋值运算符

    2021-10-30 16:25:21
  • python条件变量之生产者与消费者操作实例分析

    2023-05-06 02:06:42
  • Javascript的常规数组和关联数组对比小结

    2024-04-28 09:47:29
  • python GUI库图形界面开发之PyQt5不规则窗口实现与显示GIF动画的详细方法与实例

    2023-09-20 17:59:32
  • MYSQL数据库设计的一点总结

    2008-05-24 09:36:00
  • 树莓派4B+opencv4+python 打开摄像头的实现方法

    2021-05-04 12:09:37
  • mysql 8.0.22.0 下载安装配置方法图文教程

    2024-01-24 14:14:36
  • numpy的squeeze函数使用方法

    2022-04-15 10:02:07
  • 关于Pytorch中模型的保存与迁移问题

    2023-08-11 04:05:25
  • Python3中map()、reduce()、filter()的用法详解

    2024-01-03 01:27:23
  • 详解mysql中的冗余和重复索引

    2024-01-27 12:59:32
  • php引用传值实例详解学习

    2023-11-15 06:11:30
  • BP神经网络原理及Python实现代码

    2022-09-04 21:12:24
  • 使用虚拟机在VirtualBox+openEuler上安装部署openGauss数据库

    2024-01-21 22:45:53
  • 深度解析Python线程和进程

    2023-04-19 01:08:16
  • 解决Keras中Embedding层masking与Concatenate层不可调和的问题

    2022-06-02 17:02:16
  • Golang中使用JSON的一些小技巧分享

    2024-04-27 15:33:34
  • JS实现控制表格内指定单元格内容对齐的方法

    2024-04-17 09:42:28
  • Python基于滑动平均思想实现缺失数据填充的方法

    2021-10-20 12:36:02
  • asp之家 网络编程 m.aspxhome.com