高效的MySQL分页

来源:asp之家 时间:2011-01-04 20:01:00 

PERCONA PERFORMANCE CONFERENCE 2009上,来自雅虎的几位工程师带来了一篇”Efficient Pagination Using MySQL“的报告,有很多亮点,本文是在原文基础上的进一步延伸。

首先看一下分页的基本原理:

mysql> explain SELECT * FROM message ORDER BY id DESC LIMIT 10000, 20\G
***************** 1. row **************
id: 1
select_type: SIMPLE
table: message
type: index
possible_keys: NULL
key: PRIMARY
key_len: 4
ref: NULL
rows: 10020
Extra:
1 row in set (0.00 sec)

limit 10000,20的意思扫描满足条件的10020行,扔掉前面的10000行,返回最后的20行,问题就在这里,如果是limit 100000,100,需要扫描100100行,在一个高并发的应用里,每次查询需要扫描超过10W行,性能肯定大打折扣。文中还提到limit n性能是没问题的,因为只扫描n行。

文中提到一种”clue”的做法,给翻页提供一些”线索”,比如还是SELECT * FROM message ORDER BY id DESC,按id降序分页,每页20条,当前是第10页,当前页条目id最大的是9527,最小的是9500,如果我们只提供”上一页”、”下一页”这样的跳转(不提供到第N页的跳转),那么在处理”上一页”的时候SQL语句可以是:

SELECT * FROM message WHERE id > 9527 ORDER BY id ASC LIMIT 20;

处理”下一页”的时候SQL语句可以是:

SELECT * FROM message WHERE id < 9500 ORDER BY id DESC LIMIT 20;

不管翻多少页,每次查询只扫描20行。

缺点是只能提供”上一页”、”下一页”的链接形式,但是我们的产品经理非常喜欢”<上一页 1 2 3 4 5 6 7 8 9 下一页>”这样的链接方式,怎么办呢?

如果LIMIT m,n不可避免的话,要优化效率,只有尽可能的让m小一下,我们扩展前面的”clue”做法,还是SELECT * FROM message ORDER BY id DESC,按id降序分页,每页20条,当前是第10页,当前页条目id最大的是9527,最小的是9500,比如要跳到第8页,我看的SQL语句可以这样写:

SELECT * FROM message WHERE id > 9527 ORDER BY id ASC LIMIT 20,20;

跳转到第13页:

SELECT * FROM message WHERE id < 9500 ORDER BY id DESC LIMIT 40,20;

原理还是一样,记录住当前页id的最大值和最小值,计算跳转页面和当前页相对偏移,由于页面相近,这个偏移量不会很大,这样的话m值相对较小,大大减少扫描的行数。其实传统的limit m,n,相对的偏移一直是第一页,这样的话越翻到后面,效率越差,而上面给出的方法就没有这样的问题。

注意SQL语句里面的ASC和DESC,如果是ASC取出来的结果,显示的时候记得倒置一下。

已在60W数据总量的表中测试,效果非常明显。


标签:mysql,分页
0
投稿

猜你喜欢

  • M1芯片Mac上Anaconda的暂时替代(miniforge)

    2022-12-12 00:32:43
  • Python内建类型list源码学习

    2023-03-21 09:41:24
  • 几种修复ACCESS数据库的实用方法

    2008-11-20 17:37:00
  • 用Python实现批量生成法务函代码

    2022-05-27 15:05:28
  • Java游戏服务器之数据库表存取封装

    2024-01-13 13:08:17
  • linux下安装python3和对应的pip环境教程详解

    2023-03-17 09:48:15
  • Python输出带颜色的字符串实例

    2023-08-20 05:28:03
  • Javascript学习笔记之 函数篇(二) : this 的工作机制

    2024-05-11 10:23:57
  • Python如何爬取b站热门视频并导入Excel

    2023-06-20 23:27:44
  • django为Form生成的label标签添加class方式

    2022-08-13 12:01:44
  • tensorflow使用CNN分析mnist手写体数字数据集

    2021-07-20 20:29:35
  • 400多行Python代码实现了一个FTP服务器

    2023-12-10 19:31:31
  • Python面向对象程序设计中类的定义、实例化、封装及私有变量/方法详解

    2021-10-15 16:14:07
  • mysql外键基本功能与用法详解

    2024-01-23 00:52:13
  • python的内存管理和垃圾回收机制详解

    2021-07-30 14:18:05
  • Python计算两个日期相差天数的方法示例

    2023-05-17 13:59:21
  • Django如何批量创建Model

    2022-12-29 15:40:39
  • Django实现网页分页功能

    2021-04-05 22:12:18
  • MySQL5创建存储过程的示例

    2024-01-12 17:45:35
  • Python实现灰色关联分析与结果可视化的详细代码

    2023-08-03 15:01:56
  • asp之家 网络编程 m.aspxhome.com