MySQL查询随机数据的4种方法和性能对比

时间:2024-01-25 17:09:46 

下面从以下四种方案分析各自的优缺点。
方案一:

SELECT * FROM `table` ORDER BY RAND() LIMIT 0,1;


这种方法的问题就是非常慢。原因是因为MySQL会创建一张零时表来保存所有的结果集,然后给每个结果一个随机索引,然后再排序并返回。
有几个方法可以让它快起来。
基本思想就是先获取一个随机数,然后使用这个随机数来获取指定的行。
由于所有的行都有一个唯一的id,我们将只取最小和最大id之间的随机数,然后获取id为这个数行。为了让这个方法当id不连续时也能有效,我们在最终的查询里使用”>=”代替”=”。
为了获取整张表的最小和最大id,我们使用MAX()和MIN()两个聚合函数。这两个方法会返回指定组里的最大和最小值。在这里这个组就是我们表里的所有id字段值。
方案二:

<?php
$range_result = mysql_query( " SELECT MAX(`id`) AS max_id , MIN(`id`) AS min_id FROM `table` ");
$range_row = mysql_fetch_object( $range_result );
$random = mt_rand( $range_row->min_id , $range_row->max_id );
$result = mysql_query( " SELECT * FROM `table` WHERE `id` >= $random LIMIT 0,1 ");


就像我们刚才提到的,这个方法会用唯一的id值限制表的每一行。那么,如果不是这样情况怎么办?
下面这个方案是使用了MySQL的LIMIT子句。LIMIT接收两个参数值。第一个参数指定了返回结果第一行的偏移量,第二个参数指定了返回结果的最大行数。偏移量指定第一行是0而不是1。
为了计算第一行的偏移量,我们使用MySQL的RAND()方法从0到1之间生成一个随机数。然后我们把这个数字跟我们用COUNT()方法获取倒的表记录数相乘。由于LIMIT的参数必须是int型而不能是float,我们使用FLOOR()来处理结果。FLOOR()会计算小于表达式的最大值。最终的代码就是这样:
方案三:

<?php
$offset_result = mysql_query( " SELECT FLOOR(RAND() * COUNT(*)) AS `offset` FROM `table` ");
$offset_row = mysql_fetch_object( $offset_result );
$offset = $offset_row->offset;
$result = mysql_query( " SELECT * FROM `table` LIMIT $offset, 1 " );


在MySQL 4.1以后我们可以使用子子查询合并上面两个方法:
方案四:

SELECT * FROM `table` WHERE id >= (SELECT FLOOR( MAX(id) * RAND()) FROM `table` ) ORDER BY id LIMIT 1;


这个方案跟方案二有同样的弱点,只对有唯一id值的表有效。
记住我们最初寻找选择随机行的替代方法的原因,速度!所以,这些方案的在执行时间上的比较会怎么样?我不会指出硬件和软件配置或者给出具体的数字。大概的结果是这样的:
最慢的是解决方案一(我们假定它用了100%的时间)。
方案二用了79%
方案三 – 13%
方案四 – 16%
so, 方案三胜出!

标签:MySQL,MySQL随机
0
投稿

猜你喜欢

  • Delphi 本地路径的创建、清空本地指定文件夹下的文件

    2023-06-23 19:49:20
  • python爬虫入门教程--优雅的HTTP库requests(二)

    2022-04-01 05:10:43
  • 微信企业号开发之微信考勤百度地图定位

    2024-05-08 10:11:47
  • pandas DataFrame运算的实现

    2021-06-02 21:08:22
  • 对python插入数据库和生成插入sql的示例讲解

    2022-03-10 05:46:40
  • Python 马氏距离求取函数详解

    2023-08-27 01:28:58
  • python解析xml文件操作实例

    2022-01-02 10:39:13
  • 会员下线加积分,实现原理分享(有时间限制)

    2023-06-11 08:39:45
  • Python导入Excel表格数据并以字典dict格式保存的操作方法

    2023-05-25 17:58:37
  • go格式“占位符”输入输出 类似python的input

    2021-04-23 21:32:18
  • 彻底解决MySql在UTF8字符集下乱码问题

    2011-06-02 12:02:00
  • python 使用第三方库requests-toolbelt 上传文件流的示例

    2021-05-13 05:48:31
  • python 多线程爬取壁纸网站的示例

    2023-11-14 21:45:30
  • Python+selenium 获取一组元素属性值的实例

    2021-06-06 02:28:27
  • JS+ASP实现无刷新新闻列表之分页

    2007-08-22 12:57:00
  • TOPI如何使TVM代码不那么样板化

    2022-02-02 00:22:07
  • perl 采集入库脚本分享

    2023-09-13 08:45:40
  • Python中用format函数格式化字符串的用法

    2022-04-17 03:02:06
  • python中将阿拉伯数字转换成中文的实现代码

    2021-09-30 05:45:25
  • ASP无组件上载,带进度条,多文件上载

    2008-10-29 10:03:00
  • asp之家 网络编程 m.aspxhome.com