程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MySQL綜合教程 >> MySQL查詢隨機數據的4種方法和性能對比

MySQL查詢隨機數據的4種方法和性能對比

編輯:MySQL綜合教程

下面從以下四種方案分析各自的優缺點。
方案一:
復制代碼 代碼如下:SELECT * FROM `table` ORDER BY RAND() LIMIT 0,1;
這種方法的問題就是非常慢。原因是因為MySQL會創建一張零時表來保存所有的結果集,然後給每個結果一個隨機索引,然後再排序並返回。
有幾個方法可以讓它快起來。
基本思想就是先獲取一個隨機數,然後使用這個隨機數來獲取指定的行。
由於所有的行都有一個唯一的id,我們將只取最小和最大id之間的隨機數,然後獲取id為這個數行。為了讓這個方法當id不連續時也能有效,我們在最終的查詢裡使用”>=”代替”=”。
為了獲取整張表的最小和最大id,我們使用MAX()和MIN()兩個聚合函數。這兩個方法會返回指定組裡的最大和最小值。在這裡這個組就是我們表裡的所有id字段值。
方案二:
復制代碼 代碼如下:<?php
$range_result = mysql_query( " SELECT MAX(`id`) AS max_id , MIN(`id`) AS min_id FROM `table` ");
$range_row = mysql_fetch_object( $range_result );
$random = mt_rand( $range_row->min_id , $range_row->max_id );
$result = mysql_query( " SELECT * FROM `table` WHERE `id` >= $random LIMIT 0,1 ");
就像我們剛才提到的,這個方法會用唯一的id值限制表的每一行。那麼,如果不是這樣情況怎麼辦?
下面這個方案是使用了MySQL的LIMIT子句。LIMIT接收兩個參數值。第一個參數指定了返回結果第一行的偏移量,第二個參數指定了返回結果的最大行數。偏移量指定第一行是0而不是1。
為了計算第一行的偏移量,我們使用MySQL的RAND()方法從0到1之間生成一個隨機數。然後我們把這個數字跟我們用COUNT()方法獲取倒的表記錄數相乘。由於LIMIT的參數必須是int型而不能是float,我們使用FLOOR()來處理結果。FLOOR()會計算小於表達式的最大值。最終的代碼就是這樣:
方案三:
復制代碼 代碼如下:<?php
$offset_result = mysql_query( " SELECT FLOOR(RAND() * COUNT(*)) AS `offset` FROM `table` ");
$offset_row = mysql_fetch_object( $offset_result );
$offset = $offset_row->offset;
$result = mysql_query( " SELECT * FROM `table` LIMIT $offset, 1 " );
在MySQL 4.1以後我們可以使用子子查詢合並上面兩個方法:
方案四:
復制代碼 代碼如下:SELECT * FROM `table` WHERE id >= (SELECT FLOOR( MAX(id) * RAND()) FROM `table` ) ORDER BY id LIMIT 1;
這個方案跟方案二有同樣的弱點,只對有唯一id值的表有效。
記住我們最初尋找選擇隨機行的替代方法的原因,速度!所以,這些方案的在執行時間上的比較會怎麼樣?我不會指出硬件和軟件配置或者給出具體的數字。大概的結果是這樣的:
最慢的是解決方案一(我們假定它用了100%的時間)。
方案二用了79%
方案三 – 13%
方案四 – 16%
so, 方案三勝出!

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved