程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MySQL綜合教程 >> mysql優化取隨機數據慢的辦法

mysql優化取隨機數據慢的辦法

編輯:MySQL綜合教程

mysql優化取隨機數據慢的辦法。本站提示廣大學習愛好者:(mysql優化取隨機數據慢的辦法)文章只能為提供參考,不一定能成為您想要的結果。以下是mysql優化取隨機數據慢的辦法正文


前天由於任務須要我把從一個5W記載的數據庫中隨機抽取幾筆記錄了,這裡我是直接應用mysql rand by函數來直接,幾千筆記錄沒緊要,但假如到了幾萬條感到要幾秒,這個就很慢了,上面小編與年夜家一路來看看mysql 取隨機數據慢優化進程。
MySQL許多時刻須要獲得隨機數據,舉個例子,要從tablename表中隨機提取一筆記錄,年夜家普通的寫法就是:

SELECT * FROM tablename ORDER BY RAND() LIMIT 1
 
然則,後來我查了一下MYSQL的官方手冊,外面針對RAND()的提醒年夜概意思就是,在ORDER BY從句外面不克不及應用RAND()函數,由於如許會招致數據列被屢次掃描。然則在MYSQL 3.23版本中,依然可以經由過程ORDER BY RAND()來完成隨機。
 測試一下才發明如許效力異常低。一個15萬余條的庫,查詢5條數據,竟然要8秒以上。檢查官方手冊,也說rand()放在ORDER BY 子句中會被履行屢次,天然效力及很低。
You cannot use a column with RAND() values in an ORDER BY clause, because ORDER BY would evaluate the column multiple times.
搜刮Google,網上根本上都是查詢max(id) * rand()來隨機獲得數據。

SELECT *
FROM 'table' AS t1 JOIN (SELECT ROUND(RAND() * (SELECT MAX(id) FROM 'table')) AS id) AS t2
WHERE t1.id >= t2.id
ORDER BY t1.id ASC LIMIT 5;
 
然則如許會發生持續的5筆記錄。處理方法只能是每次查詢一條,查詢5次。即使如斯也值得,由於15萬條的表,查詢只須要0.01秒不到。
上面的語句采取的是JOIN,mysql的服裝論壇t.vhao.net上有人應用:

SELECT *
FROM 'table'
WHERE id >= (SELECT FLOOR( MAX(id) * RAND()) FROM 'table' )
ORDER BY id LIMIT 1;
 
我測試了一下,須要0.5秒,速度也不錯,然則跟下面的語句照樣有很年夜差距。總覺有甚麼處所不正常。
因而把語句改寫了一下。

SELECT * FROM 'table'
WHERE id >= (SELECT floor(RAND() * (SELECT MAX(id) FROM 'table'))) 
ORDER BY id LIMIT 1;
 
這下,效力又進步了,查詢時光只要0.01秒。
 最初,再把語句完美一下,加上MIN(id)的斷定。我在最開端測試的時刻,就是由於沒有加上MIN(id)的斷定,成果有一半的時光老是查詢到表中的後面幾行。
 完全查詢語句是:
 
SELECT * FROM 'table' WHERE id >= (
SELECT floor(
RAND() * ((SELECT MAX(id) FROM 'table')-(SELECT MIN(id) FROM 'table'))
+ (SELECT MIN(id) FROM 'table')
)
) 
ORDER BY id LIMIT 1;

SELECT * FROM 'table' AS t1 JOIN (
SELECT ROUND(
# 最小值 + (1 至 最小與最年夜值差)
RAND() * (
(SELECT MAX(id) FROM 'table')-(SELECT MIN(id) FROM 'table')
)
+(SELECT MIN(id) FROM 'table')
) AS id
) AS t2
WHERE t1.id >= t2.id
ORDER BY t1.id LIMIT 1;
 
最初在php中對這兩個語句停止分離查詢10次,前者消費時光 0.147433 秒,後者消費時光 0.015130 秒。看來采取JOIN的語法比直接在WHERE中應用函數效力還要高許多。

SELECT *
FROM `table` AS t1 JOIN (SELECT ROUND(RAND() * ((SELECT MAX(id) FROM `table`) – (SELECT MIN(id) FROM `table`)) + (SELECT MIN(id) FROM `table`)) AS id) AS t2
WHERE t1.id >= t2.id
ORDER BY t1.id LIMIT 10;
 
這個就是我本身選用了,從之前5秒到現面0.0003秒時光都不消就查出10筆記錄了。
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved