萬盛學電腦網

 萬盛學電腦網 >> 數據庫 >> mysql教程 >> MySQL常用的查詢隨機數據方法對比

MySQL常用的查詢隨機數據方法對比

查詢隨機數據在小數據量那種方法都沒有影響了,但是如果在大數據量時影響非常的大這個和大數據量分頁使用limit是一樣的道理我們下面來看看MySQL常用的查詢隨機數據方法對比。

方案一:

代碼如下:

 代碼如下 復制代碼

SELECT * FROM `table` ORDER BY RAND() LIMIT 0,1;

這種方法的問題就是非常慢。原因是因為MySQL會創建一張零時表來保存所有的結果集,然後給每個結果一個隨機索引,然後再排序並返回。

有幾個方法可以讓它快起來。

基本思想就是先獲取一個隨機數,然後使用這個隨機數來獲取指定的行。

由於所有的行都有一個唯一的id,我們將只取最小和最大id之間的隨機數,然後獲取id為這個數行。為了讓這個方法當id不連續時也能有效,我們在最終的查詢裡使用”>=”代替”=”。

為了獲取整張表的最小和最大id,我們使用MAX()和MIN()兩個聚合函數。這兩個方法會返回指定組裡的最大和最小值。在這裡這個組就是我們表裡的所有id字段值。
方案二:

 代碼如下 復制代碼 $range_result = mysql_query( " SELECT MAX(`id`) AS max_id , MIN(`id`) AS min_id FROM `table` ");
$range_row = mysql_fetch_object( $range_result );
$random = mt_rand( $range_row->min_id , $range_row->max_id );
$result = mysql_query( " SELECT * FROM `table` WHERE `id` >= $random LIMIT 0,1 ");

就像我們剛才提到的,這個方法會用唯一的id值限制表的每一行。那麼,如果不是這樣情況怎麼辦?

下面這個方案是使用了MySQL的LIMIT子句。LIMIT接收兩個參數值。第一個參數指定了返回結果第一行的偏移量,第二個參數指定了返回結果的最大行數。偏移量指定第一行是0而不是1。

為了計算第一行的偏移量,我們使用MySQL的RAND()方法從0到1之間生成一個隨機數。然後我們把這個數字跟我們用COUNT()方法獲取倒的表記錄數相乘。由於LIMIT的參數必須是int型而不能是float,我們使用FLOOR()來處理結果。FLOOR()會計算小於表達式的最大值。最終的代碼就是這樣:
方案三:

 代碼如下 復制代碼

<?php
$offset_result = mysql_query( " SELECT FLOOR(RAND() * COUNT(*)) AS `offset` FROM `table` ");
$offset_row = mysql_fetch_object( $offset_result );
$offset = $offset_row->offset;
$result = mysql_query( " SELECT * FROM `table` LIMIT $offset, 1 " );

在MySQL 4.1以後我們可以使用子子查詢合並上面兩個方法:

方案四:

代碼如下:

 代碼如下 復制代碼

SELECT * FROM `table` WHERE id >= (SELECT FLOOR( MAX(id) * RAND()) FROM `table` ) ORDER BY id LIMIT 1;

方案4和方案2只對有唯一id值的表有效。

我們選擇隨機方法的最重要的是查詢速度!所以,這些方案的在執行時間上的比較會怎麼樣?我不會指出硬件和軟件配置或者給出具體的數字。大概的結果是這樣的:

最慢的是解決方案一(我們假定它用了100%的時間)。

方案二用了79%

方案三 – 13%

方案四 – 16%

從上面的參數來看我們會發現方案三是最優的方案哦,所以我們多查詢幾次並不一定比一次要慢哦。

copyright © 萬盛學電腦網 all rights reserved