萬盛學電腦網

浏覽器 windows 10 wps office 殺毒軟件 數據庫 excel教程 文件管理 word教程 網頁制作 裝機必備軟件 linux教程

萬盛學電腦網 >> 數據庫 >> mysql教程 >> Mysql group by語句的優化分析

Mysql group by語句的優化分析

group by我們用到分組了如果數據量大的話分組會非常的慢了，當然我們可以對group by進行優化這樣可以提升group by的性能。

默認情況下，MySQL排序所有GROUP BY col1, col2, ....，查詢的方法如同在查詢中指定ORDER BY col1, col2, ...。如果顯式包括一個包含相同的列的ORDER BY子句，MySQL可以毫不減速地對它進行優化，盡管仍然進行排序。

如果查詢包括GROUP BY但你想要避免排序結果的消耗，你可以指定ORDER BY NULL禁止排序。例如：

代碼如下復制代碼

INSERT INTO foo

SELECT a, COUNT(*) FROM bar GROUP BY a ORDER BY NULL;

執行GROUP BY子句的最一般的方法：先掃描整個表，然後創建一個新的臨時表，表中每個組的所有行應為連續的，最後使用該臨時表來找到組並應用聚集函數(如果有聚集函數)。在某些情況中，MySQL通過訪問索引就可以得到結果，而不用創建臨時表。此類查詢的 EXPLAIN 輸出顯示 Extra列的值為 Using index for group-by。

一。松散索引掃描

1.滿足條件

查詢針對一個表。

GROUP BY 使用索引的最左前綴。
只可以使用MIN()和MAX()聚集函數，並且它們均指向相同的列。
2.示例

表t1(c1,c2,c3,c4) 有一個索引 idx(c1，c2，c3)：

代碼如下復制代碼

SELECT c1, c2 FROM t1 GROUP BY c1, c2;

SELECT DISTINCT c1, c2 FROM t1;

SELECT c1, MIN(c2) FROM t1 GROUP BY c1;

SELECT c1, c2 FROM t1 WHERE c1 < const GROUP BY c1, c2;

SELECT MAX(c3), MIN(c3), c1, c2 FROM t1 WHERE c2 > const GROUP BY c1, c2;

SELECT c2 FROM t1 WHERE c1 < const GROUP BY c1, c2;

SELECT c1, c2 FROM t1 WHERE c3 = const GROUP BY c1, c2；

不滿足條件示例：

1. 除了MIN()或MAX()，還有其它累積函數，例如：

代碼如下復制代碼

SELECT c1, SUM(c2) FROM t1 GROUP BY c1;

2. GROUP BY子句中的域不引用索引開頭，例如：

代碼如下復制代碼 SELECT c1,c2 FROM t1 GROUP BY c2, c3;

3. 查詢引用了GROUP BY 部分後面的關鍵字的一部分，並且沒有等於常量的等式，例如：

代碼如下復制代碼

SELECT c1,c3 FROM t1 GROUP BY c1, c2；

二。緊湊索引掃描

如果不滿足松散索引掃描條件，執行GROUP BY仍然可以不用創建臨時表。如果WHERE子句中有范圍條件，該方法只讀取滿足這些條件的關鍵字。

否則，進行索引掃描。該方法讀取由WHERE子句定義的范圍。

1. GROUP BY 中有一個漏洞，但已經由條件c2 = 'a'覆蓋。

代碼如下復制代碼

SELECT c1，c2，c3 FROM t1 WHERE c2 = 'a' GROUP BY c1，c3;

2. GROUP BY 不是滿足最左前綴，但是有一個條件提供該元素的常量：

代碼如下復制代碼

SELECT c1，c2，c3 FROM t1 WHERE c1 = 'a' GROUP BY c2，c3;

下面是什麼情況下可以使用loose index scan的情況：

1 單一表查詢

2 Group by中只有最左前綴列，沒有其他列

3 只支持max和min聚合，而且，要聚合的列必須是group by中列所在的索引。

4 未被group by引用的索引其他部分必須是常量（這句我不是很理解）

5 不支持前綴索引。

假設t1(c1, c2, c3, c4)表有一個索引包括c1, c2, c3列，以下這些查詢都是可以進行loose index scan的：

代碼如下復制代碼

SELECT c1, c2 FROM t1 GROUP BY c1, c2;
SELECT DISTINCT c1, c2 FROM t1;
SELECT c1, MIN(c2) FROM t1 GROUP BY c1;
SELECT c1, c2 FROM t1 WHERE c1 < const GROUP BY c1, c2;
SELECT MAX(c3), MIN(c3), c1, c2 FROM t1 WHERE c2 > const GROUP BY c1, c2;
SELECT c2 FROM t1 WHERE c1 < const GROUP BY c1, c2;
SELECT c1, c2 FROM t1 WHERE c3 = const GROUP BY c1, c2;

這些都是抄的官方文檔，正確性未完全驗證。

下面這些SQL都沒有辦法使用loose index scan：

-- 因為聚合函數不是max或者min

代碼如下復制代碼 SELECT c1, SUM(c2) FROM t1 GROUP BY c1;

-- 因為不符合最左前綴原則

代碼如下復制代碼 SELECT c1, c2 FROM t1 GROUP BY c2, c3;

-- 查詢涉及到了索引的一部分，緊跟group by中的列，但是沒有常量等值語句，加上 WHERE c3 = const就好了

代碼如下復制代碼

SELECT c1, c3 FROM t1 GROUP BY c1, c2;

另外一些聚合函數也是可以用到loose index scan的，比如：AVG(DISTINCT), SUM(DISTINCT), 和COUNT(DISTINCT)

以下這些語句也可以：

代碼如下復制代碼

SELECT COUNT(DISTINCT c1), SUM(DISTINCT c1) FROM t1;

SELECT COUNT(DISTINCT c1, c2), COUNT(DISTINCT c2, c1) FROM t1;

很多語句都是從5.7的文檔上摘抄下來的，正確性沒有得到驗證，雖說官方文檔是權威，但是盡信書不如無書，以及紙上得來終覺淺，絕知此事須躬行，明天周末，我逐條測試，然後再更。

上一頁:Mysql insert語句的優化總結
下一頁:Mysql中order by語句的優化詳解

萬盛學電腦網

萬盛學電腦網 >> 數據庫 >> mysql教程 >> Mysql group by語句的優化分析

Mysql group by語句的優化分析

mysql教程排行

程序編程推薦

熱門文章

相關文章

圖片文章

14例運用復古元素的網頁設計案例賞析

網站交互設計的8個要點

如何快速找出存在問題的交互設計

為你解讀蘋果SAN FRANCISCO字體的秘密

萬盛學電腦網 | 設為首頁 | 加入收藏