萬盛學電腦網

 萬盛學電腦網 >> 數據庫 >> mysql教程 >> mysql GROUP BY 與 ORDER BY數據排序問題

mysql GROUP BY 與 ORDER BY數據排序問題

在做一個數據分組查詢時發現我們要出來的數據不是最新版本,結果我再利用GROUP BY 與 ORDER BY數據排序但還不是最新的數據,那麼要如何解決呢

有兩個解決方法

1,where+group by(對小組進行排序)
2,從form返回的數據下手腳(即用子查詢)
由where+group by的解決方法
對group by裡的小組進行排序的函數我只查到group_concat()可以進行排序,但group_concat的作用是將小組裡的字段裡的值進行串聯起來。

 代碼如下 復制代碼

select group_concat(id order by `date` desc) from `test` group by category_id

 
再改進一下

 代碼如下 復制代碼 select * from `test` where id in(select SUBSTRING_INDEX(group_concat(id order by `date` desc),',',1) from `test` group by category_id ) order by `date` desc

 
子查詢解決方案

 代碼如下 復制代碼

select * from (select * from `test` order by `date` desc) `temp`  group by category_id order by `date` desc


自己例子
 

 代碼如下 復制代碼

SELECT *
FROM (

SELECT *
FROM `ecm_copy_goods_change`
ORDER BY `cid` DESC
) `ecm_copy_goods_change`
GROUP BY goods_id
ORDER BY `cid` DESC


 

一個dz論壇使用調最後發布內容的案例分析

在使用mysql排序的時候會想到按照降序分組來獲得一組數據,而使用order by往往得到的不是理想中的結果,那麼怎麼才能使用group by 和order by得到理想中的數據結果呢?

例如 有一個 帖子的回復表,posts( id , tid , subject , message , dateline ) ,

id為 自動增長字段, tid為該回復的主題帖子的id(外鍵關聯), subject 為回復標題, message 為回復內容, dateline 為回復時間,用UNIX 時間戳表示,

現在要求 選出 前十個來自不同主題的最新回復

 代碼如下 復制代碼


SELECT * FROM posts GROUP BY tid LIMIT 10


這樣一個sql語句選出來的並非你想要的 最新的回復,而是最早的回復,實際上是某篇主題的第一條回復記錄!

也就是說 GROUP BY 語句沒有排序,那麼怎麼才能讓 GROUP 按照 dateline 倒序排列呢?加上 order by 子句?

看下面:

 代碼如下 復制代碼

SELECT * FROM posts GROUP BY tid ORDER BY dateline DESC LIMIT 10


這條語句選出來的結果和上面的完全一樣,不過把結果倒序排列了,而選擇出來的每一條記錄仍然是上面的記錄,原因是 group by 會比 order by 先執行,這樣也就沒有辦法將 group by 之前,也就是在分組之前進行排序了, 有網友會寫出下面的sql 語句:

 代碼如下 復制代碼


SELECT * FROM posts GROUP BY tid DESC ORDER BY dateline DESC LIMIT 10


也就是說 在 GROUP BY 的字段 tid 後面加上遞減順序,這樣不就可以取得分組時的最後回復了嗎?這個語句執行結果會和上面的一模一樣,這裡加上 DESC 和ASC對執行結果沒有任何影響!其實這是一個錯誤的語句,原因是GROUP BY 之前並沒有排序功能,mysql 手冊上面說,GROUP BY 時是按照某種順序排序的,某種順序到底是什麼順序?其實根本沒有順序,因為按照tid分組,其實也就是說,把tid相等的歸納到一個組,這樣想的話,GROUP BY tid DESC 可以認為是在按照 tid 分組的時候,按照tid進行倒序排列,這不扯嗎,既然是按照tid分組,當然是tid相等的歸到一組,而這時候按照tid倒敘還是升序有個P用!

有網友發明下面的語句:

 代碼如下 復制代碼


SELECT * FROM posts GROUP BY tid , dateline DESC ORDER BY dateline DESC LIMIT 10


心想這樣我就可以在分組前按照 dateline 倒序排列了,其實這個語句並沒有起到按照tid分組的作用,原因還是上面的,在group by 字段後加 desc 還是 asc 是錯誤的寫法,而這種寫法 網友本意是想 按照 tid 分組,並且在分組的時候按照 dateline排倒序!而實際這句相當於下面的寫法:(去掉 GROUP BY 字段後面的 DESC)

 代碼如下 復制代碼


SELECT * FROM posts GROUP BY tid , dateline ORDER BY dateline DESC LIMIT 10


也就是說,按照 tid 和 dateline 聯合分組,只有在記錄tid和dateline 同時相等的時候才歸納到一組,這顯然不可能, 因為 dateline 時間線基本上是唯一的!


有人寫出下面的語句:

 代碼如下 復制代碼


SELECT *,max(dateline) as max_line FROM posts GROUP BY tid ORDER BY dateline DESC LIMIT 10


這條語句的沒錯是選出了最大發布時間,但是你可以對比一下 dateline 和 max_dateline 並不相等!(可能有相當的情況,就是分組的目標記錄只有一條的時候!)


為什麼呢?原因很簡單,這條語句相當於是 在group by 以後選出 本組的最大的 發布時間!對分組沒有起到任何影響!因為SELECT子句是最後執行的!

後來更有網友發明了下面的寫法!

 代碼如下 復制代碼


SELECT *,max(dateline) as max_line FROM posts GROUP BY tid HAVING dateline=max(dateline) ORDER BY dateline DESC LIMIT 10


這條語句的預期結果和想象中的並不相同!因為你會發現,分組的結果中大量的記錄沒有了!為什麼?因為 HAVING 是在分組的時候執行的,也就說:在分組的時候加上一個這樣的條件:選擇出來的 dateline 要和 本組最大的dateline 相等,執行的結果和下面的語句相同:

 代碼如下 復制代碼


SELECT *,max(dateline) as max_line FROM posts GROUP BY tid HAVING count(*)=1 ORDER BY dateline DESC LIMIT 10


看了這條sql語句是不是明白了呢?

dateline=max(dateline) 只有在分組中的記錄只有一條的時候才成立,原因很明白吧!只有一條他才會和本組的最大發布時間相等阿,(默認dateline為不重復的值)


原因還是因為 group by 並沒有排序功能,所有的這些排序功能只是錯覺,所以你最終選出的 dateline 和max(dateline) 永遠不可能相等,除非本組的記錄只有一條!GROUP BY 在分組的時候,可能是一個一個來找的,發現有相等的tid,去掉,保留第一個發現的那一條記錄,所以找出來的 記錄永遠只是按照默認索引順序排列的!


那麼說了這麼多,到底有沒有辦法讓 group by 執行前分組阿?有的 ,子查詢阿!


最簡單的 :

 

 代碼如下 復制代碼 SELECT * FROM (SELECT * FROM posts ORDER BY dateline DESC) GROUP BY tid ORDER BY dateline DESC LIMIT 10
copyright © 萬盛學電腦網 all rights reserved