萬盛學電腦網

 萬盛學電腦網 >> 電腦入門 >> SQL Server表中重復數據的刪除方法

SQL Server表中重復數據的刪除方法

如果表中有多組完全不同的重復的 PK 值,則逐個刪除它們會很費時間。在這種情況下,可使用下面的方法:

1.首先,運行上面的 GROUP BY 查詢來確定有多少組重復的 PK 值及每組的重復數。

2.選擇重復的鍵值放入臨時表中。例如:

SELECT col1, col2, col3=count(*)

INTO holdkey

FROM t1

GROUP BY col1, col2

HAVING count(*) > 1

3.選擇重復的行放入臨時表中,以清除進程中的重復值。例如:

SELECT DISTINCT t1.*

INTO holddups

FROM t1, holdkey

WHERE t1.col1 = holdkey.col1

AND t1.col2 = holdkey.col2

4.此時,holddups 表應有唯一的 PK;但是,如果 t1 有重復的 PK 而行唯一(如上面的 SSN 示例),情況就不是這樣了。請驗證 holddups 中的各個鍵是否唯一,是否沒有鍵重復而行唯一的情況。如果是這樣,您必須停在該處,確定對於給定重復的鍵值,您希望保留哪些行。例如,以下查詢:

SELECT col1, col2, count(*)

FROM holddups

GROUP BY col1, col2

應為各行返回計數 1.如果結果是 1,請繼續執行下面的步驟 5.如果不是 1,則存在鍵重復而行唯一的情況,且需要您決定要保存哪些行。通常,這將需要捨棄行或為此行創建新的唯一的鍵值。為 holddups 表中每個此種重復 PK 執行這兩個步驟之一。

5.從原始表中刪除重復的行。例如:

DELETE t1

FROM t1, holdkey

WHERE t1.col1 = holdkey.col1

AND t1.col2 = holdkey.col2

6.將唯一行放回原始表中。例如:

INSERT t1 SELECT * FROM holddups


copyright © 萬盛學電腦網 all rights reserved