最近要進行導數的工作,從好幾張表中導入到一張表,其中數據可能重復,所以在導入之前要進行數據的比對。
方法一:我用group by having count(*)>1將重復的數據提取出來,然後進行人工比對,事實證明,有夠笨的!
方法二:請教了一位資深人員,提供了一個更好的方法。就是將三個字段連接起來作為主鍵,進行數據是否重復的判斷。這裡值得注意的是某列的值可能為空,所以要賦一個空字符串過去。
select * from t1 where nvl(col1,'')|| nvl(col2,'')|
| col3 not in (select col1||col2||col3 from t2)
然後將不重復的值,插入t2就可以了。