一、交叉連接(cross join)
交叉連接(cross join):有兩種,顯式的和隱式的,不帶on子句,返回的是兩表的乘積,也叫笛卡爾積。
例如:下面的語句1和語句2的結果是相同的。
語句1:隱式的交叉連接,沒有cross join.
select o.id, o.order_number, c.id, c.name
from orders o , customers c
where o.id=1;
語句2:顯式的交叉連接,使用cross join.
select o.id,o.order_number,c.id,c.name
from orders o cross join customers c
where o.id=1;
語句1和語句2的結果是相同的,查詢結果如下:
二、內連接(inner join)
內連接(inner join):有兩種,顯式的和隱式的,返回連接表中符合連接條件和查詢條件的數據行。(所謂的鏈接表就是數據庫在做查詢形成的中間表)。
例如:下面的語句3和語句4的結果是相同的。
語句3:隱式的內連接,沒有inner join,形成的中間表為兩個表的笛卡爾積。
select o.id,o.order_number,c.id,c.name
from customers c, orders o
where c.id=o.customer_id;
語句4:顯示的內連接,一般稱為內連接,有inner join,形成的中間表為兩個表經過on條件過濾後的笛卡爾積。
select o.id,o.order_number,c.id,c.name
from customers c inner join orders o on c.id=o.customer_id;
語句3和語句4的查詢結果:
三、外連接(outer join):
外連不但返回符合連接和查詢條件的數據行,還返回不符合條件的一些行。外連接分三類:左外連接(left outer join)、右外連接(right outer join)和全外連接(full outer join)。
三者的共同點是都返回符合連接條件和查詢條件(即:內連接)的數據行。不同點如下:
左外連接還返回左表中不符合連接條件單符合查詢條件的數據行。
右外連接還返回右表中不符合連接條件單符合查詢條件的數據行。
全外連接還返回左表中不符合連接條件單符合查詢條件的數據行,並且還返回右表中不符合連接條件單符合查詢條件的數據行。全外連接實際是上左外連接和右外連接的數學合集(去掉重復),即"全外=左外union 右外".
說明:左表就是在"(left outer join)"關鍵字左邊的表。右表當然就是右邊的了。在三種類型的外連接中,outer 關鍵字是可省略的。
下面舉例說明:
語句5:左外連接(left outer join)
select o.id,o.order_number,o.customer_id,c.id,c.name
from orders o left outer join customers c on c.id=o.customer_id;
語句6:右外連接(right outer join)
select o.id,o.order_number,o.customer_id,c.id,c.name
from orders o right outer join customers c on c.id=o.customer_id;
注意:where條件放在on後面查詢的結果是不一樣的。例如:
語句7:where條件獨立。
select o.id,o.order_number,o.customer_id,c.id,c.name
from orders o left outer join customers c on c.id=o.customer_id
where o.order_number<>'mike_order001';
語句8:將語句7中的where條件放到on後面。
select o.id,o.order_number,o.customer_id,c.id,c.name
from orders o left outer join customers c on c.id=o.customer_id and o.order_number<>'mike_order001';
從語句7和語句8查詢的結果來看,顯然是不相同的,語句8顯示的結果是難以理解的。因此,推薦在寫連接查詢的時候,on後面只跟連接條件,而對中間表限制的條件都寫到where子句中。
語句9:全外連接(full outer join)。
select o.id,o.order_number,o.customer_id,c.id,c.name
from orders o full outer join customers c on c.id=o.customer_id;
注意:mysql是不支持全外的連接的,這裡給出的寫法適合oracle和db2.但是可以通過左外和右外求合集來獲取全外連接的查詢結果。下圖是上面sql在oracle下執行的結果:
語句10:左外和右外的合集,實際上查詢結果和語句9是相同的。
select o.id,o.order_number,o.customer_id,c.id,c.name
from orders o left outer join customers c on c.id=o.customer_id
union
select o.id,o.order_number,o.customer_id,c.id,c.name
from orders o right outer join customers c on c.id=o.customer_id;
語句9和語句10的查詢結果是相同的,如下:
四、聯合連接(union join):
這是一種很少見的連接方式。oracle、mysql均不支持,其作用是:找出全外連接和內連接之間差異的所有行。這在數據分析中排錯中比較常用。也可以利用數據庫的集合操作來實現此功能。
語句11:聯合查詢(union join)例句,還沒有找到能執行的sql環境。
select o.id,o.order_number,o.customer_id,c.id,c.name
from orders o union join customers c on c.id=o.customer_id
語句12:語句11在db2下的等價實現。還不知道db2是否支持語句11呢!
select o.id,o.order_number,o.customer_id,c.id,c.name
from orders o full outer join customers c on c.id=o.customer_id
except
select o.id,o.order_number,o.customer_id,c.id,c.name
from orders o inner join customers c on c.id=o.customer_id;
語句13:語句11在oracle下的等價實現。
select o.id,o.order_number,o.customer_id,c.id,c.name
from orders o full outer join customers c on c.id=o.customer_id
minus
select o.id,o.order_number,o.customer_id,c.id,c.name
from orders o inner join customers c on c.id=o.customer_id;
查詢結果如下:
五、自然連接(natural inner join):
說真的,這種連接查詢沒有存在的價值,既然是sql2標准中定義的,就給出個例子看看吧。自然連接無需指定連接列,sql會檢查兩個表中是否相同名稱的列,且假設他們在連接條件中使用,並且在連接條件中僅包含一個連接列。不允許使用on語句,不允許指定顯示列,顯示列只能用*表示(oracle環境下測 試的)。對於每種連接類型(除了交叉連接外),均可指定natural.下面給出幾個例子。
語句14:
select *
from orders o natural inner join customers c;
語句15:
select *
from orders o natural left outer join customers c;
語句16:
select *
from orders o natural right outer join customers c;
語句17:
select *
from orders o natural full outer join customers c;
六、sql查詢的基本原理:兩種情況介紹。
第一、?? 單表查詢:根據where條件過濾表中的記錄,形成中間表(這個中間表對用戶是不可見的);然後根據select的選擇列選擇相應的列進行返回最終結果。
第二、?? 兩表連接查詢:對兩表求積(笛卡爾積)並用on條件和連接類型進行過濾形成中間表;然後根據where條件過濾中間表的記錄,並根據select指定的列返回查詢結果。
第三、?? 多表連接查詢:先對第一個和第二個表按照兩表連接做查詢,然後用查詢結果和第三個表做連接查詢,以此類推,直到所有的表都連接上為止,最終形成一個中間的結果表,然後根據where條件過濾中間表的記錄,並根據select指定的列返回查詢結果。
理解sql查詢的過程是進行sql優化的理論依據。
七、on後面的條件(on條件)和where條件的區別:
on條件:是過濾兩個鏈接表笛卡爾積形成中間表的約束條件。
where條件:在有on條件的select語句中是過濾中間表的約束條件。在沒有on的單表查詢中,是限制物理表或者中間查詢結果返回記錄的約束。在兩表或多表連接中是限制連接形成最終中間表的返回結果的約束。
從這裡可以看出,將where條件移入on後面是不恰當的。推薦的做法是:
on只進行連接操作,where只過濾中間表的記錄。
八、總結
連接查詢是sql查詢的核心,連接查詢的連接類型選擇依據實際需求。如果選擇不當,非但不能提高查詢效率,反而會帶來一些邏輯錯誤或者性能低下。下面總結一下兩表連接查詢選擇方式的依據:
1、 查兩表關聯列相等的數據用內連接。
2、col_l是col_r的子集時用右外連接。
3、col_r是col_l的子集時用左外連接。
4、col_r和col_l彼此有交集但彼此互不為子集時候用全外。
5、 求差操作的時候用聯合查詢。
多個表查詢的時候,這些不同的連接類型可以寫到一塊。例如:
select t1.c1,t2.cx,t3.cy
from tab1 t1
inner join tab2 t2 on (t1.c1=t2.c2)
inner join tab3 t3 on (t1.c1=t2.c3)
left outer join tab4 on(t2.c2=t3.c3);
where t1.x >t3.y;