萬盛學電腦網

 萬盛學電腦網 >> 數據庫 >> mysql教程 >> 初步介紹MySQL中的集合操作

初步介紹MySQL中的集合操作

   啥是集合操作?

  通常來說,將聯接操作看作是表之間的水平操作,因為該操作生成的虛擬表包含兩個表中的列。而我這裡總結的集合操作,一般將這些操作看作是垂直操作。MySQL數據庫支持兩種集合操作:UNION DISTINCT和UNION ALL。

  與聯接操作一樣,集合操作也是對兩個輸入進行操作,並生成一個虛擬表。在聯接操作中,一般把輸入表稱為左輸入和右輸入。集合操作的兩個輸入必須擁有相同的列數,若數據類型不同,MySQL數據庫自動將進行隱式轉換。同時,結果列的名稱由左輸入決定。

  前期准備

  准備測試表table1和table2:

  create table table1

  (aid int not null auto_increment,

  title varchar(20),

  tag varchar(10),

  primary key(aid))

  engine=innodb default charset=utf8;

  create table table2

  (bid int not null auto_increment,

  title varchar(20),

  tag varchar(10),

  primary key(bid))

  engine=innodb default charset=utf8;

  插入以下測試數據:

  insert into table1(aid, title, tag) values(1, 'article1', 'MySQL');

  insert into table1(aid, title, tag) values(2, 'article2', 'PHP');

  insert into table1(aid, title, tag) values(3, 'article3', 'CPP');

  insert into table2(bid, title, tag) values(1, 'article1', 'MySQL');

  insert into table2(bid, title, tag) values(2, 'article2', 'CPP');

  insert into table2(bid, title, tag) values(3, 'article3', 'C');

  UNION DISTINCT

  UNION DISTINCT組合兩個輸入,並應用DISTINCT過濾重復項,一般可以直接省略DISTINCT關鍵字,直接使用UNION。

  UNION的語法如下:

  SELECT column,... FROM table1

  UNION [ALL]

  SELECT column,... FROM table2

  ...

  在多個SELECT語句中,對應的列應該具有相同的字段屬性,且第一個SELECT語句中被使用的字段名稱也被用於結果的字段名稱。

  現在我運行以下sql語句:

  (select * from table1) union (select * from table2);

  將會得到以下結果:

  +-----+----------+-------+

  | aid | title | tag |

  +-----+----------+-------+

  | 1 | article1 | MySQL |

  | 2 | article2 | PHP |

  | 3 | article3 | CPP |

  | 2 | article2 | CPP |

  | 3 | article3 | C |

  +-----+----------+-------+

  我們發現,表table1和表table2中的重復數據項:

  | 1 | article1 | MySQL |

  只出現了一次,這就是UNION的作用效果。

  MySQL數據庫目前對UNION DISTINCT的實現方式如下:

  創建一張臨時表,也就是虛擬表;

  對這張臨時表的列添加唯一索引;

  將輸入的數據插入臨時表;

  返回虛擬表。

  因為添加了唯一索引,所以可以過濾掉集合中重復的數據項。這裡重復的意思是SELECT所選的字段完全相同時,才會算作是重復的。

  UNION ALL

  UNION ALL的意思是不會排除掉重復的數據項,比如我運行以下的sql語句:

  (select * from table1) union all (select * from table2);

  你將會得到以下結果:

  +-----+----------+-------+

  | aid | title | tag |

  +-----+----------+-------+

  | 1 | article1 | MySQL |

  | 2 | article2 | PHP |

  | 3 | article3 | CPP |

  | 1 | article1 | MySQL |

  | 2 | article2 | CPP |

  | 3 | article3 | C |

  +-----+----------+-------+

  發現重復的數據並不會被篩選掉。

  在使用UNION DISTINCT的時候,由於向臨時表中添加了唯一索引,插入的速度顯然會因此而受到影響。如果確認進行UNION操作的兩個集合中沒有重復的選項,最有效的辦法應該是使用UNION ALL。

copyright © 萬盛學電腦網 all rights reserved