萬盛學電腦網

 萬盛學電腦網 >> 數據庫 >> mysql教程 >> MySQL innodb 聚集索引的概念與使用教程

MySQL innodb 聚集索引的概念與使用教程

聚集索引是指數據庫表行中數據的物理順序與鍵值的邏輯(索引)順序相同。一個表只能有一個聚集索引,因為一個表的物理順序只有一種情況,所以,對應的聚集索引只能有一個。

在MySQL中,InnoDB引擎表是(聚集)索引組織表(clustered index organize table),而MyISAM引擎表則是堆組織表(heap organize table)。

也有人把聚集索引稱為聚簇索引。

當然了,聚集索引的概念不是MySQL裡特有的,其他數據庫系統也同樣有。

簡言之,聚集索引是一種索引組織形式,索引的鍵值邏輯順序決定了表數據行的物理存儲順序,而非聚集索引則就是普通索引了,僅僅只是對數據列創建相應的索引,不影響整個表的物理存儲順序。

我們先來看看兩種存儲形式的不同之處:

簡單說,IOT表裡數據物理存儲順序和主鍵索引的順序一致,所以如果新增數據是離散的,會導致數據塊趨於離散,而不是趨於順序。而HOT表數據寫入的順序是按寫入時間順序存儲的。

IOT表相比HOT表的優勢是:

范圍查詢效率更高;

數據頻繁更新(聚集索引本身不更新)時,更不容易產生碎片;

特別適合有一小部分熱點數據頻繁讀寫的場景;

通過主鍵訪問數據時快速可達;

IOT表的不足則有:

數據變化如果是離散為主的話,那麼效率會比HOT表差;

HOT表的不足有:

索引回表讀開銷很大;

大部分數據讀取時隨機的,無法保證被順序讀取,開銷大;

每張InnoDB表只能創建一個聚集索引,聚集索引可以由一列或多列組成。

上面說過,InnoDB是聚集索引組織表,它的聚集索引選擇規則是這樣的:

首先選擇顯式定義的主鍵索引做為聚集索引;

如果沒有,則選擇第一個不允許NULL的唯一索引;

還是沒有的話,就采用InnoDB引擎內置的ROWID作為聚集索引;

我們來看看InnoDB主鍵索引的示意圖:

可以看到,在這個索引結構的葉子節點中,節點key值是主鍵的值,而節點的value則存儲其余列數據,以及額外的ROWID、rollback pointer、trx id等信息。

結合這個圖,以及上面所述,我們可以知道:在InnoDB表中,其聚集索引相當於整張表,而整張表也是聚集索引。主鍵必然是聚集索引,而聚集索引則未必是主鍵。

MyISAM是堆組織表,它沒有聚集索引的概念。



innodb聚集索引clustered index


InnoDB和SolidDB支持clustered index.


clustered index不是一種單獨的索引結構,而是一種數據存儲方式,clustered index實際上是在B+ tree中同時保存了主鍵索引和數據。

clustered index存儲結構的表中數據行是保存在索引的葉子頁中的,clustered意思是數據行和索引主鍵都保存在一起。每個表只有一個clusterd index,就是那個primary key,換句話說Innodb按主鍵進行聚集。

如果沒有定義primary key,Innodb會試著使用 Unique nonullable index列來代替,如果這都沒有,會定義隱藏的主鍵然後再上面進行聚集。

 

clustered index的好處:

1)數據行是按主鍵順序存儲在一起的,讀取少量的磁盤頁面就可以把相鄰主鍵的數據讀出來。

2)索引和數據都保存在一棵B+ tree中,從索引中讀取數據較快

3)使用覆蓋索引的查詢可以使用包含在葉子節點的主鍵值。

clustered index缺點

1)更新clustered index列代價是昂貴的,因為要強制把每個更新的數據行移到新位置

2)按主鍵順序插入新行是一種好方法,否則更新主鍵或插入到隨機插入性能開銷比較大,數據行移動的時候還可能分頁,其實道理和第一條一樣。

3)輔助索引葉子節點包含的是主鍵列,而不是直接的數據行地址,所以輔助索引會相對較大

4)通過輔助索引的查找先找到的是主鍵列,然後再在主鍵索引中進行第二次查找,需要2次查找索引,但是Innodb的自哈希索引功能能減少這種損失。

 

Innodb和myisam的的索引及數據存儲比較

都是使用的 B+ tree索引結構,但是他們的數據存儲方式不一樣,參考《Mysql High performance》

MyIsam是按數據行插入的時間順序存儲存儲數據行,並且數據行和索引時分開存儲的(table.MYD, table.MYI),應該不會強行建立隱式主鍵索引;Myisam的主鍵索引和其它索引沒有結構上的區別。

而Innodb是按主鍵順序聚集存儲數據,數據行和索引都存儲在B+ tree裡面(聚集索引的主鍵最好的auto_increment的int型:插入的時候是按主鍵順序插入的;而且會使輔助索引的大小更小)。

copyright © 萬盛學電腦網 all rights reserved