萬盛學電腦網

 萬盛學電腦網 >> 數據庫 >> mysql教程 >> MySQL數據庫索引使用方法

MySQL數據庫索引使用方法

   走向精通MySQL的道路非常的艱難,還好各種關系型數據庫大同小異,足夠讓我從增刪改查上升到高性能數據庫的架構和調優。這期間的各種概念就不絮叨了,我也很難表述的很清楚,昨天寫了個小腳本往我本機MySQL數據庫的某張表裡面注入了200萬條數據(Windows7旗艦版/1.66GHz/2G內存/MySQL5.1.50),數據表的結構如下圖所示,屬於一個比較基本的定長表,考慮到我可憐的本本的承受能力,id使用從1開始的自增,title字段為隨機20個標題中的一個,content都是相同的內容,time使用時間戳而非datetime類型,即10位整型數據。

MySQL數據庫索引使用方法  三聯

  就是這麼一個結構極其簡單的表,200萬數量級的復雜查詢將會變的非常緩慢,比如執行下面的SQL語句。

  SELECT a.id,FROM_UNIXTIME(a.time)

  FROM article AS a

  WHERE a.title=‘PHP筆試題和答案——基礎語言方面’

  查詢時間基本上需要50-100秒,這個是非常恐怖的,如果加上聯合查詢和其他一些約束條件,數據庫會瘋狂的消耗內存。

數據庫,mysql

  如果這時候數據庫裡面針對title字段建立了索引,查詢效率將會大幅度提升,如下圖所示。可見對於大型數據庫,建立索引是非常非常重要的一個優化手段(當然還會有很多其他優化這樣的數據庫的方法,但是本文主題所限,暫不討論。),廢話了這麼多,以下開始總結MySQL中索引的使用方法和性能優化以及一些注意事項。

數據庫,mysql

  索引的概念

  索引是一種特殊的文件(InnoDB數據表上的索引是表空間的一個組成部分),它們包含著對數據表裡所有記錄的引用指針。更通俗的說,數據庫索引好比是一本書前面的目錄,能加快數據庫的查詢速度。上述SQL語句,在沒有索引的情況下,數據庫會遍歷全部200條數據後選擇符合條件的;而有了相應的索引之後,數據庫會直接在索引中查找符合條件的選項。如果我們把SQL語句換成“SELECT * FROM article WHERE id=2000000”,那麼你是希望數據庫按照順序讀取完200萬行數據以後給你結果還是直接在索引中定位呢?上面的兩個圖片鮮明的用時對比已經給出了答案(注:一般數據庫默認都會為主鍵生成索引)。

  索引分為聚簇索引和非聚簇索引兩種,聚簇索引是按照數據存放的物理位置為順序的,而非聚簇索引就不一樣了;聚簇索引能提高多行檢索的速度,而非聚簇索引對於單行的檢索很快。

  索引的類型

  1. 普通索引

  這是最基本的索引,它沒有任何限制,比如上文中為title字段創建的索引就是一個普通索引。

  –直接創建索引

  CREATE INDEX indexName ON table(column(length))

  –修改表結構的方式添加索引

  ALTER tableADD INDEX indexName ON (column(length))

  –創建表的時候同時創建索引

  CREATE TABLE `table` (

  `id` int(11) NOT NULL AUTO_INCREMENT ,

  `title` char(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,

  `content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL ,

  `time` int(10) NULL DEFAULT NULL ,

  PRIMARY KEY (`id`),

  INDEX indexName (title(length))

  )

  –刪除索引

  DROP INDEX indexName ON table

  2. 唯一索引

  與普通索引類似,不同的就是:索引列的值必須唯一,但允許有空值(注意和主鍵不同)。如果是組合索引,則列值的組合必須唯一,創建方法和普通索引類似。

  –創建唯一索引

  CREATE UNIQUE INDEX indexName ON table(column(length))

  –修改表結構

  ALTER table ADD UNIQUE indexName ON (column(length))

  –創建表的時候直接指定

  CREATE TABLE `table` (

  `id` int(11) NOT NULL AUTO_INCREMENT ,

  `title` char(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,

  `content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL ,

  `time` int(10) NULL DEFAULT NULL ,

  PRIMARY KEY (`id`),

  UNIQUE indexName (title(length))

  );

  3. 全文索引(FULLTEXT)

  MySQL從3.23.23版開始支持全文索引和全文檢索,FULLTEXT索引僅可用於 MyISAM 表;他們可以從CHAR、VARCHAR或TEXT列中作為CREATE TABLE語句的一部分被創建,或是隨後使用ALTER TABLE 或CREATE INDEX被添加。////對於較大的數據集,將你的資料輸入一個沒有FULLTEXT索引的表中,然後創建索引,其速度比把資料輸入現有FULLTEXT索引的速度更為快。不過切記對於大容量的數據表,生成全文索引是一個非常消耗時間非常消耗硬盤空間的做法。

  –創建表的適合添加全文索引

  CREATE TABLE `table` (

  `id` int(11) NOT NULL AUTO_INCREMENT ,

  `title` char(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,

  `content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL ,

  `time` int(10) NULL DEFAULT NULL ,

  PRIMARY KEY (`id`),

  FULLTEXT (content)

  );

  –修改表結構添加全文索引

  ALTER TABLE article ADD FULLTEXT index_content(content)

  –直接創建索引

  CREATE FULLTEXT INDEX index_content ON article(content)

  4. 單列索引、多列索引

  多個單列索引與單個多列索引的查詢效果不同,因為執行查詢時,MySQL只能使用一個索引,會從多個索引中選擇一個限制最為嚴格的索引。

  5. 組合索引(最左前綴)

  平時用的SQL查詢語句一般都有比較多的限制條件,所以為了進一步搾取MySQL的效率,就要考慮建立組合索引。例如上表中針對title和time建立一個組合索引:ALTER TABLE article ADD INDEX index_titme_time (title(50),time(10))。建立這樣的組合索引,其實是相當於分別建立了下面兩組組合索引:

  –title,time

  –title

  為什麼沒有time這樣的組合索引呢?這是因為MySQL組合索引“最左前綴”的結果。簡單的理解就是只從最左面的開始組合。並不是只要包含這兩列的查詢都會用到該組合索引,如下面的幾個SQL所示:

  –使用到上面的索引

  SELECT * FROM article WHREE title=“PHP程序員” AND time=1234567890

  SELECT * FROM article WHREE utitle=“PHP程序員”

  –不使用上面的索引

  SELECT * FROM article WHREE time=1234567890

  MySQL索引的優化

  上面都在說使用索引的好處,但過多的使用索引將會造成濫用。因此索引也會有它的缺點:雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對表進行INSERT、UPDATE和DELETE。因為更新表時,MySQL不僅要保存數據,還要保存一下索引文件。建立索引會占用磁盤空間的索引文件。一般情況這個問題不太嚴重,但如果你在一個大表上創建了多種組合索引,索引文件的會膨脹很快。索引只是提高效率的一個因素,如果你的MySQL有大數據量的表,就需要花時間研究建立最優秀的索引,或優化查詢語句。下面是一些總結以及收藏的MySQL索引的注意事項和優化方法。

  1. 何時使用聚集索引或非聚集索引?

動作描述 使用聚集索引 使用非聚集索引 列經常被分組排序 使用 使用 返回某范圍內的數據 使用 不使用 一個或極少不同值 不使用 不使用 小數目的不同值 使用 不使用 大數目的不同值 不使用 使用 頻繁更新的列 不使用 使用 外鍵列 使用 使用 主鍵列 使用 使用 頻繁修改索引列 不使用 使用

  事實上,我們可以通過前面聚集索引和非聚集索引的定義的例子來理解上表。如:返回某范圍內的數據一項。比如您的某個表有一個時間列,恰好您把聚合索引建立在了該列,這時您查詢2004年1月1日至2004年10月1日之間的全部數據時,這個速度就將是很快的,因為您的這本字典正文是按日期進行排序的,聚類索引只需要找到要檢索的所有數據中的開頭和結尾數據即可;而不像非聚集索引,必須先查到目錄中

copyright © 萬盛學電腦網 all rights reserved