在過去的十年中, Oracle 已經成為世界上最專業的數據庫之一。對於 IT 專家來說,就是要確保利用Oracle 的強大特性來提高他們公司的生產力。最有效的方法之一是通過 Oracle 調優。它有大量的調整參數和技術來改進你的 Oracle 數據庫的性能。
Oracle 調優是一個復雜的主題。關於調優可以寫整整一本書,不過,為了改善 Oracle 數據庫的性能,有一些基本的概念是每個 Oracle DBA 都應該遵從的。
在這篇簡介中,我們將簡要地介紹以下的 Oracle 主題:
-- 外部調整:我們應該記住 Oracle 並不是單獨運行的。因此我們將查看一下通過調整 Oracle 服務器以得到高的性能。
--Row re-sequencing 以減少磁盤 I/O :我們應該懂得 Oracle 調優最重要的目標是減少 I/O 。
--Oracle SQL 調整。 Oracle SQL 調整是 Oracle 調整中最重要的領域之一,只要通過一些簡單的 SQL 調優規則就可以大幅度地提升 SQL 語句的性能,這是一點都不奇怪的。
-- 調整 Oracle 排序:排序對於 Oracle 性能也是有很大影響的。
-- 調整 Oracle 的競爭:表和索引的參數設置對於 UPDATE 和 INSERT 的性能有很大的影響。
我們首先從調整 Oracle 外部的環境開始。如果內存和 CPU 的資源不足的話,任何的 Oracle 調整都是沒有幫助的。
外部的性能問題
Oracle 並不是單獨運行的。 Oracle 數據庫的性能和外部的環境有很大的關系。這些外部的條件包括有:
. CPU--CPU 資源的不足令查詢變慢。當查詢超過了 Oracle 服務器的 CPU 性能時,你的數據庫性能就受到 CPU 的限制。
.內存 -- 可用於 Oralce 的內存數量也會影響 SQL 的性能,特別是在數據緩沖和內存排序方面。
.網絡 -- 大量的 Net8 通信令 SQL 的性能變慢。
許多新手都錯誤的認為應該首先調整 Oracle 數據庫,而不是先確認外部資源是否足夠。實際上,如果外部環境出現瓶頸,再多的 Oracle 調整都是沒有幫助的。
在檢查 Oracle 的外部環境時,有兩個方面是需要注意的:
1 、當運行隊列的數目超過服務器的 CPU 數量時,服務器的性能就會受到 CPU 的限制。補救的方法是為服務器增加額外的 CPU 或者關閉需要很多處理資源的組件,例如 Oracle Parallel Query 。
2 、內存分頁。當內存分頁時,內存容量已經不足,而內存頁是與磁盤上的交換區進行交互的。補救的方法是增加更多的內存,減少 Oracle SGA 的大小,或者關閉 Oracle 的多線程服務器。
可以使用各種標准的服務器工具來得到服務器的統計數據,例如 vmstat,glance,top 和 sar 。 DBA 的目標是確保數據庫服務器擁有足夠的 CPU 和內存資源來處理 Oracle 的請求。
以下讓我們來看一下 Oracle 的 row-resequencing 是如何能夠極大地減少磁盤 I/O 的。
Row-resequencing (行的重新排序)
就象我們上面提到的,有經驗的 Oracle DBA 都知道 I/O 是響應時間的最大組成部分。其中磁盤 I/O 特別厲害,因為當 Oracle 由磁盤上的一個數據文件得到一個數據塊時,讀的進程就必須等待物理 I/O 操作完成。磁盤操作要比數據緩沖慢 10,000 倍。因此,如果可以令 I/O 最小化,或者減少由於磁盤上的文件競爭而帶來的瓶頸,就可以大大地改善 Oracle 數據庫的性能。
如果系統響應很慢,通過減少磁盤 I/O 就可以有一個很快的改善。如果在一個事務中通過按一定的范圍搜索 primary-key 索引來訪問表,那麼重新以 CTAS 的方法組織表將是你減少 I/O 的首要策略。通過在物理上將行排序為和 primary-key 索引一樣的順序,就可以加快獲得數據的速度。
就象磁盤的負載平衡一樣,行的重新排序也是很簡單的,而且也很快。通過與其它的 DBA 管理技巧一起使用,就可以在高 I/O 的系統中大大地減少響應的時間。
在高容量的在線事務處理環境中( online transaction processing , OLTP ),數據是由一個 primary 索引得到的,重新排序表格的行就可以令連續塊的順序和它們的 primary 索引一樣,這樣就可以在索引驅動的表格查詢中,減少物理 I/O 並且改善響應時間。這個技巧僅在應用選擇多行的時候有用,或者在使用索引范圍搜索和應用發出多個查詢來得到連續的 key 時有效。對於隨機的唯一 primary-key (主鍵)的訪問將不會由行重新排序中得到好處。
讓我們看一下它是如何工作的。考慮以下的一個 SQL 的查詢,它使用一個索引來得到 100 行:
selectsalaryfromemployeewherelast_name like 'B%';
這個查詢將會使用 last_name_index ,搜索其中的每一行來得到目標行。這個查詢將會至少使用 100 次物理磁盤的讀取,因為 employee 的行存放在不同的數據塊中。
不過,如果表中的行已經重新排序為和 last_name_index 的一樣,同樣的查詢又會怎樣處理呢?我們可以看到這個查詢只需要三次的磁盤 I/O 就讀完全部 100 個員工的資料(一次用作索引的讀取,兩次用作數據塊的讀取),減少了 97 次的塊讀取。
重新排序帶來的性能改善的程度在於在你開始的時候行的亂序性如何,以及你需要由序列中訪問多少行。至於一個表中的行與索引的排序鍵的匹配程度,可以查看數據字典中的 dba_indexes 和 dba_tables 視圖得到。
在 dba_indexes 的視圖中,查看 clustering_factor 列。如果 clustering_factor 的值和表中的塊數目大致一樣,那麼你的表和索引的順序是一樣的。不過,如果 clustering_factor 的值接近表中的行數目,那就表明表格中的行和索引的順序是不一樣的。
行重新排序的作用是不可以小看的。在需要進行大范圍的索引搜索的大表中,行重新排序可以令查詢的性能提高三倍。
一旦你已經決定重新排序表中的行,你可以使用以下的工具之一來重新組織表格。
. 使用 Oracle 的 Create Table As Select (CTAS) 語法來拷貝表格
. Oracle9i 自帶的表格重新組織工具
以下,我們來看以下 SQL 語句的調優。
SQL 調優
Oracle 的 SQL 調優是一個復雜的主題,甚至是需要整本書來介紹 Oracle SQL 調優的細微差別。不過有一些基本的規則是每個 Oracle DBA 都需要跟從的,這些規則可以改善他們系統的性能。 SQL 調優的目標是簡單的:
. 消除不必要的大表全表搜索:不必要的全表搜索導致大量不必要的 I/O ,從而拖慢整個數據庫的性能。調優專家首先會根據查詢返回的行數目來評價 SQL 。在一個有序的表中,如果查詢返回少於 40% 的行,或者在一個無序的表中,返回少於 7% 的行,那麼這個查詢都可以調整為使用一個索引來代替全表搜索。對於不必要的全表搜索來說,最常見的調優方法是增加索引。可以在表中加入標准的 B 樹索引,也可以加入 bitmap 和基於函數的索引。要決定是否消除一個全表搜索,你可以仔細檢查索引搜索的 I/O 開銷和全表搜索的開銷,它們的開銷和數據塊的讀取和可能的並行執行有關,並將兩者作對比。在一些情況下,一些不必要的全表搜索的消除可以通過強制使用一個 index 來達到,只需要在 SQL 語句中加入一個索引的提示就可以了。
. 在全表搜索是一個最快的訪問方法時,將小表的全表搜索放到緩存中,調優專家應該確保有一個專門的數據緩沖用作行緩沖。在 Oracle7 中,你可以使用 alter table xxx cache 語句,在 Oracle8 或以上,小表可以被強制為放到 KEEP 池中緩沖。
. 確保最優的索引使用 :對於改善查詢的速度,這是特別重要的。有時 Oracle 可以選擇多個索引來進行查詢,調優專家必須檢查每個索引並且確保 Oracle 使用正確的索引。它還包括 bitmap 和基於函數的索引的使用。
. 確保最優的 JOIN 操作:有些查詢使用 NESTED LOOP join 快一些,有些則是 HASH join 快一些,另外一些則是 sort-merge join 更快。
這些規則看來簡單,不過它們占 SQL 調優任務的 90% ,並且它們也無需完全懂得 Oracle SQL 的內部運作。以下我們來簡單概覽以下 Oracle SQL 的優化。
我們首先簡要查看 Oracle 的排序,並且看一看排序操作是如何影響性能的。
調整 Oracle 的排序操作
排序是 SQL 語法中一個小的方面,但很重要,在 Oracle 的調整中,它常常被忽略。當使用 create index 、 ORDER BY 或者 GROUP BY 的語句時, Oracle 數據庫將會自動執行排序的操作。通常,在以下的情況下 Oracle 會進行排序的操作:
使用 Order by 的 SQL 語句
使用 Group by 的 SQL 語句
在創建索引的時候
進行 table join 時,由於現有索引的不足而導致 SQL 優化器調用 MERGE SORT
當與 Oracle 建立起一個 session 時,在內存中就會為該 session 分配一個私有的排序區域。如果該連接是一個專用的連接 (dedicated connection) ,那麼就會根據 init.ora 中 sort_area_size 參數的大小在內存中分配一個 Program Global Area (PGA) 。如果連接是通過多線程服務器建立的,那麼排序的空間就在 large_pool 中分配。不幸的是,對於所有的 session ,用做排序的內存量都必須是一樣的,我們不能為需要更大排序的操作分配額外的排序區域。因此,設計者必須作出一個平衡,在分配足夠的排序區域以避免發生大的排序任務時出現磁盤排序( disk sorts )的同時,對於那些並不需要進行很大排序的任務,就會出現一些浪費。當然,當排序的空間需求超出了 sort_area_size 的大小時,這時將會在 TEMP 表空間中分頁進行磁盤排序。磁盤排序要比內存排序大概慢 14,000 倍。
上面我們已經提到,私有排序區域的大小是有 init.ora 中的 sort_area_size 參數決定的。每