很多的時侯,做Oracle DBA的我們,當應用管理員向我們通告現在應用很慢、數據庫很慢的時侯,我們到數據庫時做幾個示例的Select也發現同樣的問題時,有些時侯我們會無從下手,因為我們認為數據庫的各種命種率都是滿足Oracle文檔的建議。實際上如今的優化己經向優化等待(waits)轉型了,實際中性能優化最根本的出現點也都集中在IO,這是影響性能最主要的方面,由系統中的等待去發現Oracle庫中的不足、操作系統某些資源利用的不合理是一個比較好的辦法,下面把我的一點實踐經驗與大家分享一下,本文測重於Unix環境。 一、通過操作系統的一些工具檢查系統的狀態,比如CPU、內存、交換、磁盤的利用率,根據經驗或與系統正常時的狀態相比對,有時系統表面上看起來看空閒這也可能不是一個正常的狀態,因為cpu可能正等待IO的完成。除此之外我們還應觀注那些占用系統資源(cpu、內存)的進程。
1、如何檢查操作系統是否存在IO的問題?使用的工具有sar,這是一個比較通用的工具。
Rp1#sar -u 2 10
即每隔2秒檢察一次,共執行20次,當然這些都由你決定了。
示例返回:
HP-UX hpn2 B.11.00 U 9000/800 08/05/03
18:26:32 %usr %sys %wio %idle
注:我在redhat下查看是這種結果,不知%system就是所謂的%wio
Linux 2.4.21-20.ELsmp (YY075) 05/19/2005
10:36:07 AM CPU %user %nice %system %idle
10:36:09 AM all 0.00 0.00 0.13 99.87
10:36:11 AM all 0.00 0.00 0.00 100.00
10:36:13 AM all 0.25 0.00 0.25 99.49
10:36:15 AM all 0.13 0.00 0.13 99.75
10:36:17 AM all 0.00 0.00 0.00 100.00
10:36:17 AM CPU %user %nice %system %idle
10:36:19 AM all 0.00 0.00 0.00 100.00
10:36:21 AM all 0.00 0.00 0.00 100.00
10:36:23 AM all 0.00 0.00 0.00 100.00
10:36:25 AM all 0.00 0.00 0.00 100.00
其中的%usr指的是用戶進程使用的cpu資源的百分比,%sys指的是系統資源使用cpu資源的百分比,%wio指的是等待io完成的百分比,這是值得我們觀注的一項,%idle即空閒的百分比。如果wio列的值很大,如在35%以上,說明你的系統的IO存在瓶頸,你的CPU花費了很大的時間去等待IO的完成。Idle很小說明系統CPU很忙。像我的這個示例,可以看到wio平均值為11說明io沒什麼特別的問題,而我的idle值為零,說明我的cpu已經滿負荷運行了。
當你的系統存在IO的問題,可以從以下幾個方面解決
*聯系相應的操作系統的技術支持對這方面進行優化,比如hp-ux在劃定卷組時的條帶化等方面。
*查找Oracle中不合理的sql語句,對其進行優化。
*對Oracle中訪問量頻繁的表除合理建索引外,再就是把這些表分表空間存放以免訪問上產生熱點,再有就是對表合理分區。
2、關注一下內存
常用的工具便是vmstat,對於hp-unix來說可以用glance,Aix來說可以用topas,當你發現vmstat中pi列非零,memory中的free列的值很小,glance,topas中內存的利用率多於80%時,這時說明你的內存方面應該調節一下了,方法大體有以下幾項。
*劃給Oracle使用的內存不要超過系統內存的1/2,一般保在系統內存的40%為益。
為系統增加內存
*如果你的連接特別多,可以使用MTS的方式
*打全補丁,防止內存漏洞。
3、如何找到點用系用資源特別大的Oracle的session及其執行的語句。
Hp-unix可以用glance,top
IBM AIX可以用topas
此外可以使用ps的命令。
通過這些程序我們可以找到點用系統資源特別大的這些進程的進程號,我們就可以通過以下的sql語句發現這個pid正在執行哪個sql,這個sql最好在pl/sql developer,toad等軟件中執行, 把<>中的spid換成你的spid就可以了。
SELECT a.username,a.machine,a.program,a.sid,a.serial#,a.status,c.piece,c.sql_text from v$session a,v$process b,v$sqltext c WHERE b.spid=@#ORCL@# AND b.addr=a.paddr AND a.sql_address=c.address(+)order BY c.piece
我們就可以把得到的這個sql分析一下,看一下它的執行計劃是否走索引,對其優化避免全表掃描,以減少IO等待,從而加快語句的執行速度。
提示:我在做優化sql時,經常碰到使用in的語句,這時我們一定要用exists把它給換掉,因為Oracle在處理In時是按Or的方式做的,即使使用了索引也會很慢。
比如:
SELECT col1,col2,col3 FROM table1 a
WHERE a.col1 not in (SELECT col1 FROM table2)
可以換成:
SELECT col1,col2,col3 FROM table1 a
WHERE not exists
(SELECT @#x@# FROM table2 b
WHERE a.col1=b.col1)
4、另一個有用的腳本:查找前十條性能差的sql.
SELECT * FROM (select PARSING_USER_ID,EXECUTIONS,SORTS,COMMAND_TYPE,DISK_READS,sql_text FROM v$sqlarea
order BY disk_reads DESC )where ROWNUM<10 ;