oracle壓縮技術分為基本表壓縮(basic table compression),OLTP表壓縮(OLTP table compression),索引壓縮(index compression)和混合列壓縮(hybrid columnar compression (HCC))。
basic compression從9i開始推出,是oracle的默認壓縮方式。OLTP compression是11g開始推出,支持所有類型的DML操作的數據壓縮。壓縮會節省磁盤空間,但可能會增加CPU資源的消耗。本文主要討論常用的basic和LTOP壓縮,索引壓縮和HCC可以參考oracle其它文檔。表壓縮技術適合OLAP系統和OLTP系統中數據變化很小的歷史表,不適合頻繁DML操作的表
1.1 壓縮的原理
以OLTP壓縮為例,引用參考文檔4的說明,原理如下
請看一個 ACCOUNTS 表,它包含以下記錄:
在數據庫內部,假定一個數據庫塊包含上述所有行。
解壓縮的塊看上去是這樣的:記錄中的所有字段(列)都包含數據。壓縮此塊時,數據庫首先計算在所有行中發現的重復值,將這些值移出行外,然後將其放在塊的頭部附近。行中的這些重復值將被替換為一個表示其中每個值的符號。從概念上講,它看上去如下圖所示,您可以看到壓縮前後的塊。
注意這些值是如何從行中取出並放入頂部稱為“符號表”的特殊區域中的。列中的每個值都被分配一個符號,此符號將替代行內的實際值。由於符號所占空間小於實際值,因此記錄大小也遠遠小於初始值。行中的重復數據越多,符號表和塊越緊湊。
由於壓縮作為觸發事件發生,而不是在插入行時發生,因此在正常的 DML 進程中壓縮對性能沒有任何影響。壓縮被觸發後,對 CPU 的需求肯定會變得很高,但在其他任何時間 CPU 影響都為零,因此壓縮也適用於 OLTP 應用程序,這是 Oracle Database 11g 中壓縮的平衡點。
除了減少空間占用外,壓縮數據還將縮短網絡傳輸時間、減少備份空間,並使在 QA 和測試中維護生產數據庫的完整副本變得切實可行。
1.2 basic壓縮
下面通過具體的實驗來看basic壓縮和OLTP壓縮的效果和異同點。
basic compression的6組實驗,來比較各種情況下的表壓縮
?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 sys@MS4ADB3(dtydb5)> select count(*)from test; COUNT(*) ---------- 50000 -- 1.Baseline CTAS create table t1 tablespace users as select * from test where rownum <=50000; -- 2.CTAS with basic compression enabled create table t2 compress basic tablespaceusers as select * from test where rownum <=50000; -- 3.Normal insert into empty table defined as compressed create table t3 compress basic tablespaceusers as select * from test where rownum = 0; insert into t3 select * from test whererownum <= 50000; -- 4.Direct path insert into empty table defined as compressed create table t4 compress basic tablespaceusers as select * from test where rownum = 0; insert /*+append*/ into t4 select * fromtest where rownum <= 50000 -- 5.CTAS without compression, then change to compressed create table t5 tablespace users as select * from test where rownum <=50000; alter table t5 compress basic;?
1 2 3 4 5 6 --- 6. table move compress create table t6 tablespace users as select * from test where rownum <=50000; alter table t6 move compress basic;對表做表分析
?
1 2 3 4 5 6 7 8 9 10 11 execdbms_stats.gather_table_stats('SYS','T1'); execdbms_stats.gather_table_stats('SYS','T2'); execdbms_stats.gather_table_stats('SYS','T3'); execdbms_stats.gather_table_stats('SYS','T4'); execdbms_stats.gather_table_stats('SYS','T5'); execdbms_stats.gather_table_stats('SYS','T6');查詢表占用空間情況
?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 sys@MS4ADB3(dtydb5)> select table_name,blocks, pct_free , compression,compress_for 2 from user_tables 3 where table_name in('T1','T2','T3','T4','T5','T6'); TABLE_NAME BLOCKS PCT_FREE COMPRESSION COMPRESS_FOR ---------------------------------------------------------------------- ---------- ---------------- ------------------------ T1 666 10 DISABLED T2