程式師世界 >> 數據庫知識 >> DB2數據庫 >> DB2教程 >> 對DB2 V9.7 本地分區索引的詳細描述

對DB2 V9.7 本地分區索引的詳細描述

編輯：DB2教程

此文章主要講述的是DB2 V9.7 本地分區索引的介紹，DB2 V9.7 數據庫其提出了范圍分區表的分區索引的實際操作的概念，這主要是為客戶在原有的全局索引基礎上增加了一個新的功能選擇。

分區索引采用 B 樹結構，將一棵全局大樹分解為諾干個小樹，樹的層次將會顯著減少，這將會提高數據的插入、更新、刪除和掃描的性能。分區索引在分區表的 Roll in/Roll out 時不需要重新構建整個索引，加速了數據的滾入和滾出。

簡介

在 DB2 V9.7 以前，范圍分區表只支持全局索引或者稱為非分區索引），這樣即使分區表的數據是分布在多個表空間上的，分區表的所有索引只能存儲在同一個表空間中。這一特性限制了索引掃描只能在一個表空間上對該索引的頁面進行讀取，導致讀取頁面過多並約束了掃描的並行性。

DB2 V9.7 使用分區索引的索引組織方案，即索引數據根據表的分區方案分布到多個索引分區中，每個索引分區都只引用對應數據分區中的表行。從 DB2 V9.7 開始，創建索引時默認創建分區索引，除非出現以下情況：

對 CREATE INDEX 語句指定了 UNIQUE，並且索引鍵未包括所有表分區鍵列。

創建基於空間數據的索引。

創建基於 XML 數據的索引

分區索引的創建

一個分區表可以同時存在分區索引和非分區索引。如果創建分區索引，那個每個索引分區將都包含單個數據分區的索引條目，索引葉子節點中的 RID 也將只指向單個數據分區。

在我們使用 Alter table 語句的 Attach Partition 子句將數據 Roll in 或者 Roll Out 分區表時，分區索引將特別有用。如果使用非分區索引，那麼必須先發出 Set Integrity 語句，新添加的分區中的數據才能進入聯機狀態。這個過程可能非常消耗時間，並可能消耗大量日志空間。當使用分區索引時這些開銷將會被消除。

分區索引的每個分區均采用 B 樹結構存儲，由於分區後一個大型 B 樹被劃分為若干小型 B 樹，樹的層數將會減少，這會提高數據的插入、更新、刪除以及掃描的性能。同時我們執行查詢時，DB2 將會采用分區消除優化方法提高掃描性能和並行性。分區消除技術幫助優化器先過濾了不需要的索引分區，只需要掃描相應的分區就能完成查詢，這比掃描非分區的索引更為高效。

清單 1. 創建示例分區表與索引

CREATE TABLE t1 ( l_orderkey INTEGER, l_partkey INTEGER, l_suppkey INTEGER,  
l_shipdate date, padding1 char(30) )   
PARTITION BY RANGE(l_shipdate)   
(   
partition quarter01 STARTING '2008-01-01' ENDING '2008-03-31'in DMS_D1,   
partition quarter02 STARTING '2008-04-01' ENDING '2008-06-30'in DMS_D2,   
partition quarter03 STARTING '2008-07-01' ENDING '2008-09-30' in DMS_D3,   
partition quarter04 STARTING '2008-10-01' ENDING '2008-12-31' in DMS_D4   
);   
Create index idx_t1_l_orderkey on t1(l_orderkey) NOT partitioned ;   
Create index idx_t1_l_partkey on t1(l_partkey) partitioned;

上面代碼中，我們創建了一個擁有四個分區的范圍分區表，同時創建了兩個索引。索引 index idx_t1_l_orderkey 是非分區索引，idx_t1_l_partkey 是分區索引。

我們下面查看一下上面代碼執行後數據字典關於表 T1 以及它的索引的描述。系統視圖 syscat.datapartitions 中包含了分區表的分區信息以及相關統計信息，系統視圖 syscat.indexpartitions 中則包含了分區索引的分區信息和相關統計信息。

清單 2. 分區表的數據分區信息

db2 "select substr(TABNAME ,1,10) t_name,substr(DATAPARTITIONNAME ,1,10) part_name,   
DATAPARTITIONID ,substr(LOWVALUE,1,12) low_value,substr(HIGHVALUE,1,12) high_value   
from syscat.datapartitions where tabname='T1'"   
T_NAME PART_NAME DATAPARTITIONID TBSPACEID LOW_VALUE HIGH_VALUE ----------   
T1 QUARTER01 0 8 '2008-01-01' '2008-03-31'   
T1 QUARTER02 1 9 '2008-04-01' '2008-06-30'   
T1 QUARTER03 2 10 '2008-07-01' '2008-09-30'   
T1 QUARTER04 3 11 '2008-10-01' '2008-12-31'

清單 2 中代碼執行查詢，從系統視圖 syscat.datapartitions 中獲取關於數據分區的信息。查詢結果顯示，表 T1 具有四個分區，名稱與我們創建時相同，ID 依次為 0、1、2、3，數據分布在表空間 DMS_D1ID 為 8）、DMS_D2ID 為 9）、DMS_D2ID 為 10）、DMS_D3ID 為 11）上。本例中的表空間信息如下：

清單 3. 表空間信息

db2 "select substr(TBSPACE,1,18) tablespace_name,TBSPACEID ,TBSPACETYPE   
from syscat.tablespaces"   
TABLESPACE_NAME TBSPACEID TBSPACETYPE   
SYSCATSPACE 0 D TEMPSPACE1 1 S USERSPACE1 2 D   
IBMDB2SAMPLEREL 3 D IBMDB2SAMPLEXML 4 D SYSTOOLSPACE 5 D   
SYSTOOLSTMPSPACE 6 S TBS_TEST 7 D   
DMS_D1 8 D DMS_D2 9 D DMS_D3 10 D DMS_D4 11 D DMS_I1 12 D

清單 4. 索引基本信息

db2 "select substr(tabname,1,10) tab_name, substr(INDNAME,1,18) inx_name,TBSPACEID   
from syscat.indexes where tabname='T1'"   
TAB_NAME INX_NAME TBSPACEID ---------- ------------------ -----------   
T1 IDX_T1_L_ORDERKEY   
8   
T1 IDX_T1_L_PARTKEY 65530

我們看到非分區索引 IDX_T1_L_ORDERKEY 數據存放在表空間 DMS_D1 上ID 為 8），這意味著在創建索引未明確指定表空間時，DB2 將使用第一個數據分區所在的表空間存放非分區索引。而索引 IDX_T1_L_PARTKEY 所在的表空間 ID 為 65530，我們通過表空間信息部分看到我們的數據庫中沒有 ID 為 65530 表空間。

由於分區索引的存儲特性是和數據分區關聯的，一個索引將分布在多個表空間中，因此 DB2 用了 65530 特殊值表示索引的表空間，並不表示這個 ID 對應的表空間存在以上的相關內容就是對DB2 V9.7 本地分區索引的介紹，望你能有所收獲。

完整內容的學習，請訪問：

http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0907luohq/