程式師世界 >> 數據庫知識 >> DB2數據庫 >> DB2教程 >> DB2終極SQL性能調節技術經典版

DB2終極SQL性能調節技術經典版

編輯：DB2教程

以下的文章主要向大家描述的是DB2終極SQL性能調節技術，其中包括指針對於DB2數據庫性能的影響，DB2性能調節技術以及對更多未來的調節技術這些內容的詳細描述，以下就是文章的主要內容講述。

DB2，SQL，調優

使用針對工作負載的正確的性能調節技術，以避免硬件升級和優化DB2性能

性能通過響應時間，吞吐量，峰值響應時間，命中和每秒會話來衡量。SQL編碼和調節技術直接影響性能。開發高性能的DB2應用需要對DB2技術的深入了解。

當然在小數據量時這些技術無足輕重。忽略的連接，子查詢，表的表達式和CASE表達式的程序完全可以在輕量級負載下工作的很好。使用100%的SELECT INFO語句來進行數據獲取的程序，在開始會非常的迅速。

但是一旦數據量和會話速度增加，性能將受到很大影響。DB2的可擴展性需要小的，優化的SQL加上方案設計，性能結構，緩沖池，和針對工作負載模式優化的存儲。另外的方案就是升級硬件了。當然對於有著硬件升級的無盡預算的人來說，不用閱讀本文了。對於其他人，我將講解如何編碼聰明的SQL以及調優的訪問路徑。

指針對於DB2性能的影響

曾經有段時間，在一個大的復雜的銀行應用程序中存在著一個批處理程序。這個新的批處理程序和訪問路徑被通過代碼走查的方式檢查過了。因為項目截止日期的原因測試很少;在實際的首次運行中，程序在運行10個小時之後終止了。

一個很慢的代碼走查之後，發現了7個指針，每個指針訪問一個不同的表中的數據。每個指針在其他打開的指針的循環中被打開，在彼此間傳遞數據。也就是說，這個程序在DB2以外竟然結合了7個表。這不是聰明的SQL。這個信息需要進入到7個表;然而，每個指針只能進入一個。因此，7個指針被合並為一個聰明的指針：　

SELECT COL1, COL2, rest of the columns  
FROM ADDR A, NAME N, T3, T4, T5, T6, T7  
WHERE A.COL1 = N.COL9  
AND N.COL9 = T3.COL3  
AND T3.COL3 = T4.COL4  
AND T4.COL4 <> T5.COL5  
AND T4.COLX <> T5.COLY  
AND T5.COL6 = T6.COL6  
AND T6.COL6 = T7.COL7  
AND T6.CODE = :hv

這個批處理在第二天用了四分鐘就完成了。大多數人可能會結束這個成功的任務了，但是務實的人不會。一個緩慢的EXPLAIN信息走查發現了一個有趣的表連接序列問題。優化器選擇了開始7個表的復雜的循環連接，還使用了一系列的大的數據表(ADDR和NAME)，它們每個都包含5千萬行數據。這不是DB2優化器的典型行為。然而，有一些使用<>比較小表之間列的連接情況。

這些比較對於優化器來說很難估計，因為DB2 catalog包含了相等列而非不等列。這裡就需要訪問路徑優化了。DB2優化者腦中肯定有多種推薦的解決方案，一些可以在包或語句層次上，另外的一些工作在謂詞層次。當然還有其他一些傳統方式不奏效情況下的DB2終極技術。

一個要求就是如下的性能調節技術提供給你的catalog以足夠的統計，使用統計向導來保證優化器有關於你的數據的精確全景。

DB2性能調節技術

包級別的SQL調優——需要REOPT(ONCE/ALWAYS/AUTO) BIND選項。這個語句通告優化器來在運行時重新優化包中的每個語句，至少ONCE，或者ALWAYS(每次執行)，在DB2 9中可以AUTO(需要時)。這項技術的開銷由選擇的選項和SQL語句的數量及復雜性決定。這些開銷在批處理程序中可以忽略不計，但是在短期運行的交易中會有很大影響。在我們的例子中，批處理程序指針只有一個謂詞和一個基數為1的主機變量。REOPT是一個調節選項，用來優化非統一列值分布和主機變量內容高可變的情況，是COLCARDF=1的反面。包級別的調節並不合適。

語句級別的調節技術——包括OPTIMIZE FOR n ROWS和FETCH FIRST n ROWS ONLY。這些語句，放在SELECT語句末尾，是在不需要結果集的情況下進行優化的。優化器假設除了這些語句的所有的SELECT語句需要整個結果，這些結果偏向於諸如數序和表預取的訪問路徑。因為我們的批處理指針一定需要整個結果，因此語句級別的調節也不是合適的技術。

謂詞界別的調節技術——包括增加一個假的過濾器(TX.CX=TX.CX)或增加一個空操作到謂詞上(+0,-0,/1,*1, CONCAT ‘’)。一個假的過濾器能夠通過減少總過濾器因素(表中滿足資格的行的比例)改變優化器。這個方法能夠改變表連接的順序，索引選擇和連接方法。多個假過濾器是允許的，但是必須在沒有引用過的一列上。

空操作(no op)能夠通過降級一個過濾器從符合到不符合來改變優化器的工作方式，但是只在z/OS上有用，LUW優化器卻不受其影響。這個改變也會影響一個表連接序列，索引選擇和連接方法。謂詞級別的技術可以被一起使用來獲取想要的結果。我們例子中的指針對多個謂詞級別調節的結合不起反應，因此是采用重武器的時候了。

一些終極調節技術包括使用DISTINCE的表的表達式和其他DB2終極跨查詢的塊優化方法。這些技術要求手動查詢重寫。它們強制使得優化器以一個指定順序的方式執行查詢塊。使用這些技術視需要終極提醒的，因為他們能把表連接序列，索引選擇和連接方法從好改到壞。DISTINCE表表達式強制優化器優先於其他查詢塊執行圓括號中的查詢。

如果SELECT DISTINCE中指定的列引用了不同的表，表表達式可以被實例化為唯一的以供排序。我們的批處理指針有一個非優化的連接序列，使用該技術得到如下查詢：

SELECT All columns needed FROM ADDR, NAME, (SELECT DISTINCT columns from tables 3 through 7  
FROM T3, T4, T5, T6, T7  
WHERE join conditions T3 through T7  
AND T6.CODE =:hv) AS TEMP  
WHERE join conditions for ADDR, NAME and TEMP

這樣的查詢重寫迫使優化器通過T7連接表T3來連接ADDR和NAME。如果關鍵字DISTINCT在上例中省略了，DB2優化器合並表表達式查詢和輸出查詢，這樣就和原來的語句和連接序列一樣了。

SELECT DISTINCT是一個關鍵的組件。然而，因為列列表跨越了多個表，臨時的5個表連接結果實例為一個唯一的工作文件以供排序。排序的開銷平均在每次執行幾千行，這是可以忽略的負載。批處理程序現在可以在兩分鐘之內完成任務了。

更多未來的調節技術

其他的一些查詢重寫技術從全異的查詢塊中獲取信息，以重寫查詢。IBM曾經將此技術成為跨查詢塊優化;DB2 9中被成為全局優化。一個好消息就是這項技術開始在DB2優化器的自我查詢重寫(QWR)階段中出現了。所有DB2查詢都能使用它也是指日可待了。同時，我們也需要將一些DB2終極方法掌握在自己的手裡。