程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> DB2數據庫 >> DB2教程 >> DB2終極SQL性能調節技術經典版

DB2終極SQL性能調節技術經典版

編輯:DB2教程

以下的文章主要向大家描述的是DB2終極SQL性能調節技術,其中包括指針對於DB2數據庫性能的影響,DB2性能調節技術以及對更多未來的調節技術這些內容的詳細描述,以下就是文章的主要內容講述。

DB2,SQL,調優

使用針對工作負載的正確的性能調節技術,以避免硬件升級和優化DB2性能

性能通過響應時間,吞吐量,峰值響應時間,命中和每秒會話來衡量。SQL編碼和調節技術直接影響性能。開發高性能的DB2應用需要對DB2技術的深入了解。

當然在小數據量時這些技術無足輕重。忽略的連接,子查詢,表的表達式和CASE表達式的程序完全可以在輕量級負載下工作的很好。使用100%的SELECT INFO語句來進行數據獲取的程序,在開始會非常的迅速。

但是一旦數據量和會話速度增加,性能將受到很大影響。DB2的可擴展性需要小的,優化的SQL加上方案設計,性能結構,緩沖池,和針對工作負載模式優化的存儲。另外的方案就是升級硬件了。當然對於有著硬件升級的無盡預算的人來說,不用閱讀本文了。對於其他人,我將講解如何編碼聰明的SQL以及調優的訪問路徑。

指針對於DB2性能的影響

曾經有段時間,在一個大的復雜的銀行應用程序中存在著一個批處理程序。這個新的批處理程序和訪問路徑被通過代碼走查的方式檢查過了。因為項目截止日期的原因測試很少;在實際的首次運行中,程序在運行10個小時之後終止了。

一個很慢的代碼走查之後,發現了7個指針,每個指針訪問一個不同的表中的數據。每個指針在其他打開的指針的循環中被打開,在彼此間傳遞數據。也就是說,這個程序在DB2以外竟然結合了7個表。這不是聰明的SQL。這個信息需要進入到7個表;然而,每個指針只能進入一個。因此,7個指針被合並為一個聰明的指針: 

  1. SELECT COL1, COL2, rest of the columns  
  2. FROM ADDR A, NAME N, T3, T4, T5, T6, T7  
  3. WHERE A.COL1 = N.COL9  
  4. AND N.COL9 = T3.COL3  
  5. AND T3.COL3 = T4.COL4  
  6. AND T4.COL4 <> T5.COL5  
  7. AND T4.COLX <> T5.COLY  
  8. AND T5.COL6 = T6.COL6  
  9. AND T6.COL6 = T7.COL7  
  10. AND T6.CODE = :hv  

這個批處理在第二天用了四分鐘就完成了。大多數人可能會結束這個成功的任務了,但是務實的人不會。一個緩慢的EXPLAIN信息走查發現了一個有趣的表連接序列問題。優化器選擇了開始7個表的復雜的循環連接,還使用了一系列的大的數據表(ADDR和NAME),它們每個都包含5千萬行數據。這不是DB2優化器的典型行為。然而,有一些使用<>比較小表之間列的連接情況。

這些比較對於優化器來說很難估計,因為DB2 catalog包含了相等列而非不等列。這裡就需要訪問路徑優化了。DB2優化者腦中肯定有多種推薦的解決方案,一些可以在包或語句層次上,另外的一些工作在謂詞層次。當然還有其他一些傳統方式不奏效情況下的DB2終極技術。

一個要求就是如下的性能調節技術提供給你的catalog以足夠的統計,使用統計向導來保證優化器有關於你的數據的精確全景。

DB2性能調節技術

包級別的SQL調優——需要REOPT(ONCE/ALWAYS/AUTO) BIND選項。這個語句通告優化器來在運行時重新優化包中的每個語句,至少ONCE,或者ALWAYS(每次執行),在DB2 9中可以AUTO(需要時)。這項技術的開銷由選擇的選項和SQL語句的數量及復雜性決定。這些開銷在批處理程序中可以忽略不計,但是在短期運行的交易中會有很大影響。在我們的例子中,批處理程序指針只有一個謂詞和一個基數為1的主機變量。REOPT是一個調節選項,用來優化非統一列值分布和主機變量內容高可變的情況,是COLCARDF=1的反面。包級別的調節並不合適。

語句級別的調節技術——包括OPTIMIZE FOR n ROWS和FETCH FIRST n ROWS ONLY。這些語句,放在SELECT語句末尾,是在不需要結果集的情況下進行優化的。優化器假設除了這些語句的所有的SELECT語句需要整個結果,這些結果偏向於諸如數序和表預取的訪問路徑。因為我們的批處理指針一定需要整個結果,因此語句級別的調節也不是合適的技術。

謂詞界別的調節技術——包括增加一個假的過濾器(TX.CX=TX.CX)或增加一個空操作到謂詞上(+0,-0,/1,*1, CONCAT ‘’)。一個假的過濾器能夠通過減少總過濾器因素(表中滿足資格的行的比例)改變優化器。這個方法能夠改變表連接的順序,索引選擇和連接方法。多個假過濾器是允許的,但是必須在沒有引用過的一列上。

空操作(no op)能夠通過降級一個過濾器從符合到不符合來改變優化器的工作方式,但是只在z/OS上有用,LUW優化器卻不受其影響。這個改變也會影響一個表連接序列,索引選擇和連接方法。謂詞級別的技術可以被一起使用來獲取想要的結果。我們例子中的指針對多個謂詞級別調節的結合不起反應,因此是采用重武器的時候了。

一些終極調節技術包括使用DISTINCE的表的表達式和其他DB2終極跨查詢的塊優化方法。這些技術要求手動查詢重寫。它們強制使得優化器以一個指定順序的方式執行查詢塊。使用這些技術視需要終極提醒的,因為他們能把表連接序列,索引選擇和連接方法從好改到壞。DISTINCE表表達式強制優化器優先於其他查詢塊執行圓括號中的查詢。

如果SELECT DISTINCE中指定的列引用了不同的表,表表達式可以被實例化為唯一的以供排序。我們的批處理指針有一個非優化的連接序列,使用該技術得到如下查詢:

  1. SELECT All columns needed FROM ADDR, NAME, (SELECT DISTINCT columns from tables 3 through 7  
  2. FROM T3, T4, T5, T6, T7  
  3. WHERE join conditions T3 through T7  
  4. AND T6.CODE =:hv) AS TEMP  
  5. WHERE join conditions for ADDR, NAME and TEMP  

這樣的查詢重寫迫使優化器通過T7連接表T3來連接ADDR和NAME。如果關鍵字DISTINCT在上例中省略了,DB2優化器合並表表達式查詢和輸出查詢,這樣就和原來的語句和連接序列一樣了。

SELECT DISTINCT是一個關鍵的組件。然而,因為列列表跨越了多個表,臨時的5個表連接結果實例為一個唯一的工作文件以供排序。排序的開銷平均在每次執行幾千行,這是可以忽略的負載。批處理程序現在可以在兩分鐘之內完成任務了。

更多未來的調節技術

其他的一些查詢重寫技術從全異的查詢塊中獲取信息,以重寫查詢。IBM曾經將此技術成為跨查詢塊優化;DB2 9中被成為全局優化。一個好消息就是這項技術開始在DB2優化器的自我查詢重寫(QWR)階段中出現了。所有DB2查詢都能使用它也是指日可待了。同時,我們也需要將一些DB2終極方法掌握在自己的手裡。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved