程式師世界 >> 編程語言 >> JAVA編程 >> 關於JAVA >> 診斷Java代碼: 輕松掌握Java泛型，第3部分

診斷Java代碼: 輕松掌握Java泛型，第3部分

編輯：關於JAVA

這一系列主要討論在 Java 編程中添加泛型類型，本文是其中的一篇，將研究還未討論過的有關使用泛型的兩個限制之一，即添加對裸類型參數的 new 操作的支持（如類 C<T> 中的 new T() ）。

正如我上個月所提到的那樣，Tiger 和 JSR-14 通過使用“類型消除（type erasure）”對 Java 語言實現泛型類型。使用類型消除（type erasure），泛型類型僅用於類型檢查；然後，用它們的上界替換它們。由此定義可知：消除將與如 new T() 之類的表達式沖突。

如果假定 T 的界限是 Object ，那麼這一表達式將被消除為 new Object() ，並且不管對 T 如何實例化（ String 、 List 、 URLClassLoader 等等）， new 操作將產生一個新的 Object 實例。顯然，這不是我們想要的。

要添加對表達式（如 new T() ）的支持，以及添加對我們上次討論過的其它與類型相關的操作（如數據類型轉換和 instanceof 表達式）的支持，我們必須采用某種實現策略而不是類型消除（如對於每個泛型實例化，使用獨立的類）。但對於 new 操作，需要處理其它問題。

尤其是，為了實現對 Java 語言添加這種支持，必須對許多基本的語言設計問題作出決定。

有效的構造函數調用

首先，為了對類型參數構造合法的 new 表達式（如 new T() ），必須確保我們調用的構造函數對於 T 的每個實例化都有效。但由於我們只知道 T 是其已聲明界限的子類型，所以我們不知道 T 的某一實例化將有什麼構造函數。要解決這一問題，可以用下述三種方法之一：

要求類型參數的所有實例化都包括不帶參數的（zeroary）構造函數。

只要泛型類的運行時實例化沒有包括所需的構造函數，就拋出異常。

修改語言的語法以包括更詳盡的類型參數界限。

第 1 種方法：需要不帶參數的構造函數

只要求類型參數的所有實例化都包括不帶參數的構造函數。該解決方案的優點是非常簡單。使用這種方法也有先例。

處理類似問題的現有 Java 技術（象 JavaBean 技術）就是通過要求一個不帶參數的構造函數來解決問題的。然而，該方法的一個主要缺點是：對於許多類，沒有合理的不帶參數的構造函數。

例如，表示非空容器的任何類在構造函數中必然使用表示其元素的參數。包括不帶參數的構造函數將迫使我們先創建實例，然後再進行本來可以在構造函數調用中完成的初始化。但該實踐會導致問題的產生（您可能想要閱讀 2002 年 4 月發表的本專欄文章“The Run-on Initializer bug pattern”，以獲取詳細信息；請參閱參考資料。）

第 2 種方法：當缺少所需構造函數時，拋出異常

處理該問題的另一種方法是：只要泛型類的運行時實例化沒有包括所需構造函數，就拋出異常。請注意：必須在運行時拋出異常。因為 Java 語言的遞增式編譯模型，所以我們無法靜態地確定所有將在運行時發生的泛型類的實例化。例如，假設我們有如下一組泛型類：

清單 1.“裸”類型參數的 New 操作

class C<T> { 　 T makeT() { 　　 return new T(); 　 } } class D<S> { 　 C<S> makeC() { 　　 return new C<S>(); 　 } }

現在，在類 D<S> 中，構造了類 C<S> 的實例。然後，在類 C 的主體中，將調用 S 的不帶參數的構造函數。這種不帶參數的構造函數存在嗎？答案當然取決於 S 的實例化！

比方說，如果 S 被實例化為 String ，那麼答案是“存在”。如果它被實例化為 Integer ，那麼答案是“不存在”。但是，當編譯類 D 和 C 時，我們不知道其它類會構造什麼樣的 D<S> 實例化。即使我們有可用於分析的整個程序（我們幾乎從來沒有這樣的 Java 程序），我們還是必須進行代價相當高的流分析來確定潛在的構造函數問題可能會出現在哪裡。

此外，這一技術所產生的錯誤種類對於程序員來說很難診斷和修復。例如，假設程序員只熟悉類 D 的頭。他知道 D 的類型參數的界限是缺省界限（ Object ）。如果得到那樣的信息，他沒有理由相信滿足聲明類型界限（如 D<Integer> ）的 D 的實例化將會導致錯誤。事實上，它在相當長的時間裡都不會引起錯誤，直到最後有人調用方法 makeC 以及（最終）對 C 的實例化調用方法 makeT 。然後，我們將得到一個報告的錯誤，但這將在實際問題發生很久以後 ― 類 D 的糟糕實例化。

還有，對所報告錯誤的堆棧跟蹤甚至可能不包括任何對這個糟糕的 D 實例的方法調用！現在，讓我們假設程序員無權訪問類 C 的源代碼。他對問題是什麼或如何修正代碼將毫無頭緒，除非他設法聯系類 C 的維護者並獲得線索。

第 3 種方法：修改語法以獲得更詳盡的界限

另一種可能性是修改語言語法以包括更詳盡的類型參數界限。這些界限可以指定一組可用的構造函數，它們必須出現在參數的每一個實例化中。因而，在泛型類定義內部，唯一可調用的構造函數是那些在界限中聲明的構造函數。

同樣，實例化泛型類的客戶機類必須使用滿足對構造函數存在所聲明的約束的類來這樣做。參數聲明將充當類與其客戶機之間的契約，這樣我們可以靜態地檢查這兩者是否遵守契約。

與另外兩種方法相比，該方法有許多優點，它允許我們保持第二種方法的可表達性以及與第一種方法中相同的靜態檢查程度。但它也有需要克服的問題。

首先，類型參數聲明很容易變得冗長。我們或許需要某種形式的語法上的甜頭，使這些擴充的參數聲明還過得去。另外，如果在 Tiger 以後的版本中添加擴充的參數聲明，那麼我們必須確保這些擴充的聲明將與現有的已編譯泛型類兼容。

如果將對泛型類型的與類型相關的操作的支持添加到 Java 編程中，那麼它采用何種形式還不清楚。但是，從哪種方法將使 Java 代碼盡可能地保持健壯（以及使在它遭到破壞時盡可能容易地修正）的觀點看，第三個選項無疑是最適合的。

然而， new 表達式有另一個更嚴重的問題。

多態遞歸

更嚴重的問題是類定義中可能存在多態遞歸。當泛型類在其自己的主體中實例化其本身時，發生多態遞歸。例如，考慮下面的錯誤示例：

清單 2. 自引用的泛型類

class C<T> { 　 public Object nest(int n) { 　　 if (n == 0) return this; 　　 else return new C<C<T>>().nest(n - 1); 　 } }

假設客戶機類創建新的 C<Object> 實例，並調用（比方說） nest(1000) 。然後，在執行方法 nest() 的過程中，將構造新的實例化 C<C<Object>> ，並且對它調用 nest(999) 。然後，將構造實例化 C<C<C<Object>>> ，以此類推，直到構造 1000 個獨立的類 C 的實例化。當然，我隨便選擇數字 1000；通常，我們無法知道在運行時哪些整數將被傳遞到方法 nest 。事實上，可以將它們作為用戶輸入傳入。

為什麼這成為問題呢？因為如果我們通過為每個實例化構造獨立類來支持泛型類型的與類型相關的操作，那麼，在程序運行以前，我們無法知道我們需要構造哪些類。但是，如果類裝入器為它所裝入的每個類查找現有類文件，那麼它會如何工作呢？

同樣，這裡有幾種可能的解決辦法：

對程序可以產生的泛型類的實例化數目設置上限。

靜態禁止多態遞歸。

在程序運行時隨需構造新的實例化類。

第 1 種：對實例化數設置上限

我們對程序可以產生的泛型類的實例化數目設置上限。然後，在編譯期間，我們可以對一組合法的實例化確定有限界限，並且僅為該界限中的所有實例化生成類文件。

該方法類似於在 C++ 標准模板庫中完成的事情（這使我們有理由擔心它不是一個好方法）。該方法的問題是，和為錯誤的構造函數調用報告錯誤一樣，程序員將無法預知其程序的某一次運行將崩潰。例如，假設實例化數的界限為 42，並且使用用戶提供的參數調用先前提到的 nest() 方法。那麼，只要用戶輸入小於 42 的數，一切都正常。當用戶輸入 43 時，這一計劃不周的設計就會失敗。現在，設想一下可憐的代碼維護者，他所面對的任務是重新組合代碼並試圖弄清楚幻數 42 有什麼特殊之處。

第 2 種：靜態禁止多態遞歸

為什麼我們不向編譯器發出類似“靜態禁止多態遞歸”這樣的命令呢？（唉！要是那麼簡單就好了。）當然，包括我在內的許多程序員都會反對這種策略，它抑制了許多重要設計模式的使用。

例如，在泛型類 List<T> 中，您真的想要防止 List<List<T>> 的構造嗎？從方法返回這種列表對於構建許多很常用的數據結構很有用。事實證明我們無法防止多態遞歸，即使我們想要那樣，也是如此。就象靜態檢測糟糕的泛型構造函數調用一樣，禁止多態遞歸會與遞增式類編譯發生沖突。我們先前的簡單示例（其中，多態遞歸作為一個簡單直接的自引用發生）會使這一事實變得模糊。但是，自引用對於在不同時間編譯的大多數類常常采用任意的間接級別。再提一次，那是因為一個泛型類可以用其自己的類型參數來實例化另一個泛型類。

下面的示例涉及兩個類之間的多態遞歸：

清單 3. 相互遞歸的多態遞歸

class C<T> { 　 public Object potentialNest(int n) { 　　 if (n == 0) return this; 　　 else return new D<T>().nest(n - 1); 　 } } class D<S> { 　 public Object nest(int n) { 　　 return new C<C<S>>().nest(n); 　 } }

在類 C 或 D 中顯然沒有多態遞歸，但象 new D<C<Object>>().nest(1000) 之類的表達式將引起類 C 的 1000 次實例化。

或許，我們可以將新屬性添加到類文件中，以表明類中所有不同泛型類型實例化，然後在編譯其它類時分析這些實例化，以進行遞歸。但是，我們還是必須向程序員提供奇怪的和不直觀的錯誤消息。

在上面的代碼中，我們在哪裡報告錯誤呢？在類 D 的編譯過程中還是在包含不相干表達式 new D<C<Object>>().nest(1000) 的客戶機類的編譯過程中呢？無論是哪一種，除非程序員有權訪問類 C 的源代碼，否則他無法預知何時會發生編譯錯誤。

第 3 種：實時構造新的實例化類

另一種方法是在程序運行時按需構造新的實例化類。起先，這種方法似乎與 Java 運行時完全不兼容。但實際上，實現該策略所需的全部就是使用一個修改的類裝入器，它根據“模板（template）”類文件構造新的實例化類。

JVM 規范已經允許程序員使用修改的類裝入器；事實上，許多流行的 Java 應用程序（如 Ant、JUnit 和 DrJava）都使用它們。該方法的缺點是：修改的類裝入器必須與其應用程序一起分布，以在較舊的 JVM 上運行。因為類裝入器往往比較小，所以這個開銷不會大。

讓我們研究一下該方法的工作示例。

NextGen 示例：修改的類裝入器

前一種方法 ― 用按需構造泛型類型實例化的修改的類裝入器解決多態遞歸問題 ― 被 Java 語言的 NextGen 擴展所采用。修改的類裝入器使用看上去幾乎與普通類文件完全一樣的模板文件，不同的是這個模板文件在常量池中有一些“洞”，在裝入時為每個實例化類填充這些“洞”。非泛型類不受影響。

在 Rice 大學 JavaPLT 編程語言實驗室，我們最近發布了 NextGen 編譯器的原型，它是 GJ 泛型 Java 編譯器的一種擴展，這種擴展支持類型參數的與類型相關的操作（數據類型轉換、 instanceof 測試和 new 表達式）。在該原型實現中，我們使用了一個修改的類裝入器來支持多態遞歸。

結束語

正如上述考慮事項所演示的那樣，將成熟的運行時支持添加到泛型 Java 要解決許多微妙的設計問題。如果這些問題處理得不當，那麼可表達性和健壯性的降低會輕易地抵消泛型類型的好處。但願 Java 編程會繼續朝著維持這些屬性的高度表達性和健壯性的方向發展。

下一次，我們將通過討論或許是功能最強大的應用泛型類型的方法 ― 將 mixin（具有參數父類型的類）添加到語言中 ― 來結束對泛型類型的討論。我們會將這種 mixin 的表現方式與先前討論的這種功能強大的語言特性相關聯，討論通過泛型類型添加 mixin 的優缺點。