程式師世界 >> 編程語言 >> C語言 >> C++ >> 關於C++ >> C++箴言：為類型信息使用特征類

C++箴言：為類型信息使用特征類

編輯：關於C++

STL 主要是由 containers（容器），iterators（迭代器）和 algorithms（算法）的 templates（模板）構成的，但是也有幾個 utility templates（實用模板）。其中一個被稱為 advance。advance 將一個指定的 iterator（迭代器）移動一個指定的距離：

template<typename IterT, typename DistT> // move iter d units
void advance(IterT& iter, DistT d); // forward; if d < 0,
// move iter backward

在概念上，advance 僅僅是在做 iter += d，但是 advance 不能這樣實現，因為只有 random access iterators（隨機訪問迭代器）支持 += operation。不夠強力的 iterator（迭代器）類型不得不通過反復利用 ++ 或 -- d 次來實現 advance。

你不記得 STL iterator categories（迭代器種類）了嗎？沒問題，我們這就做一個簡單回顧。對應於它們所支持的操作，共有五種 iterators（迭代器）。input iterators（輸入迭代器）只能向前移動，每次只能移動一步，只能讀它們指向的東西，而且只能讀一次。它們以一個輸入文件中的 read pointer（讀指針）為原型；C++ 庫中的 istream_iterators 就是這一種類的典型代表。output iterators（輸出迭代器）與此類似，只不過用於輸出：它們只能向前移動，每次只能移動一步，只能寫它們指向的東西，而且只能寫一次。它們以一個輸出文件中的 write pointer（寫指針）為原型；ostream_iterators 是這一種類的典型代表。這是兩個最不強力的 iterator categories（迭代器種類）。因為 input（輸入）和 output iterators（輸出迭代器）只能向前移動而且只能讀或者寫它們指向的地方最多一次，它們只適合 one-pass 運算。

一個更強力一些的 iterator category（迭代器種類）是 forward iterators（前向迭代器）。這種 iterators（迭代器）能做 input（輸入）和 output iterators（輸出迭代器）可以做到的每一件事情，再加上它們可以讀或者寫它們指向的東西一次以上。這就使得它們可用於 multi-pass 運算。STL 沒有提供 singly linked list（單向鏈表），但某些庫提供了（通常被稱為 slist），而這種 containers（容器）的 iterators（迭代器）就是 forward iterators（前向迭代器）。TR1 的 hashed containers（哈希容器）的 iterators（迭代器）也可以屬於 forward category（前向迭代器）。

bidirectional iterators（雙向迭代器）為 forward iterators（前向迭代器）加上了和向前一樣的向後移動的能力。STL 的 list 的 iterators（迭代器）屬於這一種類，set，multiset，map 和 multimap 的 iterators（迭代器）也一樣。

最強力的 iterator category（迭代器種類）是 random access iterators（隨機訪問迭代器）。這種 iterators（迭代器）為 bidirectional iterators（雙向迭代器）加上了 "iterator arithmetic"（“迭代器運算”）的能力，也就是說，在常量時間裡向前或者向後跳轉一個任意的距離。這樣的運算類似於指針運算，這並不會讓人感到驚訝，因為 random access iterators（隨機訪問迭代器）就是以 built-in pointers（內建指針）為原型的，而 built-in pointers（內建指針）可以和 random access iterators（隨機訪問迭代器）有同樣的行為。vector，deque 和 string 的 iterators（迭代器）是 random access iterators（隨機訪問迭代器）。

對於五種 iterator categories（迭代器種類）中的每一種，C++ 都有一個用於識別它的 "tag struct"（“標簽結構體”）在標准庫中：

struct input_iterator_tag {};
struct output_iterator_tag {};
struct forward_iterator_tag: public input_iterator_tag {};
struct bidirectional_iterator_tag: public forward_iterator_tag {};
struct random_access_iterator_tag: public bidirectional_iterator_tag {};

這些結構體之間的 inheritance relationships（繼承關系）是正當的 is-a 關系：所有的 forward iterators（前向迭代器）也是 input iterators（輸入迭代器），等等，這都是成立的。我們不久就會看到這個 inheritance（繼承）的功用。

但是返回到 advance。對於不同的 iterator（迭代器）能力，實現 advance 的一個方法是使用反復增加或減少 iterator（迭代器）的循環的 lowest-common-denominator（最小共通特性）策略。然而，這個方法要花費 linear time（線性時間）。random access iterators（隨機訪問迭代器）支持 constant-time iterator arithmetic（常量時間迭代器運算），當它出現的時候我們最好能利用這種能力。

我們真正想做的就是大致像這樣實現 advance：

template<typename IterT, typename DistT>
void advance(IterT& iter, DistT d)
{
　if (iter is a random access iterator) {
　　iter += d; // use iterator arithmetic
　} // for random access iters
　else {
　　if (d >= 0) { while (d--) ++iter; } // use iterative calls to
　　else { while (d++) --iter; } // ++ or -- for other
　} // iterator categories
}

這就需要能夠確定 iter 是否是一個 random access iterators（隨機訪問迭代器），依次下來，就需要知道它的類型，IterT，是否是一個 random access iterators（隨機訪問迭代器）類型。換句話說，我們需要得到關於一個類型的某些信息。這就是 traits 讓你做到的：它們允許你在編譯過程中得到關於一個類型的信息。 traits 不是 C++ 中的一個關鍵字或預定義結構；它們是一項技術和 C++ 程序員遵守的慣例。建立這項技術的要求之一是它在 built-in types（內建類型）上必須和在 user-defined types（用戶定義類型）上一樣有效。例如，如果 advance 被一個指針（譬如一個 const char*）和一個 int 調用，advance 必須有效，但是這就意味著 traits 技術必須適用於像指針這樣的 built-in types（內建類型）。

traits 對 built-in types（內建類型）必須有效的事實意味著將信息嵌入到類型內部是不可以的，因為沒有辦法將信息嵌入指針內部。那麼，一個類型的 traits 信息，必須在類型外部。標准的方法是將它放到 template（模板）以及這個 template（模板）的一個或更多的 specializations（特化）中。對於 iterators（迭代器），標准庫中 template（模板）被稱為 iterator_traits：

template<typename IterT> // template for information about
struct iterator_traits; // iterator types

就像你能看到的，iterator_traits 是一個 struct（結構體）。根據慣例，traits 總是被實現為 struct（結構體）。另一個慣例就是用來實現 traits 的 structs（結構體）以 traits classes（這可不是我捏造的）聞名。

iterator_traits 的工作方法是對於每一個 IterT 類型，在 struct（結構體）iterator_traits<IterT> 中聲明一個名為 iterator_category 的 typedef。這個 typedef 被看成是 IterT 的 iterator category（迭代器種類）。

iterator_traits 通過兩部分實現這一點。首先，它強制要求任何 user-defined iterator（用戶定義迭代器）類型必須包含一個名為 iterator_category 的嵌套 typedef 用以識別適合的 tag struct（標簽結構體）。例如，deque 的 iterators（迭代器）是隨機訪問的，所以一個 deque iterators 的 class 看起來就像這樣：

template < ... > // template params elided
class deque {
　public:
　　class iterator {
　　　public:
　　　　typedef random_access_iterator_tag iterator_category;
　　　　...
　　};
　...
};

然而，list 的 iterators（迭代器）是雙向的，所以它們是這樣做的：

template < ... >
class list {
　public:
　class iterator {
　　public:
　　typedef bidirectional_iterator_tag iterator_category;
　　...
　};
　...
};

iterator_traits 僅僅是簡單地模仿了 iterator class 的嵌套 typedef：

// the iterator_category for type IterT is whatever IterT says it is;
// see Item 42 for info on the use of "typedef typename"
template<typename IterT>
struct iterator_traits {
　typedef typename IterT::iterator_category iterator_category;
　...
};

這樣對於 user-defined types（用戶定義類型）能很好地運轉。但是對於本身是 pointers（指針）的 iterators（迭代器）根本不起作用，因為不存在類似於帶有一個嵌套 typedef 的指針的東西。iterator_traits 實現的第二個部分處理本身是 pointers（指針）的 iterators（迭代器）。

為了支持這樣的 iterators（迭代器），iterator_traits 為 pointer types（指針類型）提供了一個 partial template specialization（部分模板特化）。pointers 的行為類似 random access iterators（隨機訪問迭代器），所以這就是 iterator_traits 為它們指定的種類：

template<typename IterT> // partial template specialization
struct iterator_traits<IterT*> // for built-in pointer types
{
　typedef random_access_iterator_tag iterator_category;
　...
};

到此為止，你了解了如何設計和實現一個 traits class：

·識別你想讓它可用的關於類型的一些信息（例如，對於 iterators（迭代器）來說，就是它們的 iterator category（迭代器種類））。

·選擇一個名字標識這個信息（例如，iterator_category）。

·提供一個 template（模板）和一系列 specializations（特化）（例如，iterator_traits），它們包含你要支持的類型的信息。

給出了 iterator_traits ——實際上是 std::iterator_traits，因為它是 C++ 標准庫的一部分——我們就可以改善我們的 advance 偽代碼：

template<typename IterT, typename DistT>
void advance(IterT& iter, DistT d)
{
　if (typeid(typename std::iterator_traits<IterT>::iterator_category) ==
　　typeid(std::random_access_iterator_tag))
　...
}

這個雖然看起來有點希望，但它不是我們想要的。在某種狀態下，它會導致編譯問題，這個問題我們以後再來研究它，現在，有一個更基礎的問題要討論。IterT 的類型在編譯期間是已知的，所以 iterator_traits<IterT>::iterator_category 可以在編譯期間被確定。但是 if 語句還是要到運行時才能被求值。為什麼要到運行時才做我們在編譯期間就能做的事情呢？它浪費了時間（嚴格意義上的），而且使我們的執行碼膨脹。

我們真正想要的是一個針對在編譯期間被鑒別的類型的 conditional construct（條件結構）（也就是說，一個 if...else 語句）。碰巧的是，C++ 已經有了一個得到這種行為的方法。它被稱為 overloading（重載）。

當你重載某個函數 f 時，你為不同的 overloads（重載）指定不同的 parameter types（形參類型）。當你調用 f 時，編譯器會根據被傳遞的 arguments（實參）挑出最佳的 overload（重載）。基本上，編譯器會說：“如果這個 overload（重載）與被傳遞的東西是最佳匹配的話，就調用這個 f；如果另一個 overload（重載）是最佳匹配，就調用它；如果第三個 overload（重載）是最佳的，就調用它”等等。看到了嗎？一個針對類型的 compile-time conditional construct（編譯時條件結構）。為了讓 advance 擁有我們想要的行為方式，我們必須要做的全部就是創建一個包含 advance 的“內容”的重載函數的多個版本（此處原文有誤，根據作者網站勘誤修改——譯者注），聲明它們取得不同 iterator_category object 的類型。我為這些函數使用名字 doAdvance：

template<typename IterT, typename DistT> // use this impl for
void doAdvance(IterT& iter, DistT d, // random access
std::random_access_iterator_tag) // iterators
{
　iter += d;
}
template<typename IterT, typename DistT> // use this impl for
void doAdvance(IterT& iter, DistT d, // bidirectional
std::bidirectional_iterator_tag) // iterators
{
　if (d >= 0) { while (d--) ++iter; }
　else { while (d++) --iter; }
}
template<typename IterT, typename DistT> // use this impl for
void doAdvance(IterT& iter, DistT d, // input iterators
std::input_iterator_tag)
{
　if (d < 0 ) {
　　throw std::out_of_range("Negative distance"); // see below
　}
　while (d--) ++iter;
}

因為 forward_iterator_tag 從 input_iterator_tag 繼承而來，針對 input_iterator_tag 的 doAdvance 版本也將處理 forward iterators（前向迭代器）。這就是在不同的 iterator_tag structs 之間繼承的動機。（實際上，這是所有 public inheritance（公有繼承）的動機的一部分：使針對 base class types（基類類型）寫的代碼也能對 derived class types（派生類類型）起作用。）

advance 的規范對於 random access（隨機訪問）和 bidirectional iterators（雙向迭代器）允許正的和負的移動距離，但是如果你試圖移動一個 forward（前向）或 input iterator（輸入迭代器）一個負的距離，則行為是未定義的。在我檢查過的實現中簡單地假設 d 是非負的，因而如果一個負的距離被傳入，則進入一個直到計數降為零的非常長的循環。在上面的代碼中，我展示了改為一個異常被拋出。這兩種實現都是正確的。未定義行為的詛咒是：你無法預知會發生什麼。

給出針對 doAdvance 的各種重載，advance 需要做的全部就是調用它們，傳遞一個適當的 iterator category（迭代器種類）類型的額外 object 以便編譯器利用 overloading resolution（重載解析）來調用正確的實現：

template<typename IterT, typename DistT>
void advance(IterT& iter, DistT d)
{
　doAdvance( // call the version
　　iter, d, // of doAdvance
　　typename // that is
　　std::iterator_traits<IterT>::iterator_category() // appropriate for
　); // iter's iterator
} // category

我們現在能夠概述如何使用一個 traits class 了：

·創建一套重載的 "worker" functions（函數）或者 function templates（函數模板）（例如，doAdvance），它們在一個 traits parameter（形參）上不同。與傳遞的 traits 信息一致地實現每一個函數。

·創建一個 "master" function（函數）或者 function templates（函數模板）（例如，advance）調用這些 workers，傳遞通過一個 traits class 提供的信息。

traits 廣泛地用於標准庫中。有 iterator_traits，當然，再加上 iterator_category，提供了關於 iterators（迭代器）的四塊其它信息（其中最常用的是 value_type ）。還有 char_traits 持有關於 character types（字符類型）的信息，還有 numeric_limits 提供關於 numeric types（數值類型）的信息，例如，可表示值的最小值和最大值，等等。（名字 numeric_limits 令人有些奇怪，因為關於 traits classes 更常用的慣例是以 "traits" 結束，但是它就是被叫做 numeric_limits，所以 numeric_limits 就是我們用的名字。）

TR1引入了一大批新的 traits classes 提供關於類型的信息，包括 is_fundamental<T>（T 是否是一個 built-in type（內建類型）），is_array<T>（T 是否是一個 array type（數組類型）），以及 is_base_of<T1, T2>（T1 是否和 T2 相同或者是 T2 的一個 base class（基類））。合計起來，TR1 在標准 C++ 中加入了超過 50 個 traits classes。

Things to Remember

·traits classes 使關於類型的信息在編譯期間可用。它們使用 templates（模板）和 template specializations（模板特化）實現。

·結合 overloading（重載），traits classes 使得執行編譯期類型 if...else 檢驗成為可能。