程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> C語言 >> C++ >> 關於C++ >> C++箴言:為類型信息使用特征類

C++箴言:為類型信息使用特征類

編輯:關於C++

STL 主要是由 containers(容器),iterators(迭代器)和 algorithms(算法)的 templates(模板)構成的,但是也有幾個 utility templates(實用模板)。其中一個被稱為 advance。advance 將一個指定的 iterator(迭代器)移動一個指定的距離:

template<typename IterT, typename DistT> // move iter d units
void advance(IterT& iter, DistT d); // forward; if d < 0,
// move iter backward

在概念上,advance 僅僅是在做 iter += d,但是 advance 不能這樣實現,因為只有 random access iterators(隨機訪問迭代器)支持 += operation。不夠強力的 iterator(迭代器)類型不得不通過反復利用 ++ 或 -- d 次來實現 advance。

你不記得 STL iterator categories(迭代器種類)了嗎?沒問題,我們這就做一個簡單回顧。對應於它們所支持的操作,共有五種 iterators(迭代器)。input iterators(輸入迭代器)只能向前移動,每次只能移動一步,只能讀它們指向的東西,而且只能讀一次。它們以一個輸入文件中的 read pointer(讀指針)為原型;C++ 庫中的 istream_iterators 就是這一種類的典型代表。output iterators(輸出迭代器)與此類似,只不過用於輸出:它們只能向前移動,每次只能移動一步,只能寫它們指向的東西,而且只能寫一次。它們以一個輸出文件中的 write pointer(寫指針)為原型;ostream_iterators 是這一種類的典型代表。這是兩個最不強力的 iterator categories(迭代器種類)。因為 input(輸入)和 output iterators(輸出迭代器)只能向前移動而且只能讀或者寫它們指向的地方最多一次,它們只適合 one-pass 運算。

一個更強力一些的 iterator category(迭代器種類)是 forward iterators(前向迭代器)。這種 iterators(迭代器)能做 input(輸入)和 output iterators(輸出迭代器)可以做到的每一件事情,再加上它們可以讀或者寫它們指向的東西一次以上。這就使得它們可用於 multi-pass 運算。STL 沒有提供 singly linked list(單向鏈表),但某些庫提供了(通常被稱為 slist),而這種 containers(容器)的 iterators(迭代器)就是 forward iterators(前向迭代器)。TR1 的 hashed containers(哈希容器)的 iterators(迭代器)也可以屬於 forward category(前向迭代器)。

bidirectional iterators(雙向迭代器)為 forward iterators(前向迭代器)加上了和向前一樣的向後移動的能力。STL 的 list 的 iterators(迭代器)屬於這一種類,set,multiset,map 和 multimap 的 iterators(迭代器)也一樣。

最強力的 iterator category(迭代器種類)是 random access iterators(隨機訪問迭代器)。這種 iterators(迭代器)為 bidirectional iterators(雙向迭代器)加上了 "iterator arithmetic"(“迭代器運算”)的能力,也就是說,在常量時間裡向前或者向後跳轉一個任意的距離。這樣的運算類似於指針運算,這並不會讓人感到驚訝,因為 random access iterators(隨機訪問迭代器)就是以 built-in pointers(內建指針)為原型的,而 built-in pointers(內建指針)可以和 random access iterators(隨機訪問迭代器)有同樣的行為。vector,deque 和 string 的 iterators(迭代器)是 random access iterators(隨機訪問迭代器)。

對於五種 iterator categories(迭代器種類)中的每一種,C++ 都有一個用於識別它的 "tag struct"(“標簽結構體”)在標准庫中:

struct input_iterator_tag {};
struct output_iterator_tag {};
struct forward_iterator_tag: public input_iterator_tag {};
struct bidirectional_iterator_tag: public forward_iterator_tag {};
struct random_access_iterator_tag: public bidirectional_iterator_tag {};

這些結構體之間的 inheritance relationships(繼承關系)是正當的 is-a 關系:所有的 forward iterators(前向迭代器)也是 input iterators(輸入迭代器),等等,這都是成立的。我們不久就會看到這個 inheritance(繼承)的功用。

但是返回到 advance。對於不同的 iterator(迭代器)能力,實現 advance 的一個方法是使用反復增加或減少 iterator(迭代器)的循環的 lowest-common-denominator(最小共通特性)策略。然而,這個方法要花費 linear time(線性時間)。random access iterators(隨機訪問迭代器)支持 constant-time iterator arithmetic(常量時間迭代器運算),當它出現的時候我們最好能利用這種能力。

我們真正想做的就是大致像這樣實現 advance:

template<typename IterT, typename DistT>
void advance(IterT& iter, DistT d)
{
 if (iter is a random access iterator) {
  iter += d; // use iterator arithmetic
 } // for random access iters
 else {
  if (d >= 0) { while (d--) ++iter; } // use iterative calls to
  else { while (d++) --iter; } // ++ or -- for other
 } // iterator categories
}

這就需要能夠確定 iter 是否是一個 random access iterators(隨機訪問迭代器),依次下來,就需要知道它的類型,IterT,是否是一個 random access iterators(隨機訪問迭代器)類型。換句話說,我們需要得到關於一個類型的某些信息。這就是 traits 讓你做到的:它們允許你在編譯過程中得到關於一個類型的信息。 traits 不是 C++ 中的一個關鍵字或預定義結構;它們是一項技術和 C++ 程序員遵守的慣例。建立這項技術的要求之一是它在 built-in types(內建類型)上必須和在 user-defined types(用戶定義類型)上一樣有效。例如,如果 advance 被一個指針(譬如一個 const char*)和一個 int 調用,advance 必須有效,但是這就意味著 traits 技術必須適用於像指針這樣的 built-in types(內建類型)。

traits 對 built-in types(內建類型)必須有效的事實意味著將信息嵌入到類型內部是不可以的,因為沒有辦法將信息嵌入指針內部。那麼,一個類型的 traits 信息,必須在類型外部。標准的方法是將它放到 template(模板)以及這個 template(模板)的一個或更多的 specializations(特化)中。對於 iterators(迭代器),標准庫中 template(模板)被稱為 iterator_traits:

template<typename IterT> // template for information about
struct iterator_traits; // iterator types

就像你能看到的,iterator_traits 是一個 struct(結構體)。根據慣例,traits 總是被實現為 struct(結構體)。另一個慣例就是用來實現 traits 的 structs(結構體)以 traits classes(這可不是我捏造的)聞名。

iterator_traits 的工作方法是對於每一個 IterT 類型,在 struct(結構體)iterator_traits<IterT> 中聲明一個名為 iterator_category 的 typedef。這個 typedef 被看成是 IterT 的 iterator category(迭代器種類)。

iterator_traits 通過兩部分實現這一點。首先,它強制要求任何 user-defined iterator(用戶定義迭代器)類型必須包含一個名為 iterator_category 的嵌套 typedef 用以識別適合的 tag struct(標簽結構體)。例如,deque 的 iterators(迭代器)是隨機訪問的,所以一個 deque iterators 的 class 看起來就像這樣:

template < ... > // template params elided
class deque {
 public:
  class iterator {
   public:
    typedef random_access_iterator_tag iterator_category;
    ...
  };
 ...
};

然而,list 的 iterators(迭代器)是雙向的,所以它們是這樣做的:

template < ... >
class list {
 public:
 class iterator {
  public:
  typedef bidirectional_iterator_tag iterator_category;
  ...
 };
 ...
};

iterator_traits 僅僅是簡單地模仿了 iterator class 的嵌套 typedef:

// the iterator_category for type IterT is whatever IterT says it is;
// see Item 42 for info on the use of "typedef typename"
template<typename IterT>
struct iterator_traits {
 typedef typename IterT::iterator_category iterator_category;
 ...
};

這樣對於 user-defined types(用戶定義類型)能很好地運轉。但是對於本身是 pointers(指針)的 iterators(迭代器)根本不起作用,因為不存在類似於帶有一個嵌套 typedef 的指針的東西。iterator_traits 實現的第二個部分處理本身是 pointers(指針)的 iterators(迭代器)。

為了支持這樣的 iterators(迭代器),iterator_traits 為 pointer types(指針類型)提供了一個 partial template specialization(部分模板特化)。pointers 的行為類似 random access iterators(隨機訪問迭代器),所以這就是 iterator_traits 為它們指定的種類:

template<typename IterT> // partial template specialization
struct iterator_traits<IterT*> // for built-in pointer types
{
 typedef random_access_iterator_tag iterator_category;
 ...
};

到此為止,你了解了如何設計和實現一個 traits class:

·識別你想讓它可用的關於類型的一些信息(例如,對於 iterators(迭代器)來說,就是它們的 iterator category(迭代器種類))。

·選擇一個名字標識這個信息(例如,iterator_category)。

·提供一個 template(模板)和一系列 specializations(特化)(例如,iterator_traits),它們包含你要支持的類型的信息。

給出了 iterator_traits ——實際上是 std::iterator_traits,因為它是 C++ 標准庫的一部分——我們就可以改善我們的 advance 偽代碼:

template<typename IterT, typename DistT>
void advance(IterT& iter, DistT d)
{
 if (typeid(typename std::iterator_traits<IterT>::iterator_category) ==
  typeid(std::random_access_iterator_tag))
 ...
}

這個雖然看起來有點希望,但它不是我們想要的。在某種狀態下,它會導致編譯問題,這個問題我們以後再來研究它,現在,有一個更基礎的問題要討論。IterT 的類型在編譯期間是已知的,所以 iterator_traits<IterT>::iterator_category 可以在編譯期間被確定。但是 if 語句還是要到運行時才能被求值。為什麼要到運行時才做我們在編譯期間就能做的事情呢?它浪費了時間(嚴格意義上的),而且使我們的執行碼膨脹。

我們真正想要的是一個針對在編譯期間被鑒別的類型的 conditional construct(條件結構)(也就是說,一個 if...else 語句)。碰巧的是,C++ 已經有了一個得到這種行為的方法。它被稱為 overloading(重載)。

當你重載某個函數 f 時,你為不同的 overloads(重載)指定不同的 parameter types(形參類型)。當你調用 f 時,編譯器會根據被傳遞的 arguments(實參)挑出最佳的 overload(重載)。基本上,編譯器會說:“如果這個 overload(重載)與被傳遞的東西是最佳匹配的話,就調用這個 f;如果另一個 overload(重載)是最佳匹配,就調用它;如果第三個 overload(重載)是最佳的,就調用它”等等。看到了嗎?一個針對類型的 compile-time conditional construct(編譯時條件結構)。為了讓 advance 擁有我們想要的行為方式,我們必須要做的全部就是創建一個包含 advance 的“內容”的重載函數的多個版本(此處原文有誤,根據作者網站勘誤修改——譯者注),聲明它們取得不同 iterator_category object 的類型。我為這些函數使用名字 doAdvance:

template<typename IterT, typename DistT> // use this impl for
void doAdvance(IterT& iter, DistT d, // random access
std::random_access_iterator_tag) // iterators
{
 iter += d;
}
template<typename IterT, typename DistT> // use this impl for
void doAdvance(IterT& iter, DistT d, // bidirectional
std::bidirectional_iterator_tag) // iterators
{
 if (d >= 0) { while (d--) ++iter; }
 else { while (d++) --iter; }
}
template<typename IterT, typename DistT> // use this impl for
void doAdvance(IterT& iter, DistT d, // input iterators
std::input_iterator_tag)
{
 if (d < 0 ) {
  throw std::out_of_range("Negative distance"); // see below
 }
 while (d--) ++iter;
}

因為 forward_iterator_tag 從 input_iterator_tag 繼承而來,針對 input_iterator_tag 的 doAdvance 版本也將處理 forward iterators(前向迭代器)。這就是在不同的 iterator_tag structs 之間繼承的動機。(實際上,這是所有 public inheritance(公有繼承)的動機的一部分:使針對 base class types(基類類型)寫的代碼也能對 derived class types(派生類類型)起作用。)

advance 的規范對於 random access(隨機訪問)和 bidirectional iterators(雙向迭代器)允許正的和負的移動距離,但是如果你試圖移動一個 forward(前向)或 input iterator(輸入迭代器)一個負的距離,則行為是未定義的。在我檢查過的實現中簡單地假設 d 是非負的,因而如果一個負的距離被傳入,則進入一個直到計數降為零的非常長的循環。在上面的代碼中,我展示了改為一個異常被拋出。這兩種實現都是正確的。未定義行為的詛咒是:你無法預知會發生什麼。

給出針對 doAdvance 的各種重載,advance 需要做的全部就是調用它們,傳遞一個適當的 iterator category(迭代器種類)類型的額外 object 以便編譯器利用 overloading resolution(重載解析)來調用正確的實現:

template<typename IterT, typename DistT>
void advance(IterT& iter, DistT d)
{
 doAdvance( // call the version
  iter, d, // of doAdvance
  typename // that is
  std::iterator_traits<IterT>::iterator_category() // appropriate for
 ); // iter's iterator
} // category

我們現在能夠概述如何使用一個 traits class 了:

·創建一套重載的 "worker" functions(函數)或者 function templates(函數模板)(例如,doAdvance),它們在一個 traits parameter(形參)上不同。與傳遞的 traits 信息一致地實現每一個函數。

·創建一個 "master" function(函數)或者 function templates(函數模板)(例如,advance)調用這些 workers,傳遞通過一個 traits class 提供的信息。

traits 廣泛地用於標准庫中。有 iterator_traits,當然,再加上 iterator_category,提供了關於 iterators(迭代器)的四塊其它信息(其中最常用的是 value_type )。還有 char_traits 持有關於 character types(字符類型)的信息,還有 numeric_limits 提供關於 numeric types(數值類型)的信息,例如,可表示值的最小值和最大值,等等。(名字 numeric_limits 令人有些奇怪,因為關於 traits classes 更常用的慣例是以 "traits" 結束,但是它就是被叫做 numeric_limits,所以 numeric_limits 就是我們用的名字。)

TR1引入了一大批新的 traits classes 提供關於類型的信息,包括 is_fundamental<T>(T 是否是一個 built-in type(內建類型)),is_array<T>(T 是否是一個 array type(數組類型)),以及 is_base_of<T1, T2>(T1 是否和 T2 相同或者是 T2 的一個 base class(基類))。合計起來,TR1 在標准 C++ 中加入了超過 50 個 traits classes。

Things to Remember

·traits classes 使關於類型的信息在編譯期間可用。它們使用 templates(模板)和 template specializations(模板特化)實現。

·結合 overloading(重載),traits classes 使得執行編譯期類型 if...else 檢驗成為可能。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved