程式師世界 >> 編程語言 >> C語言 >> C++ >> C++入門知識 >> 為什麼多線程讀寫 shared_ptr 要加鎖？

為什麼多線程讀寫 shared_ptr 要加鎖？

編輯：C++入門知識

shared_ptr 的數據結構 shared_ptr 是引用計數型（reference counting）智能指針，幾乎所有的實現都采用在堆（heap）上放個計數值（count）的辦法（除此之外理論上還有用循環鏈表的辦法，不過沒有實例）。具體來說，shared_ptr<Foo> 包含兩個成員，一個是指向 Foo 的指針 ptr，另一個是 ref_count 指針（其類型不一定是原始指針，有可能是 class 類型，但不影響這裡的討論），指向堆上的 ref_count 對象。ref_count 對象有多個成員，具體的數據結構如圖 1 所示，其中 deleter 和 allocator 是可選的。 sp0 圖 1：shared_ptr 的數據結構。為了簡化並突出重點，後文只畫出 use_count 的值： sp1 以上是 shared_ptr<Foo> x(new Foo); 對應的內存數據結構。如果再執行 shared_ptr<Foo> y = x; 那麼對應的數據結構如下。 sp2 但是 y=x 涉及兩個成員的復制，這兩步拷貝不會同時（原子）發生。中間步驟 1，復制 ptr 指針： sp3 中間步驟 2，復制 ref_count 指針，導致引用計數加 1： sp4 步驟1和步驟2的先後順序跟實現相關（因此步驟 2 裡沒有畫出 y.ptr 的指向），我見過的都是先1後2。既然 y=x 有兩個步驟，如果沒有 mutex 保護，那麼在多線程裡就有 race condition。多線程無保護讀寫 shared_ptr 可能出現的 race condition 考慮一個簡單的場景，有 3 個 shared_ptr<Foo> 對象 x、g、n： shared_ptr<Foo> g(new Foo); // 線程之間共享的 shared_ptr shared_ptr<Foo> x; // 線程 A 的局部變量 shared_ptr<Foo> n(new Foo); // 線程 B 的局部變量一開始，各安其事。 sp5 線程 A 執行 x = g; （即 read g），以下完成了步驟 1，還沒來及執行步驟 2。這時切換到了 B 線程。 sp6 同時編程 B 執行 g = n; （即 write g），兩個步驟一起完成了。先是步驟 1： sp7 再是步驟 2： sp8 這是 Foo1 對象已經銷毀，x.ptr 成了空懸指針！最後回到線程 A，完成步驟 2： sp9 多線程無保護地讀寫 g，造成了“x 是空懸指針”的後果。這正是多線程讀寫同一個 shared_ptr 必須加鎖的原因。當然，race condition 遠不止這一種，其他線程交織（interweaving）有可能會造成其他錯誤。思考，假如 shared_ptr 的 operator= 實現是先復制 ref_count（步驟 2）再復制 ptr（步驟 1），會有哪些 race condition？雜項 shared_ptr 作為 unordered_map 的 key 如果把 boost::shared_ptr 放到 unordered_set 中，或者用於 unordered_map 的 key，那麼要小心 hash table 退化為鏈表直到 Boost 1.47.0 發布之前，unordered_set<std::shared_ptr<T> > 雖然可以編譯通過，但是其 hash_value 是 shared_ptr 隱式轉換為 bool 的結果。也就是說，如果不自定義hash函數，那麼 unordered_{set/map} 會退化為鏈表。 Boost 1.51 在 boost/functional/hash/extensions.hpp 中增加了有關重載，現在只要包含這個頭文件就能安全高效地使用 unordered_set<std::shared_ptr> 了。這也是 muduo 的 examples/idleconnection 示例要自己定義 hash_value(const boost::shared_ptr<T>& x) 函數的原因（書第 7.10.2 節，p.255）。因為 Debian 6 Squeeze、Ubuntu 10.04 LTS 裡的 boost 版本都有這個 bug。為什麼圖 1 中的 ref_count 也有指向 Foo 的指針？ shared_ptr<Foo> sp(new Foo) 在構造 sp 的時候捕獲了 Foo 的析構行為。實際上 shared_ptr.ptr 和 ref_count.ptr 可以是不同的類型（只要它們之間存在隱式轉換），這是 shared_ptr 的一大功能。分 3 點來說： 1. 無需虛析構；假設 Bar 是 Foo 的基類，但是 Bar 和 Foo 都沒有虛析構。 shared_ptr<Foo> sp1(new Foo); // ref_count.ptr 的類型是 Foo* shared_ptr<Bar> sp2 = sp1; // 可以賦值，自動向上轉型（up-cast） sp1.reset(); // 這時 Foo 對象的引用計數降為 1 此後 sp2 仍然能安全地管理 Foo 對象的生命期，並安全完整地釋放 Foo，因為其 ref_count 記住了 Foo 的實際類型。www.2cto.com 2. shared_ptr<void> 可以指向並安全地管理（析構或防止析構）任何對象；muduo::net::Channel class 的 tie() 函數就使用了這一特性，防止對象過早析構，見書 7.15.3 節。 shared_ptr<Foo> sp1(new Foo); // ref_count.ptr 的類型是 Foo* shared_ptr<void> sp2 = sp1; // 可以賦值，Foo* 向 void* 自動轉型 sp1.reset(); // 這時 Foo 對象的引用計數降為 1 此後 sp2 仍然能安全地管理 Foo 對象的生命期，並安全完整地釋放 Foo，不會出現 delete void* 的情況，因為 delete 的是 ref_count.ptr，不是 sp2.ptr。 3. 多繼承。假設 Bar 是 Foo 的多個基類之一，那麼： shared_ptr<Foo> sp1(new Foo); shared_ptr<Bar> sp2 = sp1; // 這時 sp1.ptr 和 sp2.ptr 可能指向不同的地址，因為 Bar subobject 在 Foo object 中的 offset 可能不為0。 sp1.reset(); // 此時 Foo 對象的引用計數降為 1 但是 sp2 仍然能安全地管理 Foo 對象的生命期，並安全完整地釋放 Foo，因為 delete 的不是 Bar*，而是原來的 Foo*。換句話說，sp2.ptr 和 ref_count.ptr 可能具有不同的值（當然它們的類型也不同）。為什麼要盡量使用 make_shared()？為了節省一次內存分配，原來 shared_ptr<Foo> x(new Foo); 需要為 Foo 和 ref_count 各分配一次內存，現在用 make_shared() 的話，可以一次分配一塊足夠大的內存，供 Foo 和 ref_count 對象容身。數據結構是： sp10 不過 Foo 的構造函數參數要傳給 make_shared()，後者再傳給 Foo::Foo()，這只有在 C++11 裡通過 perfect forwarding 才能完美解決。