程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> .NET網頁編程 >> 關於.NET >> [你必須知道的.NET]第十四回:認識IL代碼---從開始到現在

[你必須知道的.NET]第十四回:認識IL代碼---從開始到現在

編輯:關於.NET

本文將介紹以下內容:

·IL代碼分析方法

·IL命令解析

·.NET學習方法論

1.引言

自從『你必須知道.NET』系列開篇以來,受到大家很多的關注和支持,給予了anytao巨大的鼓勵和動力。俱往昔,我發現很多的園友都把目光和焦點注意在如何理解IL代碼這個問題上。對我來說,這真是個莫大的好消息,因為很明顯我們的思路慢慢的從應用向底層發生著轉變,技巧性的東西是一個方面的積累,底層的探索在我認為也是必不可少的修煉。如果我們選擇了來關注這項修煉,那麼我們就應該選擇如何來著手這項修煉,首先關注anytao的『你必須知道的.NET』系列可以給你提供一個捷徑,少花一些功夫;其次對大師級的作品也應有更深入的了解,如《Applied Microsoft .NET Framework Programming》、《.NET本質論》;再次,就是像我一樣從博客園和MSDN的知識庫中不斷的成長。呵呵,除了給自己做了個廣告之外,我認為不管是何種途徑,了解和認識IL代碼,對於我們更深刻的理解.NET和.NET應用之上的本質絕對有不一樣的收獲,這也就是本文研究和分享的理由。

那麼,我們要了解IL代碼,就要知道了解IL的好處,時間對每個程序設計師來說都是寶貴的,你必須清楚自己投資的價值再決定投入的資本。對於.NET程序員來說,IL代碼意味著:

·通用的語言基礎是.NET運行的基礎,當我們對程序運行的結果有異議的時候,如何透過本質看表面,需要我們從本質入手來探索,這時IL是你必須知道的基礎;

·元數據和IL語言是CLR的基礎,了解必要的中間語言是深入認識CLR的捷徑;

·大量的事例分析是以IL來揭密的,因此了解IL是讀懂他人代碼的必備基礎,可以給自己更多收獲。

很明顯這些優越性足以誘惑我們花時間和精力涉獵其中。然而,了解了IL的好處,並不意味著我們應該過分的來關注IL,有人甚至可以洋洋灑灑的寫一堆IL代碼來實現一個簡單Hello world程序,但是正如我們知道的那樣,程序設計已經走過了幾十年的發展,如果純粹的陶醉在歷史中,除了腦子不好,沒有其他的解釋。不然看見任何代碼都以IL的角度來分析,又將走進另一個誤區,我們的宗旨是追求但不過分。

因此,有了上述了應該了解的理由和不應該過分的基線,在擺正心態的前提下,本文開始以作者認為的方式來展開對IL代碼的認識,作者期望通過本文的闡述與分析使得大家都能對IL有個概觀之解,並在平時的項目實踐中使用這種方法通過了解自己的代碼來了解.NET。我想,這種方法應該是值得提倡和發揮的最佳實踐,不知你信不信呢?呵呵。

2.使用工具

俗話說,工欲善其事,必先利其器。IL的器主要就是ILadsm.exe和reflector.exe,這兩個工具都是了解IL的基礎,其原理都是通過反射機制來查看IL代碼。

·ILadsm.exe

打開.NET Framework SKD 命令提示行,輸入ildasm回車即可打開,如圖所示:

上圖是我們熟悉的《第十三回:從Hello, world開始認識IL》中的示例,其中的樹形符號代表的意思,可以從MSDN的一張經典幫助示例來解釋,如下圖所示:

圖表來源:MSDN)

·

Reflector是Lutz Roeder開發的一個讓人興奮的反編譯利器,目前的版本是Version 5.0.35.0,可以支持.NET3.0,其功能也相當強大,在使用上也較ILDASM更加靈活,如圖所示:

可以方便的反編譯為IL、C#、VB、Delphi等多種語言,是深入了解IL的最佳利器。

在本文中我們以最簡單的ILadsm.exe為說明工具。

3.分析結構

分析IL結構,就參閱《第十三回:從Hello, world開始認識IL》 ,已經有了大致的介紹,在此不需要進行過多的筆墨,實際上IL的本身的結構也不是很復雜,了解了大致的體系即可。

4.解析常用命令

我們在了解了IL文件結構的基礎上,通過學習常用的IL命令,就可以基本上對IL達到了了解不過分的標准,因此對IL常用命令的分析就是本文的重點和要點。我們通過對常用命令的解釋、示例與分析,逐步了解你陌生的語言世界原來也很簡單。

IL指令集包括了基礎指令集和對象模型指令集大概有近200多個,對我們來說消化這麼多的陌生指令顯然不是明智的辦法,就行高級語言的關鍵字一樣,我們只取其一瓢獨飲,抓大放小的革命傳統同樣是有效的學習辦法,詳細的指令集解釋請下載[MSIL指令速查手冊]。

4.1 newobj和initobj

newobj和intiobj指令就像兩個兄弟,常常讓我們迷惑在其然而不知其所以然,雖然認識但是不怎麼清楚,這種感覺很郁悶,下面就讓我們看看他們的究竟:

代碼引入

指令說明

深入分析

從上面的代碼中,我們可以得出哪些值得推敲的結論呢?

MSDN給出的解釋是:newobj用於分配和初始化對象;而initobj用於初始化值類型。

那麼newobj又是如何分配內存,完成對象初始化;而initobj又如何完成對值類型的初始化呢?

顯然,關於newobj指令,在《第五回:深入淺出關鍵字---把new說透》中,已經有了一定的介紹,簡單說來關於newobj我們有如下結論:

·從托管堆分配指定類型所需要的全部內存空間。

·在調用執行構造函數初始化之前,首先初始化對象附加成員:一個是指向該類型方法表的指針;一個是SyncBlockIndex,用於進行線程同步。所有的對象都包含這兩個附加成員,用於管理對象。

·最後才是調用構造函數ctor,進行初始化操作。並返回新建對象的引用地址。

而initobj的作用又可以小結為:

·構造新的值類型,完成值類型初始化。值得關注的是,這種構造不需要調用值類型的構造函數。具體的執行過程呢?以上例來說,initobj MyStruct的執行結果是,將MyStruct中的引用類型初時化為null,而基元類型則置為0。

因此,值類型的初始化可以是:

//initobj方式初始化值類型

initobj    Anytao.net.My_Must_net.IL.MyStruct

同時,也可以直接顯示調用構造函數來完成初始化,具體為

MyStruct ms = new MyStruct(123);

對應於IL則是對構造函數cto的調用。

//調用構造函數方式初始化值類型

call       instance void Anytao.net.My_Must_net.IL.MyStruct::.ctor(int32)

·Initobj還用於完成設定對指定存儲單元的指針置空(null)。這一操作雖不常見,但是應該引起注意。

由此可見,newobj和initobj,都具有完成實例初始化的功能,但是針對的類型不同,執行的過程有異。其區別主要包括:

·newobj用於分配和初始化對象;而initobj用於初始化值類型。因此,可以說,newobj在堆中分配內存,並完成初始化;而initobj則是對棧上已經分配好的內存,進行初始化即可,因此值類型在編譯期已經在棧上分配好了內存。

·newobj在初始化過程中會調用構造函數;而initobj不會調用構造函數,而是直接對實例置空。

·newobj有內存分配的過程;而initobj則只完成數據初始化操作。

關於對象的創建,還有其他的情況值得注意,例如:

·Newarr指令用來創建一維從零起始的數組;而多維或非從零起始的一維數組,則仍由newobj指令創建。

·String類型的創建由ldstr指令來完成,具體的討論我們在下文來展開。

4.2 call、callvirt和calli

call、callvirt和calli指令用於完成方法調用,這些正是我們在IL中再熟悉不過的幾個朋友。那麼,同樣是作為方法調用,這幾位又有何區別呢?我們首先對其做以概括性的描述,再來通過代碼與實例,進入深入分析層面。

·call使用靜態調度,也就是根據引用類型的靜態類型來調度方法。

·callvirt使用虛擬調度,也就是根據引用類型的動態類型來調度方法;

·calli又稱間接調用,是通過函數指針來執行方法調用;對應的直接調用當然就是前面的:call和callvirt。

然而,雖然有以上的通用性結論,但是對於call和callvirt不可一概而論。call在某種情況下可以調用虛方法,而callvirt也可以調用非虛方法。具體的分析我們在以後的文章中來展開,暫不做過多分析。   

5.結論

本文從幾個重點的IL指令開始,力求通過對比性的分析和深入來逐步揭開IL的神秘與迷惑,正如我們在開始強調的那樣,本文只是個開始也許也是個階段,對IL的探求正如我自己的腳步一樣,也在繼續著,為的是在.NET的技術世界能夠有更多的領悟。作者期望通過不斷的努力逐漸和大家一起從IL世界探求.NET世界,在以後的討論中我們間或的繼續這個主題的不斷成長。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved