程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> .NET網頁編程 >> 關於.NET >> [你必須知道的.NET]第十三回:從Hello, world開始認識IL

[你必須知道的.NET]第十三回:從Hello, world開始認識IL

編輯:關於.NET

本文將介紹以下內容:

IL代碼分析方法

Hello, world歷史

.NET學習方法論

1.引言

1988年Brian W.Kernighan和Dennis M.Ritchie合著了軟件史上的經典巨著《The C programming Language》,我推薦所有的程序人都有機會重溫這本歷史上的經典之作。從那時起,Hello, world示例就作為了幾乎所有實踐型程序設計書籍的開篇代碼,一直延續至今,除了表達對巨人與歷史的尊重,本文也以Hello, world示例作為我們扣開IL語言的起點,開始我們循序漸進的IL認識之旅。

2.從Hello, world開始

首先,當然是展示我們的Hello, world代碼,開始一段有益的分享。

using System;
using System.Data;

public class HelloWorld
{
     public static void Main()
     {
         Console.WriteLine("Hello, world.");
     }
}

這段代碼執行了最簡單的過程,向陌生的世界打了一個招呼,那麼運行在高級語言背後真相又是什麼呢,下面開始我們基於上述示例的IL代碼分析。 

3.IL體驗中心

對編譯後的可執行文件HelloWorld.exe應用ILDasm.exe反編譯工具,還原HelloWorld的為文本MSIL編碼,至於其工作原理我們期望在系列的後續文章中做以交代,我們查看其截圖為:

由上圖可知,編譯後的IL結構中,包含了MANIFEST和HelloWorld類,其中MANIFEST是個附加信息列表,主要包含了程序集的一些屬性,例如程序集名稱、版本號、哈希算法、程序集模塊等,以及對外部引用程序集的引用項;而HelloWorld類則是我們下面介紹的主角。

3.1 MANIFEST清單分析

打開MANIFEST清單,我們可以看到

從這段IL代碼中,我們的分析如下:

.assembly指令用於定義編譯目標或者加載外部庫。在IL清單中可見,.assembly extern mscorlib表示外部加載了外部核心庫mscorlib,而.assembly HelloWorld則表示了定義的編譯目標。值得注意的是,.assembly將只顯示程序中實際應用到的程序集列表,而對於加入using引用的程序集,如果並未在程序中引用,則編譯器會忽略多加載的程序集,例如System.Data將被忽略,這樣就有效避免了過度加載引起的代碼膨脹。

我們知道mscorlib.dll程序集定義managed code依賴的核心數據類型,屬於必須加載項。 例如接下來要分析的.ctor指令表示構造函數,從代碼中我們知道沒有為HelloWord類提供任何顯示的構造函數,因此可以肯定其繼承自基類System.Object,而這個System.Object就包含在mscorlib程序集中。

在外部指令中還會指明了引用版本(.ver);應用程序實際公鑰標記(.publickeytoken),公鑰Token是SHA1哈希碼的低8位字節的反序(如下圖所示),用於唯一的確定程序集;還包括其他信息如語言文化等。

HelloWorld程序集中包括了.hash algorithm指令,表示實現安全性所使用的哈希算法,系統缺省為0x00008004,表明為SHA1算法;.ver則表示了HelloWorld程序集的版本號;

程序集由模塊組成, .module為程序集指令,表明定義的模塊的元數據,以指定當前模塊。

其他的指令還有:imagebase為影像基地址;.file alignment為文件對齊數值;.subsystem為連接系統類型,0x0003表示從控制台運行;.corflags為設置運行庫頭文件標志,默認為1;這些指令不是我們研究的重點,詳細的信息請參考MSDN相關信息。

3.2 HelloWorld類分析

首先是HelloWorld類,代碼為:

.class public auto ansi beforefieldinit HelloWorld
       extends [mscorlib]System.Object
{
} // end of class HelloWorld

.class表明了HelloWorld是一個public類,該類繼承自外部程序集mscorlib的System.Object類。

public為訪問控制權限,這點很容易理解。

auto表明程序加載時內存的布局是由CLR決定的,而不是程序本身

ansi屬性則為了在沒有被管理和被管理代碼間實現無縫轉換。沒有被管理的代碼,指的是沒有運行在CLR運行庫之上的代碼,例如原來的C,C++代碼等。

beforefieldinit屬性為HelloWorld提供了一個附加信息,用於標記運行庫可以在任何時候執行類型構造函數方法,只要該方法在第一次訪問其靜態字段之前執行即可。如果沒有beforefieldinit則運行庫必須在某個精確時間執行類型構造函數方法,從而影響性能優化,詳細的情況可以參與MSDN相關內容。

然後是.ctor方法,代碼為:

.method public hidebysig specialname rtspecialname
         instance void  .ctor() cil managed
{
   // 代碼大小       7 (0x7)
   .maxstack  8
   IL_0000:  ldarg.0
   IL_0001:  call       instance void [mscorlib]System.Object::.ctor()
   IL_0006:  ret
} // end of method HelloWorld::.ctor

cil managed 說明方法體中為IL代碼,指示編譯器編譯為托管代碼。

.maxstack表明執行構造函數.ctor期間的評估堆棧(Evaluation Stack)可容納數據項的最大個數。關於評估堆棧,其用於保存方法所需變量的值,並在方法執行結束時清空,或者存儲一個返回值。

IL_0000,是一個標記代碼行開頭,一般來說,IL_之前的部分為變量的聲明和初始化。

ldarg.0 表示裝載第一個成員參數,在實例方法中指的是當前實例的引用,該引用將用於在基類構造函數中調用。

call指令一般用於調用靜態方法,因為靜態方法是在編譯期指定的,而在此調用的是構造函數.ctor()也是在編譯期指定的;而另一個指令callvirt則表示調用實例方法,它的調用過程有異於call,函數的調用是在運行時確定的,首先會檢查被調用函數是否為虛函數,如果不是就直接調用,如果是則向下檢查子類是否有重寫,如果有就調用重寫實現,如果沒有還調用原來的函數,依次類推直到找到最新的重寫實現。

ret表示執行完畢,返回。

最後是Main方法,代碼為:

.method public hidebysig static void  Main() cil managed
{
   .entrypoint
   // 代碼大小       11 (0xb)
   .maxstack  8
   IL_0000:  ldstr      "Hello, world."
   IL_0005:  call       void [mscorlib]System.Console::WriteLine(string)
   IL_000a:  ret
} // end of method HelloWorld::Main

.entrypoint指令表明了CLR加載程序HelloWorld.exe時,是首先從.entrypoint方法開始執行的,也就是表明Main方法將作為程序的入口函數。每個托管程序必須有並且只有一個入口點。這區別於將Main函數作為程序入口標志。

ldstr指令表示將字符串壓棧,"Hello, world."字符串將被移到stack頂部。CLR通過從元數據表中獲得文字常量來構造string對象,值得注意的是,在此構造string對象並未出現在《第五回:深入淺出關鍵字---把new說透》中提到的newobj指令,對於這一點的解釋我們將在下一回中做簡要分析。

hidebysig屬性用於表示如果當前類作為父類時,類中的方法不會被子類繼承,因此HelloWorld子類中不會看到Main方法。

接下來的一點補充:

關於注釋,IL代碼中的注釋和C#等高級語言的注釋相同,其實編譯器在編譯IL代碼時已經將所有的注釋去掉,所以任何對程序的注釋在IL代碼中是看不見的。 

3.3 回歸簡潔

去粗取精,我們的IL代碼可以簡化,下面的代碼是基於上面的分析,並去處不重要的信息,以更簡潔的方式來展現的HelloWorld版IL代碼,詳細的分析就以注釋來展開吧。

4.結論

結束本文,我們從一個點的角度和IL來了一次接觸,除了了解幾個重要的指令含義,更重要的是已經走進了IL的世界。通過一站式的掃描HelloWorld的IL編碼,我們還不足以從全局來了解IL,不過第一次的親密接觸至少讓我們太陌生,而且隨著系列文章的深入我們將逐漸建立起這種認知,從而提高我們掌握了解.NET底層的有效工具。本系列也將在後續的文章中,逐漸建立起這種使用工具的方法,敬請關注。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved