程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> C語言 >> C++ >> C++入門知識 >> 優化C++代碼(2):C++代碼的編譯過程

優化C++代碼(2):C++代碼的編譯過程

編輯:C++入門知識

此處已是系列博文的第二篇,你最好從頭開始看吧。

這篇文章會講解 Visual C++ 編譯器的數據流——首先會以一段C++源程序開始,以對應的二進制程序結束。這篇文章很簡單——一切才剛剛開始。

首先我們來看看從命令行開始,編譯一個單一文件的程序 APP.cpp 時會發生什麼如果你想從Vistual Studio 來啟動編譯,下圖還必須包含一些高層軟件,然而,結束時,它們會給出一些很特別的命令,我後面會講到)。

假設我們剛才鍵入了: CL/02 App.cpp

CL代表‘編譯和鏈接’,02告訴編譯器優化速度—-生成一些執行速度盡可能快的機器碼。該命令啟動一個進程去運行CL.EXE程序—- 一個調用了其他軟件的驅動器:連接到一起時,他們會處理APP.cpp裡的文本,最終生產一個二進制文件,成為App.exe。 執行時,該二進制文件會執行我們源代碼裡的操作。

我們浏覽下上個圖表,看看發生了什麼。

CL.EXE 解析我們的命令行,並檢查它是否有意義。然後調用位於C1XX.DLL的 C++‘前端’“CXX”是指C++,因為以前‘+’不能用於文件名。)前端是用於理解C++語言的一條鏈。它掃描,解析並將APP.cpp文件轉換為 一顆等價樹,通過五個臨時文件傳遞給下一個組件。這五個文件被稱為CIL,意為C中間語言。不要把它跟托管語言,例如C#生產的中間代碼混淆。有時,也成 為MSIL,但是不幸的是,在ECMA-335標准裡,它被命名為CIL。

接下來,CL.EXE會調用 所謂的‘後端’,位於C2.DLL。我們把後端成為‘UTC’,意思為‘通用元組編譯器’,但是這個名字並沒有出現在Visual Studio所包含的的任何二進制文件裡。後端先將信息從前端轉換為元組—–一個二進制流的指令。顯示出來會看到它們看上去就像是一種高級匯編語言。感覺 上很高級:

因為我們要求編譯器優化速度,通過/02開關,優化部分後端,分析元組並將其轉化為另一種形式,使其運行得更快,但是語義上來講,卻是等價的,和原來的元組產生的同樣的結果。完成這步後,元組就會被傳給後端的CodeGen部分,最終會決定二進制碼的產生。

CodeGen模塊會在磁盤上生成APP.obj文件,最後,鏈接器會利用該文件,並分析所有的引用庫,生成最終的二進制文件App.exe。

在上面的圖表中,黑色箭頭顯示數據流文本或者二進制文件),紅色箭頭表示控制流。

在該系列的後面文章裡,當我們涉及到整個程序的優化,關於特定的/GL開關編譯器和/LTCG開關的鏈接器時,還會再回到這個圖表。 我們看到的是相同的框圖,但是卻以不同方式連接起來的。)

小結:

1. 前端需要理解C++源代碼,其他環節,像後端和鏈接器,大部分都是獨立於原始源語言的。他們工作在上面提到的元組上,形成一種更高層次的二進制匯編語言。原始的源程序可以是任何的命令式語言,像FORTRAN或者Pascal。後端真的不會在意。

2. 後端的優化部分會將元組轉換成運行更快的更有效的形式,這種轉換,我們稱之為優化。(其實我們應該稱之為’改進’,因為還有其他的改進,可以產生運行更快 的代碼——我們只是盡力接近理想狀態。 然而,幾十年前,有人創造了一個術語’優化’,我們都深陷其中。) 還有很多這樣的優化方法,像’常量合並’、’消除公共子表達式’、 ‘提升’、 ‘外提不變表達式’、‘冗余代碼消除’、’ 內聯函數’、 ‘自動向量化’等等.。大多數情況下。這些優化都是獨立於程序所運行的最終處理器—–他們都是獨立於機器的優化。

3. 後端的CodeGen部分決定如何制定運行時堆棧(用於實現’激活框架’);怎麼樣充分利用可用的機器寄存器;添加函數調用約定的細節;使用目標機器的詳細介紹來轉換代碼,讓它運行得更快。

(舉一個小例子,如果你看匯編代碼,例如,你在調試代碼的時候,同時使用Visual Studio(Alt+8)的反匯編窗口—- 你可能會注意到一些用於將EAX置為0的指令像 xor eax, eax ,優於一些更直接的指令 move eax,0. 為什麼呢?因為XOR 指令更小只有2個字節),執行速度更快。我們也稱它為“微優化”,也許你會懷疑是否值得這麼麻煩?還記得那句諺語嗎?積少才能成多。)

與優化相比,CodeGen就必須很清楚代碼將要運行的處理器架構。有些情況下,在理解目標處理器的基礎上,它甚至會改變機器指令的布局順序—–稱 之為‘調度’。我最好還是再解釋一下: CodeGen知道它是針對x86,x64還是ARM-32, 知道代碼將要運行的處理器的具體的微架構還是很罕見的,以 Nehalem和Sandy Bridge為例看看/favor:ATOM 這個案例,可以更多的詳情)

這篇文章重點講編譯器的優化部分,很少提及構成前端, CodeGen或者鏈接器的其他組件。

這篇文章介紹了大量的術語,我沒有打算讓你全部理解它們:畢竟這只是一篇概述,傳播一些思想,希望你會感興趣,確保讀完你下次還會再來,我會開始講解所有的術語。

下次,我們一起來看看最簡單的一種優化方法和它的工作原理——–合並常量。

譯文鏈接:http://blog.jobbole.com/47148/

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved