程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> C語言 >> C++ >> C++入門知識 >> C++編譯過程與內存空間

C++編譯過程與內存空間

編輯:C++入門知識

C++編譯過程與內存空間




為什麼需要知道C/C++的內存布局和在哪可以可以找到想要的數據?知道內存布局對調試程序非常有幫助,可以知道程序執行時,到底做了什麼,有助於寫出干淨的代碼。本文的主要內容如下:

  • 源文件轉換為可執行文件
  • 可執行程序組成及內存布局
  • 數據存儲類別
  • 一個實例
  • 總結

    源文件轉換為可執行文件

    源文件經過以下幾步生成可執行文件:

    • 1、預處理(preprocessor):對#include、#define、#ifdef/#endif、#ifndef/#endif等進行處理
    • 2、編譯(compiler):將源碼編譯為匯編代碼
    • 3、匯編(assembler):將匯編代碼匯編為目標代碼
    • 4、鏈接(linker):將目標代碼鏈接為可執行文件

      編譯器和匯編器創建的目標文件包含:二進制代碼(指令)、源碼中的數據;鏈接器將多個目標文件鏈接成一個;裝載器吧目標文件加載到內存。

      \\  

      圖1 源文件到可執行文件的步驟

       

      可執行程序組成及內存布局

      通過上面的小節,我們知道將源程序轉換為可執行程序的步驟,典型的可執行文件分為兩部分:

      • 代碼段(Code),由機器指令組成,該部分是不可改的,編譯之後就不再改變,放置在文本段(.text)。
      • 數據段(Data),它由以下幾部分組:
        • 常量(constant),通常放置在只讀read-only的文本段(.text)
        • 靜態數據(static data),初始化的放置在數據段(.data);未初始化的放置在(.bss,Block Started by Symbol,BSS段的變量只有名稱和大小卻沒有值)
        • 動態數據(dynamic data),這些數據存儲在堆(heap)或棧(stack)

          源程序編譯後鏈接到一個以0地址為始地址的線性或多維虛擬地址空間。而且每個進程都擁有這樣一個空間,每個指令和數據都在這個虛擬地址空間擁有確定的地址,把這個地址稱為虛擬地址(Virtual Address)。將進程中的目標代碼、數據等的虛擬地址組成的虛擬空間稱為虛擬存儲器(Virtual Memory)。典型的虛擬存儲器中有類似的布局:

          • Text Segment (.text)
          • Initialized Data Segment (.data)
          • Uninitialized Data Segment (.bss)
          • The Stack
          • The Heap \\\

             

             

            圖2 進程內存布局

            當進程被創建時,內核為其提供一塊物理內存,將虛擬內存映射到物理內存,這些都是由操作系統來做的。

            數據存儲類別

            討論C/C++中的內存布局,不得不提的是數據的存儲類別!數據在內存中的位置取決於它的存儲類別。一個對象是內存的一個位置,解析這個對象依賴於兩個屬性:存儲類別、數據類型。

            • 存儲類別決定對象在內存中的生命周期。
            • 數據類型決定對象值的意義,在內存中占多大空間。

              C/C++中由(auto、 extern、 register、 static)存儲類別和對象聲明的上下文決定它的存儲類別。

              1、自動對象(automatic objects)

              auto和register將聲明的對象指定為自動存儲類別。他們的作用域是局部的,諸如一個函數內,一個代碼塊{***}內等。操作了作用域,對象會被銷毀。

              • 在一個代碼塊中聲明一個對象,如果沒有執行auto,那麼默認是自動存儲類別。
              • 聲明為register的對象是自動存儲類別,存儲在計算機的快速寄存器中。不可以對register對象做取值操作“&”。

                2、靜態對象(static objects)

                靜態對象可以局部的,也可以是全局的。靜態對象一直保持它的值,例如進入一個函數,函數中的靜態對象仍保持上次調用時的值。包含靜態對象的函數不是線程安全的、不可重入的,正是因為它具有“記憶”功能。

                • 局部對象聲明為靜態之後,將改變它在內存中保存的位置,由動態數據--->靜態數據,即從堆或棧變為數據段或bbs段。
                • 全局對象聲明為靜態之後,而不會改變它在內存中保存的位置,仍然是在數據段或bbs段。但是static將改變它的作用域,即該對象僅在本源文件有效。此相反的關鍵字是extern,使用extern修飾或者什麼都不帶的全局對象的作用域是整個程序。

                   

                  一個實例

                  下面我們分析一段代碼:

                   

                  1. #include
                  2. #include
                  3.  
                  4. inta;
                  5. staticintb;
                  6. voidfunc(void)
                  7. {
                  8. charc;
                  9. staticintd;
                  10. }
                  11. intmain(void)
                  12. {
                  13. inte;
                  14. int*pi=(int*)malloc(sizeof(int));
                  15. func();
                  16. func();
                  17. free(pi);
                  18. return(0);
                  19. }

                  程序中聲明的變量a、b、c、d、e、pi的存儲類別和生命期如下所述:

                  • a是一個未初始化的全局變量,作用域為整個程序,生命期是整個程序運行期間,在內存的bbs段
                  • b是一個未初始化的靜態全局變量,作用域為本源文件,生命期是整個程序運行期間,在內存的bbs段
                  • c是一個未初始化的局部變量,作用域為函數func體內,即僅在函數體內可見,生命期也是函數體內,在內存的棧中
                  • d是一個未初始化的靜態局部變量,作用域為函數func體內,即僅在函數體內可見,生命期是整個程序運行期間,在內存的bbs段
                  • e是一個未初始化的局部變量,作用域為函數main體內,即僅在函數體內可見,生命期是main函數內,在內存的棧中
                  • pi是一個局部指針,指向堆中的一塊內存塊,該塊的大小為sizeof(int),pi本身存儲在內存的棧中,生命期是main函數內
                  • 新申請的內存塊在堆中,生命期是malloc/free之間

                    用圖表示如下:\\

                     

                     

                    圖3 例子的內存布局

                     

                    總結

                    本文介紹了C/C++中由源程序到可執行文件的步驟,和可執行程序的內存布局,數據存儲類別,最後還通過一個例子來說明。可執行程序中的變量在內存中的布局可以總結為如下:

                    • 變量(函數外):如果未初始化,則存放在BSS段;否則存放在data段
                    • 變量(函數內):如果沒有指定static修飾符,則存放在棧中;否則同上
                    • 常量:存放在文本段.text
                    • 函數參數:存放在棧或寄存器中

                      內存可以分為以下幾段:

                      • 文本段:包含實際要執行的代碼(機器指令)和常量。它通常是共享的,多個實例之間共享文本段。文本段是不可修改的。
                      • 初始化數據段:包含程序已經初始化的全局變量,.data。
                      • 未初始化數據段:包含程序未初始化的全局變量,.bbs。該段中的變量在執行之前初始化為0或NULL。
                      • 棧:由系統管理,由高地址向低地址擴展。
                      • 堆:動態內存,由用戶管理。通過malloc/alloc/realloc、new/new[]申請空間,通過free、delete/delete[]釋放所申請的
                      • 空間。由低地址想高地址擴展
                      •  

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved