程式師世界 >> 編程語言 >> C語言 >> 關於C語言 >> C語言中的字節對齊

C語言中的字節對齊

編輯：關於C語言

一、什麼是字節對齊
一個基本類型的變量在內存中占用n個字節,則該變量的起始地址必須能夠被n整除,即: 存放起始地址 % n = 0,那麼,就成該變量是字節對齊的;對於結構體、聯合體而言,這個n取其所有基本類型的成員中占用空間字節數最大的那個;
內存空間是以字節為基本單位進行劃分的,從理論上講,似乎對任何類型的變量的訪問都可以從任何地址處開始,但實際情況是在訪問特定類型變量的時候經常是從特定的內存地址處開始訪問,這就需要各種類型的數據只能按照一定的規則在空間上排列,而不是順序的一個接一個地排放;究其原因,是為了使不同架構的CPU可以提高訪問內存的速度,就規定了對於特定類型的數據只能從特定的內存位置處開始訪問;所以,各種類型的數據只能按照相應的規則在內存空間上排放,而不能順序地、連續地、一個一個地排放;這就是內存對齊;
二、為什麼需要字節對齊
由於各種硬件平台對存儲空間的處理上有很大的不同;一些平台對某些特定類型的數據只能從某個特定內存地址處開始訪問;比如:有些架構的CPU在訪問一個沒有進行對齊的變量的時候會發生錯誤,那麼在這種架構下編程時就必須保證字節對齊;其它平台可能沒有這種情況,但最常見的是,如果不按照適合其平台要求對數據進行對齊,會在存取效率上帶來損失;比如,有些平台每次讀取數據都是從偶地址處開始,如果一個int(假設為32位系統)型數據從偶地址處開始存放,那麼只需要一個讀指令周期就可以完全讀出這個32bit的int型數據,相反,如果這個32bit的int型數據是從奇地址處開始存放,那麼就需要兩個讀指令周期才能完全讀出這個32bit的int數據,並且還需要對這兩次讀出的結果的高低字節進行重新拼湊才能得到正確的32bit數據;這個時候,CPU的讀取效率明顯下降;
三、字節對齊規則
預處理指令#pragma pack(align_value)用於指定對齊值,而預處理指令#pragma pack()用於取消上次設定的對齊值,恢復默認對齊值;
字節對齊是針對基本類型變量的;基本類型變量有:char、unsigned char、short、unsigned short、int、unsigned int、long、unsigned long、long long、unsigned long long、float、double,等等;所以,對於結構體的對齊也只能按照其成員變量中的基本類型來對齊了;
有四個概念需要理解:
A、數據類型自身的對齊值:
   是指對該數據類型使用sizeof()操作符進行操作所得到的大小(單位,字節);比如,對於[unsigned] char類型的數據,其自身對齊值為1字節;對於[unsigned] short類型的數據,其自身對齊值是2字節;對於[unsigned] int、[unsigned] long、[unsigned] long long、float、double等數據類型,其自身對齊值是4字節;
B、結構體、聯合體、類的自身對齊值:
   是指其所有基本類型的成員中,自身對齊值最大的那個值;如果這些復合類型中有嵌套類型或復合類型的變量,則需要把這些嵌套的類型或復合類型的變量拆解成基本類型的成員之後再對齊;
C、指定對齊值:
   是指使用預處理指令#pragma pack(align_value)指定的對齊值align_value;
D、數據成員、結構體和類的有效對齊值:
   是指其自身對齊值和指定對齊值中較小的那個值;
其中,有效對齊值是最終用來決定數據存放地址方式的值,最重要;設定有效對齊值為N,就表示"對齊在N字節上",也就是說,該數據的"存放起始地址%N=0";

因此,每個類型的數據的有效對齊值就是其自身對齊值(通常是這個類型的大小)和指定對齊值(不指定則取默認值)中較小的那個值,並且結構體自身對齊值是其所有成員中自身對齊值最大的那個值;

字節對齊的細節與編譯器的實現有關,但一般來說,結構體需要滿足以下幾個准則:
1).從結構體外部來看,結構體變量的首地址能夠被其最寬基本成員的大小整除;從結構體內部來看,它的第一個數據成員的地址相對於整個結構體首地址的偏移量為0,也就是說,結構體的第一個數據成員存放在偏移量為0的地方;
2).結構體中的每個數據成員的有效對齊值都取其自身對齊值和指定對齊值中的較小的那個對齊值;或者說是,結構體中的每個數據成員相對於結構體首地址的偏移量都是該數據成員大小和指定對齊值中較小的那個值(或有效對齊值)的整數倍,如有需要,編譯器會在數據成員之間加上填充字節;
3).如果結構體中還有嵌套的結構體或結構體變量,那麼就要把這些嵌套進去的結構體或結構體變量拆成基本類型成員,並取其最長的基本類型成員的對齊方式;
4).結構體整體的有效對齊值必須為其最寬基本類型成員大小的整數倍;或者說是,結構體整體的大小為結構體中最寬基本類型成員大小的整數倍,如有需要,編譯器會在最末一個成員之後加上填充字節;換句話說是,結構體整體的有效對齊值按照結構體中最寬基本類型成員的大小和指定對齊值中較小的那個值進行;
注意:如果指定對齊值大於自身對齊值,則指定對齊值無效;

例1:不帶嵌套的
#pragma pack(4) //指定按照4字節對齊
struct TestA
{
int   a; //第一個成員,自身長4,#pragma pack(4),取較小值,按照4字節對齊,放在[0,3]偏移的位置;
char b; //第二個成員,自身長1,#pragma pack(4),取較小值,按照1字節對齊,放在[4]偏移的位置;
short c; //第三個成員,自身長1,#pragma pack(4),取較小值,按照2字節對齊,偏移量必須是2的整數倍,故,存放在[6,7]偏移的位置;
char d; //第四個成員,自身長1,#pragma pack(4),取較小值,按照1字節對齊,放在[8]偏移的位置;
};
#pragma pack() //取消4字節對齊,恢復默認對齊值;
因此,整個結構體占用的有效字節為9個字節;由於結構體整體的對齊值和大小是其最寬基本類型成員大小的整數倍,即:按照最寬基本類型成員大小和指定對齊值中較小的值對齊的;因為結構體最寬基本類型成員的大小是4字節,其有效對齊值也是4字節,而9字節按照4字節圓整的結果是12字節,所以,sizeof(TestA)=12;
#pragma pack(2) //指定按照2字節對齊
struct TestA
{
int   a; //第一個成員,自身長4,#pragma pack(4),取較小值,按照2字節對齊,放在[0,3]偏移的位置;
char b; //第二個成員,自身長1,#pragma pack(2),取較小值,按照1字節對齊,放在[4]偏移的位置;
short c; //第三個成員,自身長1,#pragma pack(2),取較小值,按照2字節對齊,偏移量必須是2的整數倍,故,存放在[6,7]偏移的位置;
char d; //第四個成員,自身長1,#pragma pack(2),取較小值,按照1字節對齊,放在[8]偏移的位置;
};
#pragma pack() //取消4字節對齊,恢復默認對齊值;
可以看出,只是改變了一下結構體之間的對齊方式,從4字節對齊改為2字節對齊;結果就不一樣了;
整個結構體所占用的有效字節數仍然是9字節,但是結構體整體的大小就變了,按照最寬基本類型成員大小和指定對齊值中較小的值對齊;結構體中最寬基本類型成員的大小事4字節,而指定對齊值是2字節對齊,取最小值2,所以,最後,整個結構體的大小就是9字節按照2字節圓整(取2的整數倍),於是,sizeof(TestA)=10;
例2:帶嵌套的
#pragma pack(2)
struct A
{
char c;   //第一個成員,自身長1,#pragma pack(2),取較小值,按照1字節對齊,放在[0]偏移的位置;
int i;   //第二個成員,自身長4,#pragma pack(2),取較小值,按照2字節對齊,放在[2,5]偏移的位置;
};
struct B
{
char c1; //第一個成員,自身長1,#pragma pack(2),取較小值,按照1字節對齊,放在[0]偏移的位置;
A    s;   //第二個成員,自身長6,#pragma pack(2),取較小值,按照2字節對齊,放在[2,7]偏移的位置;
char c2; //第三個成員,自身長1,#pragma pack(2),取較小值,按照1字節對齊,存放在[8]偏移的位置;
};
#pragma pack()
結構體A占用的有效字節數是6字節;結構體A整體的大小要取其最寬基本類型成員大小和指定對齊值中較小的那個值的整數倍,最寬基本類型成員大小為4字節,指定對齊值為2字節,所以,6取較小的值2字節的整數倍為6字節;最終,結構體A的大小為:sizeof(A)=6;
結構體B占用的有效字節數是9字節;結構體B整體的大小要取其最寬基本類型成員大小和指定對齊值中較小的那個值的整數倍,最寬基本類型成員大小為6字節,指定對齊值為2字節,所以,9取較小的值2字節的整數倍為10字節;最終,結構體B的大小為:sizeof(B)=10;
四、總結
設置對齊方式有兩種方法;
第一種方法:
#pragma pack(n),指定按照n字節對齊;
#pragma pack(),取消自定義的對齊值;
第二種方法:
__attribute__((aligned(n))):讓所作用的結構體成員對齊在n字節自然邊界上;如果結構體中有成員的長度大於n,則按照最大成員的長度來對齊;即:按照機器能允許該類的的最大長度來對齊;這個恰好與#pragma pack(n)指令的相反;
__attribute__((packed)):取消結構體在編譯過程中的優化對齊,按照實際占用字節數進行對齊,等價於指令#pragma pack(1),即,按照1字節對齊;
其中,n=1,2,4,8,16,......等;
第一種方法比較常見