struc,union,class的内存对齐方式
首先思考一個問題:int,short,char的struct,這幾個數應該怎么放,內存最小
strct ts
{
?int a;
?short b;
?char c;
};
這樣放最小,為8,這樣放置,只會在內存中的最后浪費一個字節
short ,int ,char 這樣順序也是為8
轉自:http://blog.21ic.com/user1/6199/archives/2009/65542.html
1、 sizeof應用在結構上的情況
請看下面的結構:
struct MyStruct
{
double dda1;
char dda;
int type
};
對結構MyStruct采用sizeof會出現什么結果呢?sizeof(MyStruct)為多少呢?也許你會這樣求:
sizeof(MyStruct)=sizeof(double) sizeof(char) sizeof(int)=13
但是當在VC中測試上面結構的大小時,你會發現sizeof(MyStruct)為16。你知道為什么在VC中會得出這樣一個結果嗎?
其 實,這是VC對變量存儲的一個特殊處理。為了提高CPU的存儲速度,VC對一些變量的起始地址做了”對齊”處理。在默認情況下,VC規定各成員變量存放的 起始地址相對于結構的起始地址的偏移量必須為該變量的類型所占用的字節數的倍數。然后,總長度必須是成員類型中的最大長度的倍數.下面列出常用類型的對齊方式(vc6.0,32位系統)。
上面闡述的不嚴密,每個特定平臺的編譯器都有一個默認的對齊系數,gcc中是4,VC中是8,
#pragma pack(n)來設定變量以n字節對齊方式。n字節對齊就是說變量存放的起始地址的偏移量有兩種情況:第一、如果n大于等于該變量所占用的字節數,那么偏 移量必須滿足是該變量的整數倍的對齊方式,第二、如果n小于該變量的類型所占用的字節數,那么偏移量為n的倍數,不用滿足默認的對齊方式。結構的總大小也有個約束條 件,分下面兩種情況:如果n大于所有成員變量類型所占用的字節數,那么結構的總大小必須為占用空間最大的變量占用的空間數的倍數;否則必須為n的倍數。
在gcc中(不過,還得看環境,我用的是64位的linux,結果也是24)
struct siz {
char v1;//長度1<4,按1對齊,0%1=0,起始相對位置=0;存放區間[0]
long long v2;//長度8>4,按4對齊,4%4=0,起始相對位置=4;存放區間[4,11]
short v3;//長度2<4,按2對齊,12%2=0,起始相對位置=12;存放區間[12,13]
int v4;//長度4=4,按4對齊,16%4=0,起始相對位置=16;存放區間[16,19]
};
整個結構體成員對齊后所占的區間為[0,19],占20個字節,接著結構體本身對齊,成員中最長的是8,n等于4,所以結構體本身按4對齊(即對齊系數)。20%4=0,所以占20個字節
在vc中,占24字節
類型
對齊方式(變量存放的起始地址相對于結構的起始地址的偏移量)
Char
偏移量必須為sizeof(char)即1的倍數
int
偏移量必須為sizeof(int)即4的倍數
float
偏移量必須為sizeof(float)即4的倍數
double
偏移量必須為sizeof(double)即8的倍數
Short
偏移量必須為sizeof(short)即2的倍數
各 成員變量在存放的時候根據在結構中出現的順序依次申請空間,同時按照上面的對齊方式調整位置,空缺的字節VC會自動填充。同時VC為了確保結構的大小為結 構的字節邊界數(即該結構中占用最大空間的類型所占用的字節數)的倍數,所以在為最后一個成員變量申請空間后,還會根據需要自動填充空缺的字節。
下面用前面的例子來說明VC到底怎么樣來存放結構的。
struct MyStruct
{
double dda1;
char dda;
int type
};
為 上面的結構分配空間的時候,VC根據成員變量出現的順序和對齊方式,先為第一個成員dda1分配空間,其起始地址跟結構的起始地址相同(剛好偏移量0剛好 為sizeof(double)的倍數),該成員變量占用sizeof(double)=8個字節;接下來為第二個成員dda分配空間,這時下一個可以分 配的地址對于結構的起始地址的偏移量為8,是sizeof(char)的倍數,所以把dda存放在偏移量為8的地方滿足對齊方式,該成員變量占用 sizeof(char)=1個字節;接下來為第三個成員type分配空間,這時下一個可以分配的地址對于結構的起始地址的偏移量為9,不是sizeof (int)=4的倍數,為了滿足對齊方式對偏移量的約束問題,VC自動填充3個字節(這三個字節沒有放什么東西),這時下一個可以分配的地址對于結構的起 始地址的偏移量為12,剛好是sizeof(int)=4的倍數,所以把type存放在偏移量為12的地方,該成員變量占用sizeof(int)=4個 字節;這時整個結構的成員變量已經都分配了空間,總的占用的空間大小為:8 1 3 4=16,剛好為結構的字節邊界數(即結構中占用最大空間的類型所占用的字節數sizeof(double)=8)的倍數,所以沒有空缺的字節需要填充。 所以整個結構的大小為:sizeof(MyStruct)=8 1 3 4=16,其中有3個字節是VC自動填充的,沒有放任何有意義的東西。
字串3
下面再舉個例子,交換一下上面的MyStruct的成員變量的位置,使它變成下面的情況:
struct MyStruct
{
char dda;
double dda1;
int type
};
這個結構占用的空間為多大呢?在VC6.0環境下,可以得到sizeof(MyStruc)為24。結合上面提到的分配空間的一些原則,分析下VC怎么樣為上面的結構分配空間的。(簡單說明)
struct MyStruct
{
char dda;//偏移量為0,滿足對齊方式,dda占用1個字節;
double dda1;//下一個可用的地址的偏移量為1,不是sizeof(double)=8
//的倍數,需要補足7個字節才能使偏移量變為8(滿足對齊
//方式),因此VC自動填充7個字節,dda1存放在偏移量為8
//的地址上,它占用8個字節。
int type;//下一個可用的地址的偏移量為16,是sizeof(int)=4的倍
//數,滿足int的對齊方式,所以不需要VC自動填充,type存
//放在偏移量為16的地址上,它占用4個字節。
};//所有成員變量都分配了空間,空間總的大小為1 7 8 4=20,不是結構
//的節邊界數(即結構中占用最大空間的類型所占用的字節數sizeof 字串2
//(double)=8)的倍數,所以需要填充4個字節,以滿足結構的大小為
//sizeof(double)=8的倍數。
所以該結構總的大小為:sizeof(MyStruc)為1 7 8 4 4=24。其中總的有7 4=11個字節是VC自動填充的,沒有放任何有意義的東西。
VC對結構的存儲的特殊處理確實提高CPU存儲變量的速度,但是有時候也帶來了一些麻煩,我們也屏蔽掉變量默認的對齊方式,自己可以設定變量的對齊方式。
VC 中提供了#pragma pack(n)來設定變量以n字節對齊方式。n字節對齊就是說變量存放的起始地址的偏移量有兩種情況:第一、如果n大于等于該變量所占用的字節數,那么偏 移量必須滿足默認的對齊方式,第二、如果n小于該變量的類型所占用的字節數,那么偏移量為n的倍數,不用滿足默認的對齊方式。結構的總大小也有個約束條 件,分下面兩種情況:如果n大于所有成員變量類型所占用的字節數,那么結構的總大小必須為占用空間最大的變量占用的空間數的倍數;
否則必須為n的倍數。下面舉例說明其用法。
#pragma pack(push) //保存對齊狀態
#pragma pack(4)//設定為4字節對齊
struct test
{
char m1;
double m4;
字串3
int m3;
};
#pragma pack(pop)//恢復對齊狀態
以 上結構的大小為16,下面分析其存儲情況,首先為m1分配空間,其偏移量為0,滿足我們自己設定的對齊方式(4字節對齊),m1占用1個字節。接著開始為 m4分配空間,這時其偏移量為1,需要補足3個字節,這樣使偏移量滿足為n=4的倍數(因為sizeof(double)大于n),m4占用8個字節。接 著為m3分配空間,這時其偏移量為12,滿足為4的倍數,m3占用4個字節。這時已經為所有成員變量分配了空間,共分配了16個字節,滿足為n的倍數。如 果把上面的#pragma pack(4)改為#pragma pack(16),那么我們可以得到結構的大小為24。
——————————————————————————————————————————————
缺省的對齊方式。
在結構中,編譯器為結構的每個成員按其自然對界(alignment)條件分配空間;各個成員按照它們被聲明的順序在內存中順序存儲,第一個成員的地址和整個結構的地址相同。在缺省情況下,C編譯器為每一個變量或是數據單元按其自然對界條件分配空間。
例如,下面的結構各成員空間分配情況。
struct test {
char x1;
short x2;
float x3;
char x4;
};
結構的第一個成員x1,其偏移地址為0,占據了第1個字節。第二個成員x2為short類型,其起始地址必須2字節對界,因此,編譯器在x2和x1之間填充了一個空字節。結構的第三個成員x3和第四個成員x4恰好落在其自然對界地址上,在它們前面不需要額外的填充字節。在test結構中,成員x3要求4字節對界,是該結構所有成員中要求的最大對界單元,因而test結構的自然對界條件為4字節,編譯器在成員x4后面填充了3個空字節。整個結構所占據空間為12字節。
字節對齊的細節和編譯器實現相關,但一般而言,滿足三個準則:
1) 結構體變量的首地址能夠被其最寬基本類型成員的大小所整除;
2) 結構體每個成員相對于結構體首地址的偏移量(offset)都是成員大小的整數倍,如有需要編譯器會在成員之間加上填充字節(internal adding);
3) 結構體的總大小為結構體最寬基本類型成員大小的整數倍,如有需要編譯器會在最末一個成員之后加上填充字節(trailing padding)。
注意的是:
基本類型是指前面提到的像char、short、int、float、double這樣的內置數據類型,這里所說的”數據寬度”就是指其sizeof的大小。由于結構體的成員可以是復合類型,比如另外一個結構體,所以在尋找最寬基本類型成員時,應當包括復合類型成員的子成員,而不是把復合成員看成是一個整體。但在確定復合類型成員的偏移位置時則是將復合類型作為整體看待。
更改C編譯器的缺省分配策略
一般地,可以通過下面的方法改變缺省的對界條件:
? 使用偽指令#pragma pack ([n])
#pragma pack ([n])偽指令允許你選擇編譯器為數據分配空間所采取的對界策略。
例如,在使用了#pragma pack (1)偽指令后,test結構各成員的空間分配情況就是按照一個字節對齊了,格式如下:
#pragma pack(push) //保存對齊狀態
#pragma pack(1)
//定義你的結構
//…………
#pragma pack(pop)
class的方法與struct一樣
但是還有更復雜的情況:http://hi.baidu.com/phps/blog/item/f03eb93ee12f49fa838b1365.html
當在C中定義了一個結構類型時,它的大小是否等于各字段(field)大小之和?編譯器將如何在內存中放置這些字段?ANSI?C對結構體的內存布局有什么要求?而我們的程序又能否依賴這種布局?這些問題或許對不少朋友來說還有點模糊,那么本文就試著探究它們背后的秘密。
????首先,至少有一點可以肯定,那就是ANSI?C保證結構體中各字段在內存中出現的位置是隨它們的聲明順序依次遞增的,并且第一個字段的首地址等于整個結構體實例的首地址。比如有這樣一個結構體:
??
??struct?vector{int?x,y,z;}?s;
??int?*p,*q,*r;
??struct?vector?*ps;
??
??p?=?&s.x;
??q?=?&s.y;
??r?=?&s.z;
??ps?=?&s;
??assert(p?<?q);
??assert(p?<?r);
??assert(q?<?r);
??assert((int*)ps?==?p);
??//?上述斷言一定不會失敗
????這時,有朋友可能會問:"標準是否規定相鄰字段在內存中也相鄰?"。?唔,對不起,ANSI?C沒有做出保證,你的程序在任何時候都不應該依賴這個假設。那這是否意味著我們永遠無法勾勒出一幅更清晰更精確的結構體內存布局圖?哦,當然不是。不過先讓我們從這個問題中暫時抽身,關注一下另一個重要問題————內存對齊。
????許多實際的計算機系統對基本類型數據在內存中存放的位置有限制,它們會要求這些數據的首地址的值是某個數k(通常它為4或8)的倍數,這就是所謂的內存對齊,而這個k則被稱為該數據類型的對齊模數(alignment?modulus)。當一種類型S的對齊模數與另一種類型T的對齊模數的比值是大于1的整數,我們就稱類型S的對齊要求比T強(嚴格),而稱T比S弱(寬松)。這種強制的要求一來簡化了處理器與內存之間傳輸系統的設計,二來可以提升讀取數據的速度。比如這么一種處理器,它每次讀寫內存的時候都從某個8倍數的地址開始,一次讀出或寫入8個字節的數據,假如軟件能保證double類型的數據都從8倍數地址開始,那么讀或寫一個double類型數據就只需要一次內存操作。否則,我們就可能需要兩次內存操作才能完成這個動作,因為數據或許恰好橫跨在兩個符合對齊要求的8字節內存塊上。某些處理器在數據不滿足對齊要求的情況下可能會出錯,但是Intel的IA32架構的處理器則不管數據是否對齊都能正確工作。不過Intel奉勸大家,如果想提升性能,那么所有的程序數據都應該盡可能地對齊。Win32平臺下的微軟C編譯器(cl.exe?for?80x86)在默認情況下采用如下的對齊規則:?任何基本數據類型T的對齊模數就是T的大小,即sizeof(T)。比如對于double類型(8字節),就要求該類型數據的地址總是8的倍數,而char類型數據(1字節)則可以從任何一個地址開始。Linux下的GCC奉行的是另外一套規則(在資料中查得,并未驗證,如錯誤請指正):任何2字節大小(包括單字節嗎?)的數據類型(比如short)的對齊模數是2,而其它所有超過2字節的數據類型(比如long,double)都以4為對齊模數。
????現在回到我們關心的struct上來。ANSI?C規定一種結構類型的大小是它所有字段的大小以及字段之間或字段尾部的填充區大小之和。嗯?填充區?對,這就是為了使結構體字段滿足內存對齊要求而額外分配給結構體的空間。那么結構體本身有什么對齊要求嗎?有的,ANSI?C標準規定結構體類型的對齊要求不能比它所有字段中要求最嚴格的那個寬松,可以更嚴格(但此非強制要求,VC7.1就僅僅是讓它們一樣嚴格)。我們來看一個例子(以下所有試驗的環境是Intel?Celeron?2.4G?+?WIN2000?PRO?+?vc7.1,內存對齊編譯選項是"默認",即不指定/Zp與/pack選項):
??typedef?struct?ms1
??{
?????char?a;
?????int?b;
??}?MS1;
????假設MS1按如下方式內存布局(本文所有示意圖中的內存地址從左至右遞增):
???????_____________________________
???????|???????|???????????????????|
???????|???a???|????????b??????????|
???????|???????|???????????????????|
???????+---------------------------+
?Bytes:????1?????????????4
????因為MS1中有最強對齊要求的是b字段(int),所以根據編譯器的對齊規則以及ANSI?C標準,MS1對象的首地址一定是4(int類型的對齊模數)的倍數。那么上述內存布局中的b字段能滿足int類型的對齊要求嗎?嗯,當然不能。如果你是編譯器,你會如何巧妙安排來滿足CPU的癖好呢?呵呵,經過1毫秒的艱苦思考,你一定得出了如下的方案:
???????_______________________________________
???????|???????|\\\\\\\\\\\|?????????????????|
???????|???a???|\\padding\\|???????b?????????|
???????|???????|\\\\\\\\\\\|?????????????????|
???????+-------------------------------------+
?Bytes:????1?????????3?????????????4
????這個方案在a與b之間多分配了3個填充(padding)字節,這樣當整個struct對象首地址滿足4字節的對齊要求時,b字段也一定能滿足int型的4字節對齊規定。那么sizeof(MS1)顯然就應該是8,而b字段相對于結構體首地址的偏移就是4。非常好理解,對嗎?現在我們把MS1中的字段交換一下順序:
??typedef?struct?ms2
??{
?????int?a;
?????char?b;
??}?MS2;
????或許你認為MS2比MS1的情況要簡單,它的布局應該就是
???????_______________________
???????|?????????????|???????|
???????|?????a???????|???b???|
???????|?????????????|???????|
???????+---------------------+
?Bytes:??????4???????????1?
????因為MS2對象同樣要滿足4字節對齊規定,而此時a的地址與結構體的首地址相等,所以它一定也是4字節對齊。嗯,分析得有道理,可是卻不全面。讓我們來考慮一下定義一個MS2類型的數組會出現什么問題。C標準保證,任何類型(包括自定義結構類型)的數組所占空間的大小一定等于一個單獨的該類型數據的大小乘以數組元素的個數。換句話說,數組各元素之間不會有空隙。按照上面的方案,一個MS2數組array的布局就是:
|<-????array[1]?????->|<-????array[2]?????->|<-?array[3]?.....
__________________________________________________________
|?????????????|???????|??????????????|??????|
|?????a???????|???b???|??????a???????|???b??|.............
|?????????????|???????|??????????????|??????|
+----------------------------------------------------------
Bytes:??4?????????1??????????4???????????1
?
???????___________________________________
???????|?????????????|???????|\\\\\\\\\\\|
???????|?????a???????|???b???|\\padding\\|
???????|?????????????|???????|\\\\\\\\\\\|
???????+---------------------------------+
?Bytes:??????4???????????1?????????3
????現在無論是定義一個單獨的MS2變量還是MS2數組,均能保證所有元素的所有字段都滿足對齊規定。那么sizeof(MS2)仍然是8,而a的偏移為0,b的偏移是4。
????好的,現在你已經掌握了結構體內存布局的基本準則,嘗試分析一個稍微復雜點的類型吧。
??typedef?struct?ms3
??{
?????char?a;
?????short?b;
?????double?c;
??}?MS3;
????我想你一定能得出如下正確的布局圖:
?????????
????????padding??
???????????|
??????_____v_________________________________
??????|???|\|?????|\\\\\\\\\|???????????????|
??????|?a?|\|??b??|\padding\|???????c???????|
??????|???|\|?????|\\\\\\\\\|???????????????|
??????+-------------------------------------+
Bytes:??1??1???2???????4????????????8
???????????
????sizeof(short)等于2,b字段應從偶數地址開始,所以a的后面填充一個字節,而sizeof(double)等于8,c字段要從8倍數地址開始,前面的a、b字段加上填充字節已經有4?bytes,所以b后面再填充4個字節就可以保證c字段的對齊要求了。sizeof(MS3)等于16,b的偏移是2,c的偏移是8。接著看看結構體中字段還是結構類型的情況:
??typedef?struct?ms4
??{
?????char?a;
?????MS3?b;
??}?MS4;
????MS3中內存要求最嚴格的字段是c,那么MS3類型數據的對齊模數就與double的一致(為8),a字段后面應填充7個字節,因此MS4的布局應該是:
???????_______________________________________
???????|???????|\\\\\\\\\\\|?????????????????|
???????|???a???|\\padding\\|???????b?????????|
???????|???????|\\\\\\\\\\\|?????????????????|
???????+-------------------------------------+
?Bytes:????1?????????7?????????????16
????顯然,sizeof(MS4)等于24,b的偏移等于8。
關于union:http://bliuqing.iteye.com/blog/387047
union u {double a;int b; }; union u2 {char a[13];int b; }; union u3 {char a[13];char b; }; cout<<sizeof(u)<<endl; // 8 cout<<sizeof(u2)<<endl; // 16 cout<<sizeof(u3)<<endl; // 13都知道union的大小取決于它所有的成員中,占用空間最大的一個成員的大小。所以對于u來說,大小就是最大的double類型成員a了,所以sizeof(u)=sizeof(double)=8。但是對于u2和u3,最大的空間都是char[13]類型的數組,為什么u3的大小是13,而u2是16呢?關鍵在于u2中的成員int b。由于int類型成員的存在,使u2的對齊方式變成4,也就是說,u2的大小必須在4的對界上,所以占用的空間變成了16(最接近13的對界)。?
結論:復合數據類型,如union,struct,class的對齊方式為成員中對齊方式最大的成員的對齊方式。?
順便提一下CPU對界問題,32的C++采用8位對界來提高運行速度,所以編譯器會盡量把數據放在它的對界上以提高內存命中率。對界是可以更改的,使用#pragma pack(x)宏可以改變編譯器的對界方式,默認是8。C++固有類型的對界取編譯器對界方式與自身大小中較小的一個。例如,指定編譯器按2對界,int類型的大小是4,則int的對界為2和4中較小的2。在默認的對界方式下,因為幾乎所有的數據類型都不大于默認的對界方式8(除了long double),所以所有的固有類型的對界方式可以認為就是類型自身的大小。更改一下上面的程序:
#pragma pack(2) union u2 {char a[13];int b; }; union u3 {char a[13];char b; }; #pragma pack(8) cout<<sizeof(u2)<<endl; // 14 cout<<sizeof(u3)<<endl; // 13
由于手動更改對界方式為2,所以int的對界也變成了2,u2的對界取成員中最大的對界,也是2了,所以此時sizeof(u2)=14。?
結論:C++固有類型的對界取編譯器對界方式與自身大小中較小的一個。?
9、struct的sizeof問題?
因為對齊問題使結構體的sizeof變得比較復雜,看下面的例子:(默認對齊方式下)?
struct s1 {char a;double b;int c;char d; }; struct s2 {char a;char b;int c;double d; }; cout<<sizeof(s1)<<endl; // 24 cout<<sizeof(s2)<<endl; // 16
同樣是兩個char類型,一個int類型,一個double類型,但是因為對界問題,導致他們的大小不同。計算結構體大小可以采用元素擺放法,我舉例子說明一下:首先,CPU判斷結構體的對界,根據上一節的結論,s1和s2的對界都取最大的元素類型,也就是double類型的對界8。然后開始擺放每個元素。?
對于s1,首先把a放到8的對界,假定是0,此時下一個空閑的地址是1,但是下一個元素d是double類型,要放到8的對界上,離1最接近的地址是8了,所以d被放在了8,此時下一個空閑地址變成了16,下一個元素c的對界是4,16可以滿足,所以c放在了16,此時下一個空閑地址變成了20,下一個元素d需要對界1,也正好落在對界上,所以d放在了20,結構體在地址21處結束。由于s1的大小需要是8的倍數,所以21-23的空間被保留,s1的大小變成了24。?
對于s2,首先把a放到8的對界,假定是0,此時下一個空閑地址是1,下一個元素的對界也是1,所以b擺放在1,下一個空閑地址變成了2;下一個元素c的對界是4,所以取離2最近的地址4擺放c,下一個空閑地址變成了8,下一個元素d的對界是8,所以d擺放在8,所有元素擺放完畢,結構體在15處結束,占用總空間為16,正好是8的倍數。?
這里有個陷阱,對于結構體中的結構體成員,不要認為它的對齊方式就是他的大小,看下面的例子:?
struct s1 {char a[8]; }; struct s2 {double d; }; struct s3 {s1 s;char a; }; struct s4 {s2 s;char a; }; cout<<sizeof(s1)<<endl; // 8 cout<<sizeof(s2)<<endl; // 8 cout<<sizeof(s3)<<endl; // 9 cout<<sizeof(s4)<<endl; // 16;
s1和s2大小雖然都是8,但是s1的對齊方式是1,s2是8(double),所以在s3和s4中才有這樣的差異。?
所以,在自己定義結構體的時候,如果空間緊張的話,最好考慮對齊因素來排列結構體里的元素。
struct {int n;char s[10];union {int a[5];char b;double c; } u_a; } b; /* printf("%d\n", sizeof(b.n));//4printf("%d\n", sizeof(b.s));//10printf("%d\n", sizeof(b.u_a));//24printf("%d\n", sizeof(b));//40*/
總結
以上是生活随笔為你收集整理的struc,union,class的内存对齐方式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Keep-Alive模式
- 下一篇: 线程与进程的异同