[转载] java对象在内存中的结构
參考鏈接: 了解Java中的類和對象
今天看到一個不錯的PPT:Build Memory-efficient Java Applications,開篇便提出了一個問題,在Hotspot JVM中,32位機器下,Integer對象的大小是int的幾倍??
我們都知道在Java語言規(guī)范已經(jīng)規(guī)定了int的大小是4個字節(jié),那么Integer對象的大小是多少呢?要知道一個對象的大小,那么必須需要知道對象在虛擬機中的結(jié)構(gòu)是怎樣的,來看看Hotspot中對象在內(nèi)存中的結(jié)構(gòu):?
?
從上面的這張圖里面可以看出,對象在內(nèi)存中的結(jié)構(gòu)主要包含以下幾個部分:?
Mark Word:對象的Mark Word部分占4個字節(jié),其內(nèi)容是一系列的標記位,比如輕量級鎖的標記位,偏向鎖標記位等等。Class對象指針:Class對象指針的大小也是4個字節(jié),其指向的位置是對象對應的Class對象(其對應的元數(shù)據(jù)對象)的內(nèi)存地址對象實際數(shù)據(jù):這里面包括了對象的所有成員變量,其大小由各個成員變量的大小決定,比如:byte和boolean是1個字節(jié),short和char是2個字節(jié),int和float是4個字節(jié),long和double是8個字節(jié),reference是4個字節(jié)對齊:最后一部分是對齊填充的字節(jié),按8個字節(jié)填充。
根據(jù)上面的圖,那么我們可以得出Integer的對象的結(jié)構(gòu)如下:?
?
Integer只有一個int類型的成員變量value,所以其對象實際數(shù)據(jù)部分的大小是4個字節(jié),然后再在后面填充4個字節(jié)達到8字節(jié)的對齊,所以可以得出Integer對象的大小是16個字節(jié)。?
因此,我們可以得出Integer對象的大小是原生的int類型的4倍。?
關(guān)于對象的內(nèi)存結(jié)構(gòu),需要注意數(shù)組的內(nèi)存結(jié)構(gòu)和普通對象的內(nèi)存結(jié)構(gòu)稍微不同,因為數(shù)據(jù)有一個長度length字段,所以在對象頭后面還多了一個int類型的length字段,占4個字節(jié),接下來才是數(shù)組中的數(shù)據(jù),如下圖:?
?
關(guān)于對象內(nèi)存布局更多的內(nèi)容,可以看這篇文章:Java Objects Memory Structure?
??
??
??
??
??
?【轉(zhuǎn)】HotSpot虛擬機對象探秘?
0人收藏此文章, 我要收藏 發(fā)表于8個月前(2012-02-19 23:29) , 已有44次閱讀 共0個評論?
? ? ? ? 請讀者首先注意本篇的題目中的限定語“HotSpot虛擬機”,在虛擬機規(guī)范中明確寫道, 所有在虛擬機規(guī)范之中沒有明確描述的實現(xiàn)細節(jié),都不應成為虛擬機設(shè)計者發(fā)揮創(chuàng)造性的牽絆,設(shè)計者可以完全自主決定所有規(guī)范中不曾描述的虛擬機內(nèi)部細節(jié)。 例 如:運行時數(shù)據(jù)區(qū)的內(nèi)存如何布局、選用哪種垃圾收集的算法等”。因此,本篇(整個內(nèi)存篇中所有的文章)的內(nèi)容會涉及到虛擬機“自主決定”的實現(xiàn),我們的討 論將在HotSpot VM的范圍內(nèi)展開。同時,我也假定讀者已經(jīng)理解了虛擬機規(guī)范中所定義的JVM公共內(nèi)存模型,例如運行時數(shù)據(jù)區(qū)域、棧幀結(jié)構(gòu)等基礎(chǔ)知識,如果讀者對這些內(nèi)容 有疑問,可以先閱讀《Java虛擬機規(guī)范(JavaSE 7 Editon)》[注1]第2章或《深入理解Java虛擬機:JVM高級特性與最佳實踐》[注2]的第2、3章相關(guān)內(nèi)容。? 對象的創(chuàng)建? ? Java是一門面向?qū)ο蟮木幊陶Z言,Java程序運行過程中無時無刻都有對象被創(chuàng)建出來。在語言層面上,創(chuàng)建對象通常(例外:克隆、反序列化)僅僅是一個 new關(guān)鍵字而已,而在虛擬機中,對象(本文中討論的對象限于普通Java對象,不包括數(shù)組和Class對象等)的創(chuàng)建又是怎樣一個過程呢?? ?虛擬機遇到一條new指令時,首先將去檢查這個指令的參數(shù)是否能在常量池中定位到一個類的符號引用,并且檢查這個符號引用代表的類是否已被加載、解析和初始化過的。如果沒有,那必須先執(zhí)行相應的類加載過程。? ?在類加載檢查通過后,接下來虛擬機將為新生對象分配內(nèi)存。對象所需內(nèi)存的大小在類加載完成后便可完全確定,為對象分配空間的任務具體便等同于一塊確定大小 的內(nèi)存從Java堆中劃分出來,怎么劃呢?假設(shè)Java堆中內(nèi)存是絕對規(guī)整的,所有用過的內(nèi)存都被放在一邊,空閑的內(nèi)存被放在另一邊,中間放著一個指針作 為分界點的指示器,那所分配內(nèi)存就僅僅是把那個指針向空閑空間那邊挪動一段與對象大小相等的距離,這種分配方式稱為“指針碰撞”(Bump The Pointer)。如果Java堆中的內(nèi)存并不是規(guī)整的,已被使用的內(nèi)存和空閑的內(nèi)存相互交錯,那就沒有辦法簡單的進行指針碰撞了,虛擬機就必須維護一個列表,記錄上哪些內(nèi)存塊是可用的,在分配的時候從列表中找到一塊足夠大的空間劃分給對象實例,并更新列表上的記錄,這種分配方式稱為“空閑列表”(Free List)。選擇哪種分配方式由Java堆是否規(guī)整決定,而Java堆是否規(guī)整又由所采用的垃圾收集器是否帶有壓縮整理功能決定。因 此在使用Serial、ParNew等帶Compact過程的收集器時,系統(tǒng)采用的分配算法是指針碰撞,而使用CMS這種基于Mark-Sweep算法的 收集器時(說明一下,CMS收集器可以通過UseCMSCompactAtFullCollection或 CMSFullGCsBeforeCompaction來整理內(nèi)存),就通常采用空閑列表。? ?除如何劃分可用空間之外,還有另外一個需要考慮的問題是對象創(chuàng)建在虛擬機中是非常頻繁的行為,即使是僅僅修改一個指針所指向的位置,在并發(fā)情況下也并不是 線程安全的,可能出現(xiàn)正在給對象A分配內(nèi)存,指針還沒來得及修改,對象B又同時使用了原來的指針來分配內(nèi)存。解決這個問題有兩個方案,一種是對分配內(nèi)存空 間的動作進行同步——實際上虛擬機是采用CAS配上失敗重試的方式保證更新操作的原子性;另外一種是把內(nèi)存分配的動作按照線程劃分在不同的空間之中進行, 即每個線程在Java堆中預先分配一小塊內(nèi)存,稱為本地線程分配緩沖區(qū),(TLAB ,Thread Local Allocation Buffer),哪個線程要分配內(nèi)存,就在哪個線程的TLAB上分配,只有TLAB用完,分配新的TLAB時才需要同步鎖定。虛擬機是否使用TLAB,可以通過-XX:+/-UseTLAB參數(shù)來設(shè)定。? ?內(nèi)存分配完成之后,虛擬機需要將分配到的內(nèi)存空間都初始化為零值(不包括對象頭),如果使用TLAB的話,這一個工作也可以提前至TLAB分配時進行。這 步操作保證了對象的實例字段在Java代碼中可以不賦初始值就直接使用,程序能訪問到這些字段的數(shù)據(jù)類型所對應的零值。? ?接下來,虛擬機要對對象進行必要的設(shè)置,例如這個對象是哪個類的實例、如何才能找到類的元數(shù)據(jù)信息、對象的哈希碼、對象的GC分代年齡等信息。這些信息存 放在對象的對象頭(Object Header)之中。根據(jù)虛擬機當前的運行狀態(tài)的不同,如是否啟用偏向鎖等,對象頭會有不同的設(shè)置方式。? 在上面工作都完成之后,在虛擬機的視角來看,一個新的對象已經(jīng)產(chǎn)生了。但是在Java程序的視角看來,對象創(chuàng)建才剛剛開始——<init>方 法還沒有執(zhí)行,所有的字段都為零值。因此一般來說(由字節(jié)碼中是否跟隨有invokespecial指令所決定),new指令之后會接著就是執(zhí) 行<init>方法,把對象按照程序員的意愿進行初始化,這樣一個真正可用的對象才算完全創(chuàng)建出來。? ?下面代碼是HotSpot虛擬機bytecodeInterpreter.cpp中的代碼片段(這個解釋器實現(xiàn)很少機會實際使用,大部分平臺上都使用模板 解釋器;當代碼通過JIT編譯器執(zhí)行時差異就更大了。不過這段代碼用于了解HotSpot的運作過程是沒有什么問題的)。? ?
01// 確保常量池中存放的是已解釋的類
02if (!constants->tag_at(index).is_unresolved_klass()) {
03? // 斷言確保是klassOop和instanceKlassOop(這部分下一節(jié)介紹)
04? oop entry = (klassOop) *constants->obj_at_addr(index);
05? assert(entry->is_klass(), "Should be resolved klass");
06? klassOop k_entry = (klassOop) entry;
07? assert(k_entry->klass_part()->oop_is_instance(), "Should be instanceKlass");
08? instanceKlass* ik = (instanceKlass*) k_entry->klass_part();
09? // 確保對象所屬類型已經(jīng)經(jīng)過初始化階段
10? if ( ik->is_initialized() && ik->can_be_fastpath_allocated() ) {
11? ? // 取對象長度
12? ? size_t obj_size = ik->size_helper();
13? ? oop result = NULL;
14? ? // 記錄是否需要將對象所有字段置零值
15? ? bool need_zero = !ZeroTLAB;
16? ? // 是否在TLAB中分配對象
17? ? if (UseTLAB) {
18? ? ? result = (oop) THREAD->tlab().allocate(obj_size);
19? ? }
20? ? if (result == NULL) {
21? ? ? need_zero = true;
22? ? ? // 直接在eden中分配對象
23retry:
24? ? ? HeapWord* compare_to = *Universe::heap()->top_addr();
25? ? ? HeapWord* new_top = compare_to + obj_size;
26? ? ? // cmpxchg是x86中的CAS指令,這里是一個C++方法,通過CAS方式分配空間,并發(fā)失敗的話,轉(zhuǎn)到retry中重試直至成功分配為止
27? ? ? if (new_top <= *Universe::heap()->end_addr()) {
28? ? ? ? if (Atomic::cmpxchg_ptr(new_top, Universe::heap()->top_addr(), compare_to) != compare_to) {
29? ? ? ? ? goto retry;
30? ? ? ? }
31? ? ? ? result = (oop) compare_to;
32? ? ? }
33? ? }
34? ? if (result != NULL) {
35? ? ? // 如果需要,為對象初始化零值
36? ? ? if (need_zero ) {
37? ? ? ? HeapWord* to_zero = (HeapWord*) result + sizeof(oopDesc) / oopSize;
38? ? ? ? obj_size -= sizeof(oopDesc) / oopSize;
39? ? ? ? if (obj_size > 0 ) {
40? ? ? ? ? memset(to_zero, 0, obj_size * HeapWordSize);
41? ? ? ? }
42? ? ? }
43? ? ? // 根據(jù)是否啟用偏向鎖,設(shè)置對象頭信息
44? ? ? if (UseBiasedLocking) {
45? ? ? ? result->set_mark(ik->prototype_header());
46? ? ? } else {
47? ? ? ? result->set_mark(markOopDesc::prototype());
48? ? ? }
49? ? ? result->set_klass_gap(0);
50? ? ? result->set_klass(k_entry);
51? ? ? // 將對象引用入棧,繼續(xù)執(zhí)行下一條指令
52? ? ? SET_STACK_OBJECT(result, 0);
53? ? ? UPDATE_PC_AND_TOS_AND_CONTINUE(3, 1);
54? ? }
55? }
56}
??
?對象的內(nèi)存布局? ? HotSpot虛擬機中,對象在內(nèi)存中存儲的布局可以分為三塊區(qū)域:對象頭(Header)、實例數(shù)據(jù)(Instance Data)和對齊填充(Padding)。? HotSpot虛擬機的對象頭包括兩部分信息,第一部分用于存儲對象自身的運行時數(shù)據(jù), 如哈希碼(HashCode)、GC分代年齡、鎖狀態(tài)標志、線程持有的鎖、偏向線程ID、偏向時間戳等等,這部分數(shù)據(jù)的長度在32位和64位的虛擬機(暫 不考慮開啟壓縮指針的場景)中分別為32個和64個Bits,官方稱它為“Mark Word”。對象需要存儲的運行時數(shù)據(jù)很多,其實已經(jīng)超出了32、64位Bitmap結(jié)構(gòu)所能記錄的限度,但是對象頭信息是與對象自身定義的數(shù)據(jù)無關(guān)的額 外存儲成本,考慮到虛擬機的空間效率,Mark Word被設(shè)計成一個非固定的數(shù)據(jù)結(jié)構(gòu)以便在極小的空間內(nèi)存儲盡量多的信息,它會根據(jù)對象的狀態(tài)復用自己的存儲空間。例如在32位的HotSpot虛擬機 中對象未被鎖定的狀態(tài)下,Mark Word的32個Bits空間中的25Bits用于存儲對象哈希碼(HashCode),4Bits用于存儲對象分代年齡,2Bits用于存儲鎖標志 位,1Bit固定為0,在其他狀態(tài)(輕量級鎖定、重量級鎖定、GC標記、可偏向)下對象的存儲內(nèi)容如下表所示。? 表1 HotSpot虛擬機對象頭Mark Word?
存儲內(nèi)容標志位狀態(tài)對象哈希碼、對象分代年齡01未鎖定指向鎖記錄的指針00輕量級鎖定指向重量級鎖的指針10膨脹(重量級鎖定)空,不需要記錄信息11GC標記偏向線程ID、偏向時間戳、對象分代年齡01可偏向
?對象頭的另外一部分是類型指針,即是對象指向它的類的元數(shù)據(jù)的指針,虛擬機通過這個指針來確定這個對象是哪個類的實例。并不是所有的虛擬機實現(xiàn)都必須在對象數(shù)據(jù)上保留類型指針,換句話說查找對象的元數(shù)據(jù)信息并不一定要經(jīng)過對象本身。另外,如果對象是一個Java數(shù)組,那在對象頭中還必須有一塊用于記錄數(shù)組長度的數(shù)據(jù),因為虛擬機可以通過普通Java對象的元數(shù)據(jù)信息確定Java對象的大小,但是從數(shù)組的元數(shù)據(jù)中無法確定數(shù)組的大小。? ?以下是HotSpot虛擬機markOop.cpp中的代碼(注釋)片段,它描述了32bits下MarkWord的存儲狀態(tài):? ?
1// Bit-format of an object header (most significant first, big endian layout below):
2//
3//? 32 bits:
4//? --------
5//? hash:25 ------------>| age:4? ? biased_lock:1 lock:2 (normal object)
6//? JavaThread*:23 epoch:2 age:4? ? biased_lock:1 lock:2 (biased object)
7//? size:32 ------------------------------------------>| (CMS free block)
8//? PromotedObject*:29 ---------->| promo_bits:3 ----->| (CMS promoted object)
??
接下來實例數(shù)據(jù)部分是對象真正存儲的有效信息,也既是我們在程序代碼里面所定義的各種類型的字段內(nèi)容,無論是從父類繼承下來的,還是在子類中定義的都需要記錄下來。 這部分的存儲順序會受到虛擬機分配策略參數(shù)(FieldsAllocationStyle)和字段在Java源碼中定義順序的影響。HotSpot虛擬機 默認的分配策略為longs/doubles、ints、shorts/chars、bytes/booleans、oops(Ordinary Object Pointers),從分配策略中可以看出,相同寬度的字段總是被分配到一起。在滿足這個前提條件的情況下,在父類中定義的變量會出現(xiàn)在子類之前。如果 CompactFields參數(shù)值為true(默認為true),那子類之中較窄的變量也可能會插入到父類變量的空隙之中。? ?第三部分對齊填充并不是必然存在的,也沒有特別的含義,它僅僅起著占位符的作用。由于HotSpot VM的自動內(nèi)存管理系統(tǒng)要求對象起始地址必須是8字節(jié)的整數(shù)倍,換句話說就是對象的大小必須是8字節(jié)的整數(shù)倍。對象頭正好是8字節(jié)的倍數(shù)(1倍或者2倍),因此當對象實例數(shù)據(jù)部分沒有對齊的話,就需要通過對齊填充來補全。? 對象的訪問定位? ? 建立對象是為了使用對象,我們的Java程序需要通過棧上的reference數(shù)據(jù)來操作堆上的具體對象。由于在Java虛擬機規(guī)范里面只規(guī)定了 reference類型? 是一個指向?qū)ο蟮囊?#xff0c;并沒有定義這個引用應該通過什么種方式去定位、訪問到堆中的對象的具體位置,對象訪問方式也是取決于虛擬機實現(xiàn)而定的。主流的訪問方式有使用句柄和直接指針兩種。? ?如果使用句柄訪問的話,Java堆中將會劃分出一塊內(nèi)存來作為句柄池,reference中存儲的就是對象的句柄地址,而句柄中包含了對象實例數(shù)據(jù)與類型數(shù)據(jù)的具體各自的地址信息。如圖1所示。? ? ?
? ?圖1 通過句柄訪問對象?
?如果使用直接指針訪問的話,Java堆對象的布局中就必須考慮如何放置訪問類型數(shù)據(jù)的相關(guān)信息,reference中存儲的直接就是對象地址,如圖2所示。? ?
? 圖2 通過直接指針訪問對象?
?這兩種對象訪問方式各有優(yōu)勢,使用句柄來訪問的最大好處就是reference中存儲的是穩(wěn)定句柄地址,在對象被移動(垃圾收集時移動對象是非常普遍的行為)時只會改變句柄中的實例數(shù)據(jù)指針,而reference本身不需要被修改。? ?使用直接指針來訪問最大的好處就是速度更快,它節(jié)省了一次指針定位的時間開銷,由于對象訪問的在Java中非常頻繁,因此這類開銷積小成多也是一項非???觀的執(zhí)行成本。從上一部分講解的對象內(nèi)存布局可以看出,就虛擬機HotSpot而言,它是使用第二種方式進行對象訪問,但在整個軟件開發(fā)的范圍來看,各種 語言、框架中使用句柄來訪問的情況也十分常見。
總結(jié)
以上是生活随笔為你收集整理的[转载] java对象在内存中的结构的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [转载] java面试100问+参考答案
- 下一篇: sp烘焙流程_小手雷-PBR材质流程(一