JDK之ZGC介绍
**視頻課:https://edu.csdn.net/course/detail/31331
前言
ZGC是最近由Oracle為OpenJDK開源的新垃圾收集器。它主要由Per Liden編寫。ZGC類似于Shenandoah或Azul的C4,專注于減少暫停時間的同時仍然壓縮堆 。
雖然我不會在這里給出完整的介紹,但“壓縮堆”只是意味著將仍然存活的對象移動到堆的其他區(qū)域.這樣做有助于減少碎片,但通常這也意味著整個應(yīng)用程序(包括其所有線程)需要暫停,這通常被稱為Stop the world 。只有GC完成后,才能恢復(fù)應(yīng)用程序。
在GC相關(guān)的文獻中,應(yīng)用程序通常稱為mutator ,因為從GC的角度來看,應(yīng)用程序會改變堆(mutates the heap)。根據(jù)堆的大小,這樣的暫停可能需要幾秒鐘,這對于交互式應(yīng)用程序來說可能是難以接受的。
有幾種方法可以減少暫停時間:
GC可以在壓縮時使用多個線程(并行壓縮 parallel compaction) 壓縮工作也可以分為多個暫停(增量壓縮 incremental compaction) 壓縮堆的同時不暫停應(yīng)用程序,或者只是很短時間暫停(并發(fā)壓縮 concurrent compaction) Go的GC就是完全不壓縮堆如前所述,ZGC會進行并發(fā)壓縮,這當然不是一個簡單的實現(xiàn)功能,因此我想描述一下這是如何工作的。為什么這很復(fù)雜?
你需要將對象復(fù)制到另一個內(nèi)存地址,同時另一個線程仍然可以讀寫舊對象。
如果對象已經(jīng)復(fù)制成功,那么堆中仍有許多指向舊地址的引用需要更新到新地址。
雖然并發(fā)壓縮(concurrent compaction)似乎是上述方案中降低暫停時間的最佳解決方案,但肯定會涉及一些權(quán)衡。因此,如果您不關(guān)心暫停時間,那么最好使用專注于吞吐量的GC。
GC屏障 (GC Barriers)
理解ZGC如何進行并發(fā)壓縮的關(guān)鍵是Load barrier (通常在GC文獻中稱為Read barrier).這里簡單介紹一下,詳細的描述請看下面的Load Barrier一節(jié)。
如果GC有讀取屏障(Load barrier),則在從堆讀取引用時,GC需要執(zhí)行一些額外操作。在Java中,也就是像執(zhí)行這樣的代碼Object xxx=obj.field時需要額外操作。
對于像obj.field = value這樣的操作,GC也可能需要寫入屏障(叫做Write Barrier或者Store Barrier)[譯注:在分代GC還有引用計數(shù)中會用到寫入屏障].
這兩個操作都比較特殊因為它們在每次讀取或?qū)懭攵褧r發(fā)生的。Load Barrier和Store Barrier的名稱有點令人困惑,但注意這個屏障與CPU的內(nèi)存障礙是完全不同的兩個概念
堆中的讀取和寫入都非常常見,因此兩種GC屏障都需要非常高效,在常見情況下就是一些匯編代碼。Read barrier通常比Write Barrier大一個數(shù)量級(可能會因應(yīng)用程序而異),因此Read Barrier對性能要求更高。
例如,分代GC通常只需要一個寫屏障,不需要讀屏障。ZGC則需要一個讀屏障但沒有寫屏障。對于并發(fā)壓縮,我沒有看到?jīng)]有讀取障礙的解決方案。
這里需要注意:即使GC需要某種類型的屏障,只有在讀取或?qū)懭攵阎械囊脮r需要它們。讀取或?qū)懭胂駃nt或double這樣的基本類型是不需要屏障的.
指針標記(Pointer tagging Or Colored Pointers )
ZGC在堆引用中存儲額外的元數(shù)據(jù) ,在x64上是64 bit(ZGC目前不支持compressed oops和 class pointers)。64位中的48位用做x64上的虛擬內(nèi)存地址 。雖然確切地說只有47位,因為第47位確定了位48-63的值(目前這些位都是0)。ZGC保留對象實際地址的前42位(在源代碼中稱為偏移量 )。42位地址理論上就會有4TB的堆大小限制。其余的位用于這些標志: finalizable , remapped , marked1和marked0 (保留一位用于將來使用)。如下圖所示:
6 4 4 4 4 4 0
3 7 6 5 2 1 0
±------------------±±—±----------------------------------------------+
|00000000 00000000 0|0|1111|11 11111111 11111111 11111111 11111111 11111111|
±------------------±±—±----------------------------------------------+
| | | |
| | | * 41-0 Object Offset (42-bits, 4TB address space)
| | |
| | * 45-42 Metadata Bits (4-bits) 0001 = Marked0
| | 0010 = Marked1
| | 0100 = Remapped
| | 1000 = Finalizable
| |
| * 46-46 Unused (1-bit, always zero)
|
- 63-47 Fixed (17-bits, always zero)
在堆引用中具有元數(shù)據(jù)信息使得解引用更加昂貴,因為需要mask地址以獲得沒有元信息的真實地址。ZGC采用了一個很好的技巧來避免這種情況:
當從內(nèi)存中讀取時,會設(shè)置marked0 , marked1或remapped中的一個。
在偏移x處分配頁面(allocating a page)時,ZGC將同一頁面映射到3個不同的地址 :
for marked0 :(0b0001 << 42) | x for marked1 : (0b0010 << 42) | x for remapped : (0b0100 << 42) | x因此,ZGC從地址4TB開始保留16TB的地址空間(但實際上并未使用所有這些內(nèi)存)。如下圖:
±-------------------------------+ 0x0000140000000000 (20TB)
| Remapped View |
±-------------------------------+ 0x0000100000000000 (16TB)
| (Reserved, but unused) |
±-------------------------------+ 0x00000c0000000000 (12TB)
| Marked1 View |
±-------------------------------+ 0x0000080000000000 (8TB)
| Marked0 View |
±-------------------------------+ 0x0000040000000000 (4TB)
在任何時間點,只使用這三個視圖中的一個。調(diào)試時可以取消映射(unmapped)未使用的視圖來驗證正確性。
Pages & Physical & Virtual Memory
Shenandoah將堆分成大量同樣大小的區(qū)域 。除了不適合單個區(qū)域的大對象外,對象通常不會跨越多個區(qū)域。大對象被分配在多個連續(xù)區(qū)域中。我非常喜歡這種方法,因為它非常簡單。
在這方面,ZGC與Shenandoah非常相似。在ZGC的說法中,區(qū)域稱為頁面Pages 。
與Shenandoah的主要區(qū)別:ZGC中的頁面可以有不同的大小(但在x64上總是2MB的倍數(shù))。
ZGC有3種不同的頁面類型: 小型 (2MB大小), 中型 (32MB大小)和大型 (2MB的倍數(shù))。
在小頁面中分配小對象(最大256KB大小),在中型頁面中分配中型對象(最多4MB)。大頁面中分配大于4MB的對象。大頁面只能存儲一個對象.小頁面或中間頁面可以分配多個。
有些令人困惑的是大頁面實際上可能小于中等頁面(例如,對于大小為6MB的大對象)。
ZGC的另一個不錯的特性是,它還可以區(qū)分物理內(nèi)存和虛擬內(nèi)存。這背后的想法是通常有足夠的虛擬內(nèi)存(ZGC總是4TB),而物理內(nèi)存更稀缺。物理內(nèi)存可以擴展到最大堆大小(使用-Xmx設(shè)置),因此這比4 TB的虛擬內(nèi)存要小得多。在ZGC中分配特定大小的頁面意味著分配物理和虛擬內(nèi)存。在ZGC中,物理內(nèi)存不需要是連續(xù)的,虛擬內(nèi)存空間是連續(xù)的。
為什么說這是一個不錯的屬性?
分配連續(xù)范圍的虛擬內(nèi)存是很容易的,因為我們通常有足夠的虛擬內(nèi)存。但在物理內(nèi)存中有3個大小為2MB的空閑頁面的情況很普通,但是對于大型對象分配我們需要6MB的連續(xù)內(nèi)存。有足夠的空閑物理內(nèi)存,但不幸的是這個內(nèi)存是不連續(xù)的。ZGC能夠?qū)⑦@些非連續(xù)的物理頁面映射到單個連續(xù)的虛擬內(nèi)存空間。如果無法映射,我們就會耗盡內(nèi)存(發(fā)生OOM)
標記和重新安置對象(Marking & Relocating objects)
垃圾回收主要分為兩個階段:標記和重新安置(實際上不止這兩個階段,你可以查閱源碼)。
[譯注:重新安置(Relocating)指的是把對象從一個內(nèi)存區(qū)域移到另外一個區(qū)域,重映射(Remapping)只的是把指向老的地址的引用更新到新的地址]
一次GC從標記階段開始,標記所有可到達的對象。在這個階段結(jié)束時,我們知道哪些對象仍然存活,哪些對象是垃圾。ZGC將此信息存儲在每個頁面的Live Map中。Live Map是一個位圖(bitmap) ,用于存儲給定索引處的對象是否可達和/或最終可達(對于具有finalize method的對象而言)。
在標記階段,應(yīng)用程序線程中的load-barrier將未標記的引用推送到線程局部標記緩沖區(qū)。只要此緩沖區(qū)已滿,GC線程就可以獲得此緩沖區(qū)的所有權(quán),并以遞歸方式遍歷此緩沖區(qū)中的所有可到達對象。在應(yīng)用程序線程中標記只是將引用推送到緩沖區(qū),GC線程負責遍歷對象圖并更新Live map.
標記階段結(jié)束后,ZGC要重新安置 Relocation set中的所有活動對象。
Relocation Set表示一組需要被回收的頁面(Pages),例如那些垃圾最多的頁面。存活的對象由GC線程或應(yīng)用程序線程通過讀取屏障(Load Barrier)重新安置(relocated)(也就是放到新的地址去).ZGC為Relocation set中的每個頁面分配Forwarding table.
Forwarding table基本上是一個hash map,它存儲一個對象已被重新安置到的地址(如果該對象已經(jīng)被重新安置)。
ZGC方法的優(yōu)點是我們只需要為relocation set中的頁面分配forwarding table的空間.
相比之下,Shenandoah將轉(zhuǎn)發(fā)指針存儲在每個對象本身,這樣就誰有一些額外的內(nèi)存開銷。
GC線程遍歷 Relocation set中的存活對象,并重新安置(relocate)尚未重新安置的對象。這時可能發(fā)生應(yīng)用程序線程和GC線程同時重新安置(relocate)同一個對象,在這種情況下,誰先relocate誰獲勝,ZGC使用原子CAS操作來確定勝者。
當不處于marking階段時,load-barrier會重新安置(relocates )/重新映射(remaps )從堆加載的所有引用。這確保了mutator看到的每個新引用都已指向?qū)ο蟮淖钚赂北尽V匦掠成?#xff08;remaps)對象就是在forwarding table中查找新的對象地址。
一旦GC線程完成了relocation set的處理,重新安置階段就完成了。雖然這意味著所有對象都已重新安置,但通常仍會有引用指向relocation set,需要將其重新映射(remapped )到新地址。這些引用會被Load-Barrier自我修復(fù)。如果對于這些引用的讀取發(fā)生的不夠快,(也就是這段時間內(nèi),應(yīng)用程序沒有讀到這些指向relocation set的引用),這些引用會在下一次mark階段給修復(fù)。這意味著標記階段還需要檢查 forward table以重新映射(remap) (但不重新安置 ,所有對象之前階段都保證被重新安置)對象到它們的新地址。
這也解釋了為什么對象引用中有兩個標記位(marked0 和marked1 )。標記階段在標記的marked0和marked1位之間交替。在重新安置階段之后,仍可能存在未重定向(remapped)的引用,所以我們需要知道上一個gc周期的情況。如果新的標記階段使用相同的標記位,則Load-Barrier就知道該引用為已標記。
(譯注:這里看起來像是GC周期remap和mark可以重疊,實際上確實是重疊的。如圖所示:
gc phase
更詳細的信息可以看這個Slide)
Load-Barrier
從堆中讀取引用時,ZGC需要一個所謂的load-barrier(也稱為read-barrier)。每次Java程序訪問對象類型的字段時,我們都需要插入此load-barrier,例如obj.field 。訪問某些其他原始類型的字段不需要屏障,例如obj.anInt或obj.anDouble 。ZGC不需要obj.field = someValue存儲/寫入障礙。
根據(jù)GC當前所處的階段(存儲在全局變量ZGlobalPhase中 ),如果尚未標記或重新安置對象,則屏障會標記對象或重新安置它
全局變量ZAddressGoodMask和ZAddressBadMask
存儲對應(yīng)的掩碼,該掩碼確定引用是否已被認為是好的(這意味著已經(jīng)標記或重新映射/重新安置remapped/relocated)或者是否仍然需要一些操作。這些變量僅在標記開始階段和重新安置階段同時改變.ZGC源代碼中的這個表格可以很好地概述這些掩碼的狀態(tài):
Marked0 001 110 101 010
Marked1 010 101 110 001
Remapped 100 011 100 011
屏障的匯編代碼可以在MacroAssembler for x64中看到,我只會為這個屏障顯示一些偽匯編代碼:
mov rax, [r10 + some_field_offset]
test rax, [address of ZAddressBadMask]
jnz load_barrier_mark_or_relocate
otherwise reference in rax is considered good
第一個匯編指令從堆讀取引用: r10存儲對象引用, some_field_offset是一些字段偏移常量。加載的引用存儲在rax寄存器中。
然后針對當前的壞掩碼測試該引用(這只是一個位與)。此處不需要同步,因為ZAddressBadMask僅在STW時才更新。如果結(jié)果不為零,我們需要執(zhí)行屏障。
屏障需要根據(jù)我們當前所處的GC階段標記或重新安置對象。在此操作之后, 他需要更新存儲在r10 + some_field_offset中的引用來指向新引用。這步操作是必要的,以便來該字段的后續(xù)加載返回正確的引用。
由于我們可能需要更新引用地址,因此我們需要使用兩個寄存器r10和rax作為加載的引用和對象地址。正確的引用也需要存儲到寄存器rax中 ,這樣在后面的執(zhí)行過程中我們就已經(jīng)加載了正確的引用。
由于每個引用都需要標記或重新安置,因此在開始標記或重新安置階段后,吞吐量可能會立即降低。當大多數(shù)引用被修復(fù)時,這應(yīng)該會變得更快。
Stop-the-World 停頓
ZGC并沒有徹底擺脫STW。收集器在開始標記,結(jié)束標記和開始重新安置時需要暫停。但這種暫停通常很短,只有幾毫秒。
當開始標記時,ZGC遍歷所有線程堆棧以標記root set。root set是遍歷對象圖的開始的地方。root set通常由本地和全局變量組成,但也包括其他內(nèi)部VM結(jié)構(gòu)(例如JNI句柄)。
結(jié)束標記階段時需要再次暫停。在此暫停中,GC需要清空并遍歷所有線程局部標記緩沖區(qū)。由于GC可能會發(fā)現(xiàn)一個未標記的大型子圖,因此可能需要更長時間。ZGC試圖通過在1毫秒后停止標記階段的結(jié)束來避免這種情況。它返回到并發(fā)標記階段,直到遍歷整個對象圖,然后可以再次開始結(jié)束標記階段
啟動重新安置階段會再次暫停應(yīng)用程序。此階段與開始標記非常相似,不同之處在于此階段重新安置Root Set中的對象。
zgc是一款可拓展的低時延,為實現(xiàn)以下幾個目標而誕生的垃圾回收器:
再看一下zgc的標簽:
region-based (和G1一樣) NUMA-aware Concurrent Compacting Using load barriers(讓一個CPU處理單元中的內(nèi)存狀態(tài)對其它處理單元可見的一項技術(shù),java的volatile底層使用的就是load barrier) Using colored pointers()zgc介紹-by hotspot garbage collector team:https://archive.fosdem.org/2018/schedule/event/zgc/attachments/slides/2211/export/events/attachments/zgc/slides/2211/ZGC_FOSDEM_2018.pdf
一、zgc在jdk各個版本的changelog:
JDK 13 (Released September 2019)
Increased max heap size from 4TB to 16TB Support for uncommitting unused memory (JEP 351) Support for -XX:SoftMaxHeapSIze Support for the Linux/AArch64 platform Reduced Time-To-SafepointJDK 12 (Released March 2019)
Support for concurrent class unloading Further pause time reductionsJDK 11 (Released September 2018)
Initial version of ZGC Does not support class unloading (using -XX:+ClassUnloading has no effect)二、ZGC相關(guān)VM Options
General GC Options ZGC Options ZGC Dianostic Options (-XX:+UnlockDianosticVMOptions)
-XX:MinHeapSize, -Xms
-XX:InitialHeapSize, -Xms
-XX:MaxHeapSize, -Xmx
-XX:SoftMaxHeapSize
-XX:SoftRefLRUPolicyMSPerMB
-XX:ZAllocationSpikeTolerance
-XX:ZCollectionInterval
-XX:ZFragmentationLimit
-XX:ZMarkStackSpaceLimit
-XX:ZPath
-XX:ZUncommit
-XX:ZUncommitDelay
-XX:ZProactive
-XX:ZStatisticsForceTrace
-XX:ZStatisticsInterval
-XX:ZVerifyForwarding
-XX:ZVerifyMarking
-XX:ZVerifyObjects
-XX:ZVerifyRoots
-XX:ZVerifyViews
1、激活ZGC
-XX:+UnlockExperimentalVMOptions -XX:+UseZGC
2、設(shè)置堆大小,堆
-Xmx
3、并發(fā)線程數(shù),并發(fā)線程數(shù)太多會導(dǎo)致占用太多cpu時間分片,太少會導(dǎo)致回收速度跟不上垃圾生產(chǎn)速度。如果系統(tǒng)追求的是低時延,盡量不要讓系統(tǒng)超負荷工作,cpu使用率盡量控制在70%以下
-XX:ConcGCThreads=
4、return unused memery to os
這里指的是設(shè)置了xms和xmx且xmx>xms的情況,zgc默認會返回未使用的內(nèi)存給操作系統(tǒng),對于內(nèi)存水位是重要指標的系統(tǒng),返回未使用內(nèi)存可以更好的觀察內(nèi)存使用情況。但如果要禁用這個功能,可以使用:-XX:-ZUncommit 。但無論使用哪種策略,jvm不會uncommit unsed memery導(dǎo)致堆大小小于xms。這也意味著如果配置xms=xmx,該特性會被隱式禁用
5、Enable Large Pages
啟用方式:-XX:+UseLargePages
Large Pages在Linux稱為Huge Pages,配置zgc使用Huge Pages可以獲得更好的性能(吞吐量、延遲、啟動時間),并且基本沒有缺點,除了配置稍微復(fù)雜一點。配置Huge Pages大小,需要注意JVM除了堆以外其他需要使用到的內(nèi)存也得算進去,具體配置方法如下,就不翻譯了:
6、 Enable Transparent Huge Page(THP)
一般不建議在對延時敏感的系統(tǒng)下使用,THP一個使管理Huge Pages自動化的抽象層。
7、Enable NUMA Support
zgc默認開啟NUMA支持,意味著在分配堆內(nèi)存時,會盡量使用NUMA-local的內(nèi)存(比跨die訪問快3倍)。但當jvm發(fā)現(xiàn)程序使用的只是cpu的一個子集(限定使用),則會自動禁用該特性。一般不需要關(guān)注這個特性,如果需要指定,可以通過以下參數(shù)指定
-XX:+/-UseNUMA
8、Enable GC logging
總結(jié)
- 上一篇: IETF:名词历史简介互联网精神的典范
- 下一篇: 在MySQL登录时出现Access de