當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

JDK之ZGC介绍

發(fā)布時間：2024/1/23 编程问答 30 豆豆

生活随笔收集整理的這篇文章主要介紹了 JDK之ZGC介绍小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

**視頻課：https://edu.csdn.net/course/detail/31331
前言

ZGC是最近由Oracle為OpenJDK開源的新垃圾收集器。它主要由Per Liden編寫。ZGC類似于Shenandoah或Azul的C4，專注于減少暫停時間的同時仍然壓縮堆。

雖然我不會在這里給出完整的介紹，但“壓縮堆”只是意味著將仍然存活的對象移動到堆的其他區(qū)域.這樣做有助于減少碎片，但通常這也意味著整個應(yīng)用程序（包括其所有線程）需要暫停,這通常被稱為Stop the world 。只有GC完成后，才能恢復(fù)應(yīng)用程序。

在GC相關(guān)的文獻中，應(yīng)用程序通常稱為mutator ，因為從GC的角度來看，應(yīng)用程序會改變堆(mutates the heap)。根據(jù)堆的大小，這樣的暫停可能需要幾秒鐘，這對于交互式應(yīng)用程序來說可能是難以接受的。

有幾種方法可以減少暫停時間：

GC可以在壓縮時使用多個線程（并行壓縮 parallel compaction）壓縮工作也可以分為多個暫停（增量壓縮 incremental compaction）壓縮堆的同時不暫停應(yīng)用程序，或者只是很短時間暫停（并發(fā)壓縮 concurrent compaction） Go的GC就是完全不壓縮堆

如前所述，ZGC會進行并發(fā)壓縮，這當然不是一個簡單的實現(xiàn)功能，因此我想描述一下這是如何工作的。為什么這很復(fù)雜？

你需要將對象復(fù)制到另一個內(nèi)存地址，同時另一個線程仍然可以讀寫舊對象。

如果對象已經(jīng)復(fù)制成功，那么堆中仍有許多指向舊地址的引用需要更新到新地址。

雖然并發(fā)壓縮（concurrent compaction）似乎是上述方案中降低暫停時間的最佳解決方案，但肯定會涉及一些權(quán)衡。因此，如果您不關(guān)心暫停時間，那么最好使用專注于吞吐量的GC。
GC屏障 (GC Barriers)

理解ZGC如何進行并發(fā)壓縮的關(guān)鍵是Load barrier (通常在GC文獻中稱為Read barrier).這里簡單介紹一下，詳細的描述請看下面的Load Barrier一節(jié)。

如果GC有讀取屏障（Load barrier），則在從堆讀取引用時，GC需要執(zhí)行一些額外操作。在Java中,也就是像執(zhí)行這樣的代碼Object xxx=obj.field時需要額外操作。

對于像obj.field = value這樣的操作，GC也可能需要寫入屏障(叫做Write Barrier或者Store Barrier)[譯注：在分代GC還有引用計數(shù)中會用到寫入屏障].

這兩個操作都比較特殊因為它們在每次讀取或?qū)懭攵褧r發(fā)生的。Load Barrier和Store Barrier的名稱有點令人困惑，但注意這個屏障與CPU的內(nèi)存障礙是完全不同的兩個概念

堆中的讀取和寫入都非常常見，因此兩種GC屏障都需要非常高效，在常見情況下就是一些匯編代碼。Read barrier通常比Write Barrier大一個數(shù)量級（可能會因應(yīng)用程序而異），因此Read Barrier對性能要求更高。

例如，分代GC通常只需要一個寫屏障，不需要讀屏障。ZGC則需要一個讀屏障但沒有寫屏障。對于并發(fā)壓縮，我沒有看到?jīng)]有讀取障礙的解決方案。

這里需要注意：即使GC需要某種類型的屏障，只有在讀取或?qū)懭攵阎械囊脮r需要它們。讀取或?qū)懭胂駃nt或double這樣的基本類型是不需要屏障的.
指針標記（Pointer tagging Or Colored Pointers ）

ZGC在堆引用中存儲額外的元數(shù)據(jù) ，在x64上是64 bit（ZGC目前不支持compressed oops和 class pointers）。64位中的48位用做x64上的虛擬內(nèi)存地址。雖然確切地說只有47位，因為第47位確定了位48-63的值（目前這些位都是0）。ZGC保留對象實際地址的前42位（在源代碼中稱為偏移量）。42位地址理論上就會有4TB的堆大小限制。其余的位用于這些標志： finalizable ， remapped ， marked1和marked0 （保留一位用于將來使用）。如下圖所示:

6 4 4 4 4 4 0
3 7 6 5 2 1 0
±------------------±±—±----------------------------------------------+
|00000000 00000000 0|0|1111|11 11111111 11111111 11111111 11111111 11111111|
±------------------±±—±----------------------------------------------+
| | | |
| | | * 41-0 Object Offset (42-bits, 4TB address space)
| | |
| | * 45-42 Metadata Bits (4-bits) 0001 = Marked0
| | 0010 = Marked1
| | 0100 = Remapped
| | 1000 = Finalizable
| |
| * 46-46 Unused (1-bit, always zero)
|

63-47 Fixed (17-bits, always zero)

在堆引用中具有元數(shù)據(jù)信息使得解引用更加昂貴，因為需要mask地址以獲得沒有元信息的真實地址。ZGC采用了一個很好的技巧來避免這種情況：

當從內(nèi)存中讀取時，會設(shè)置marked0 , marked1或remapped中的一個。

在偏移x處分配頁面（allocating a page）時，ZGC將同一頁面映射到3個不同的地址：

for marked0 ：(0b0001 << 42) | x for marked1 ： (0b0010 << 42) | x for remapped ： (0b0100 << 42) | x

因此，ZGC從地址4TB開始保留16TB的地址空間（但實際上并未使用所有這些內(nèi)存）。如下圖：

±-------------------------------+ 0x0000140000000000 (20TB)
| Remapped View |
±-------------------------------+ 0x0000100000000000 (16TB)
| (Reserved, but unused) |
±-------------------------------+ 0x00000c0000000000 (12TB)
| Marked1 View |
±-------------------------------+ 0x0000080000000000 (8TB)
| Marked0 View |
±-------------------------------+ 0x0000040000000000 (4TB)

在任何時間點，只使用這三個視圖中的一個。調(diào)試時可以取消映射（unmapped）未使用的視圖來驗證正確性。
Pages & Physical & Virtual Memory

Shenandoah將堆分成大量同樣大小的區(qū)域。除了不適合單個區(qū)域的大對象外，對象通常不會跨越多個區(qū)域。大對象被分配在多個連續(xù)區(qū)域中。我非常喜歡這種方法，因為它非常簡單。

在這方面，ZGC與Shenandoah非常相似。在ZGC的說法中，區(qū)域稱為頁面Pages 。

與Shenandoah的主要區(qū)別：ZGC中的頁面可以有不同的大小（但在x64上總是2MB的倍數(shù)）。

ZGC有3種不同的頁面類型：小型（2MB大小），中型（32MB大小）和大型（2MB的倍數(shù)）。

在小頁面中分配小對象（最大256KB大小），在中型頁面中分配中型對象（最多4MB）。大頁面中分配大于4MB的對象。大頁面只能存儲一個對象.小頁面或中間頁面可以分配多個。

有些令人困惑的是大頁面實際上可能小于中等頁面（例如，對于大小為6MB的大對象）。

ZGC的另一個不錯的特性是，它還可以區(qū)分物理內(nèi)存和虛擬內(nèi)存。這背后的想法是通常有足夠的虛擬內(nèi)存（ZGC總是4TB），而物理內(nèi)存更稀缺。物理內(nèi)存可以擴展到最大堆大小（使用-Xmx設(shè)置），因此這比4 TB的虛擬內(nèi)存要小得多。在ZGC中分配特定大小的頁面意味著分配物理和虛擬內(nèi)存。在ZGC中，物理內(nèi)存不需要是連續(xù)的，虛擬內(nèi)存空間是連續(xù)的。

為什么說這是一個不錯的屬性？

分配連續(xù)范圍的虛擬內(nèi)存是很容易的，因為我們通常有足夠的虛擬內(nèi)存。但在物理內(nèi)存中有3個大小為2MB的空閑頁面的情況很普通，但是對于大型對象分配我們需要6MB的連續(xù)內(nèi)存。有足夠的空閑物理內(nèi)存，但不幸的是這個內(nèi)存是不連續(xù)的。ZGC能夠?qū)⑦@些非連續(xù)的物理頁面映射到單個連續(xù)的虛擬內(nèi)存空間。如果無法映射，我們就會耗盡內(nèi)存（發(fā)生OOM）
標記和重新安置對象（Marking & Relocating objects）

垃圾回收主要分為兩個階段：標記和重新安置（實際上不止這兩個階段，你可以查閱源碼）。

[譯注：重新安置（Relocating）指的是把對象從一個內(nèi)存區(qū)域移到另外一個區(qū)域，重映射(Remapping)只的是把指向老的地址的引用更新到新的地址]

一次GC從標記階段開始，標記所有可到達的對象。在這個階段結(jié)束時，我們知道哪些對象仍然存活，哪些對象是垃圾。ZGC將此信息存儲在每個頁面的Live Map中。Live Map是一個位圖(bitmap) ，用于存儲給定索引處的對象是否可達和/或最終可達（對于具有finalize method的對象而言）。

在標記階段，應(yīng)用程序線程中的load-barrier將未標記的引用推送到線程局部標記緩沖區(qū)。只要此緩沖區(qū)已滿，GC線程就可以獲得此緩沖區(qū)的所有權(quán)，并以遞歸方式遍歷此緩沖區(qū)中的所有可到達對象。在應(yīng)用程序線程中標記只是將引用推送到緩沖區(qū)，GC線程負責遍歷對象圖并更新Live map.

標記階段結(jié)束后，ZGC要重新安置 Relocation set中的所有活動對象。

Relocation Set表示一組需要被回收的頁面（Pages)，例如那些垃圾最多的頁面。存活的對象由GC線程或應(yīng)用程序線程通過讀取屏障（Load Barrier）重新安置（relocated）（也就是放到新的地址去）.ZGC為Relocation set中的每個頁面分配Forwarding table.

Forwarding table基本上是一個hash map，它存儲一個對象已被重新安置到的地址（如果該對象已經(jīng)被重新安置）。

ZGC方法的優(yōu)點是我們只需要為relocation set中的頁面分配forwarding table的空間.
相比之下，Shenandoah將轉(zhuǎn)發(fā)指針存儲在每個對象本身，這樣就誰有一些額外的內(nèi)存開銷。

GC線程遍歷 Relocation set中的存活對象，并重新安置（relocate）尚未重新安置的對象。這時可能發(fā)生應(yīng)用程序線程和GC線程同時重新安置（relocate）同一個對象，在這種情況下，誰先relocate誰獲勝，ZGC使用原子CAS操作來確定勝者。

當不處于marking階段時，load-barrier會重新安置(relocates )/重新映射(remaps )從堆加載的所有引用。這確保了mutator看到的每個新引用都已指向?qū)ο蟮淖钚赂北尽Ｖ匦掠成?#xff08;remaps）對象就是在forwarding table中查找新的對象地址。

一旦GC線程完成了relocation set的處理，重新安置階段就完成了。雖然這意味著所有對象都已重新安置，但通常仍會有引用指向relocation set，需要將其重新映射（remapped ）到新地址。這些引用會被Load-Barrier自我修復(fù)。如果對于這些引用的讀取發(fā)生的不夠快，（也就是這段時間內(nèi)，應(yīng)用程序沒有讀到這些指向relocation set的引用），這些引用會在下一次mark階段給修復(fù)。這意味著標記階段還需要檢查 forward table以重新映射(remap) （但不重新安置，所有對象之前階段都保證被重新安置）對象到它們的新地址。

這也解釋了為什么對象引用中有兩個標記位（marked0 和marked1 ）。標記階段在標記的marked0和marked1位之間交替。在重新安置階段之后，仍可能存在未重定向（remapped）的引用，所以我們需要知道上一個gc周期的情況。如果新的標記階段使用相同的標記位，則Load-Barrier就知道該引用為已標記。

(譯注：這里看起來像是GC周期remap和mark可以重疊，實際上確實是重疊的。如圖所示：
gc phase
更詳細的信息可以看這個Slide)
Load-Barrier

從堆中讀取引用時，ZGC需要一個所謂的load-barrier（也稱為read-barrier）。每次Java程序訪問對象類型的字段時，我們都需要插入此load-barrier，例如obj.field 。訪問某些其他原始類型的字段不需要屏障，例如obj.anInt或obj.anDouble 。ZGC不需要obj.field = someValue存儲/寫入障礙。

根據(jù)GC當前所處的階段（存儲在全局變量ZGlobalPhase中），如果尚未標記或重新安置對象，則屏障會標記對象或重新安置它

全局變量ZAddressGoodMask和ZAddressBadMask
存儲對應(yīng)的掩碼，該掩碼確定引用是否已被認為是好的（這意味著已經(jīng)標記或重新映射/重新安置remapped/relocated）或者是否仍然需要一些操作。這些變量僅在標記開始階段和重新安置階段同時改變.ZGC源代碼中的這個表格可以很好地概述這些掩碼的狀態(tài)：

GoodMask BadMask WeakGoodMask WeakBadMask--------------------------------------------------------------

Marked0 001 110 101 010
Marked1 010 101 110 001
Remapped 100 011 100 011

屏障的匯編代碼可以在MacroAssembler for x64中看到，我只會為這個屏障顯示一些偽匯編代碼：

mov rax, [r10 + some_field_offset]
test rax, [address of ZAddressBadMask]
jnz load_barrier_mark_or_relocate

otherwise reference in rax is considered good

第一個匯編指令從堆讀取引用： r10存儲對象引用， some_field_offset是一些字段偏移常量。加載的引用存儲在rax寄存器中。

然后針對當前的壞掩碼測試該引用（這只是一個位與）。此處不需要同步，因為ZAddressBadMask僅在STW時才更新。如果結(jié)果不為零，我們需要執(zhí)行屏障。

屏障需要根據(jù)我們當前所處的GC階段標記或重新安置對象。在此操作之后，他需要更新存儲在r10 + some_field_offset中的引用來指向新引用。這步操作是必要的，以便來該字段的后續(xù)加載返回正確的引用。

由于我們可能需要更新引用地址，因此我們需要使用兩個寄存器r10和rax作為加載的引用和對象地址。正確的引用也需要存儲到寄存器rax中，這樣在后面的執(zhí)行過程中我們就已經(jīng)加載了正確的引用。

由于每個引用都需要標記或重新安置，因此在開始標記或重新安置階段后，吞吐量可能會立即降低。當大多數(shù)引用被修復(fù)時，這應(yīng)該會變得更快。
Stop-the-World 停頓

ZGC并沒有徹底擺脫STW。收集器在開始標記,結(jié)束標記和開始重新安置時需要暫停。但這種暫停通常很短,只有幾毫秒。

當開始標記時，ZGC遍歷所有線程堆棧以標記root set。root set是遍歷對象圖的開始的地方。root set通常由本地和全局變量組成，但也包括其他內(nèi)部VM結(jié)構(gòu)（例如JNI句柄）。

結(jié)束標記階段時需要再次暫停。在此暫停中，GC需要清空并遍歷所有線程局部標記緩沖區(qū)。由于GC可能會發(fā)現(xiàn)一個未標記的大型子圖，因此可能需要更長時間。ZGC試圖通過在1毫秒后停止標記階段的結(jié)束來避免這種情況。它返回到并發(fā)標記階段，直到遍歷整個對象圖，然后可以再次開始結(jié)束標記階段

啟動重新安置階段會再次暫停應(yīng)用程序。此階段與開始標記非常相似，不同之處在于此階段重新安置Root Set中的對象。
zgc是一款可拓展的低時延，為實現(xiàn)以下幾個目標而誕生的垃圾回收器：

停頓時間不超過10ms 停頓時間不會因堆變大而變長堆大小范圍可支持幾G到幾T

再看一下zgc的標簽：

region-based (和G1一樣) NUMA-aware Concurrent Compacting Using load barriers(讓一個CPU處理單元中的內(nèi)存狀態(tài)對其它處理單元可見的一項技術(shù)，java的volatile底層使用的就是load barrier) Using colored pointers()

zgc介紹-by hotspot garbage collector team:https://archive.fosdem.org/2018/schedule/event/zgc/attachments/slides/2211/export/events/attachments/zgc/slides/2211/ZGC_FOSDEM_2018.pdf
一、zgc在jdk各個版本的changelog：

JDK 13 (Released September 2019)

Increased max heap size from 4TB to 16TB Support for uncommitting unused memory (JEP 351) Support for -XX:SoftMaxHeapSIze Support for the Linux/AArch64 platform Reduced Time-To-Safepoint

JDK 12 (Released March 2019)

Support for concurrent class unloading Further pause time reductions

JDK 11 (Released September 2018)

Initial version of ZGC Does not support class unloading (using -XX:+ClassUnloading has no effect)

二、ZGC相關(guān)VM Options

General GC Options ZGC Options ZGC Dianostic Options （-XX:+UnlockDianosticVMOptions）

-XX:MinHeapSize, -Xms

-XX:InitialHeapSize, -Xms

-XX:MaxHeapSize, -Xmx

-XX:SoftMaxHeapSize

-XX:SoftRefLRUPolicyMSPerMB

-XX:ZAllocationSpikeTolerance

-XX:ZCollectionInterval

-XX:ZFragmentationLimit

-XX:ZMarkStackSpaceLimit

-XX:ZPath

-XX:ZUncommit

-XX:ZUncommitDelay

-XX:ZProactive

-XX:ZStatisticsForceTrace

-XX:ZStatisticsInterval

-XX:ZVerifyForwarding

-XX:ZVerifyMarking

-XX:ZVerifyObjects

-XX:ZVerifyRoots

-XX:ZVerifyViews

1、激活ZGC

-XX:+UnlockExperimentalVMOptions -XX:+UseZGC

2、設(shè)置堆大小，堆

-Xmx

3、并發(fā)線程數(shù)，并發(fā)線程數(shù)太多會導(dǎo)致占用太多cpu時間分片，太少會導(dǎo)致回收速度跟不上垃圾生產(chǎn)速度。如果系統(tǒng)追求的是低時延，盡量不要讓系統(tǒng)超負荷工作，cpu使用率盡量控制在70%以下

-XX:ConcGCThreads=

4、return unused memery to os

這里指的是設(shè)置了xms和xmx且xmx>xms的情況，zgc默認會返回未使用的內(nèi)存給操作系統(tǒng)，對于內(nèi)存水位是重要指標的系統(tǒng)，返回未使用內(nèi)存可以更好的觀察內(nèi)存使用情況。但如果要禁用這個功能，可以使用：-XX:-ZUncommit 。但無論使用哪種策略，jvm不會uncommit unsed memery導(dǎo)致堆大小小于xms。這也意味著如果配置xms=xmx，該特性會被隱式禁用

5、Enable Large Pages

啟用方式：-XX:+UseLargePages

Large Pages在Linux稱為Huge Pages，配置zgc使用Huge Pages可以獲得更好的性能（吞吐量、延遲、啟動時間），并且基本沒有缺點，除了配置稍微復(fù)雜一點。配置Huge Pages大小，需要注意JVM除了堆以外其他需要使用到的內(nèi)存也得算進去，具體配置方法如下，就不翻譯了：

6、 Enable Transparent Huge Page(THP)

一般不建議在對延時敏感的系統(tǒng)下使用，THP一個使管理Huge Pages自動化的抽象層。

7、Enable NUMA Support

zgc默認開啟NUMA支持，意味著在分配堆內(nèi)存時，會盡量使用NUMA-local的內(nèi)存（比跨die訪問快3倍）。但當jvm發(fā)現(xiàn)程序使用的只是cpu的一個子集（限定使用），則會自動禁用該特性。一般不需要關(guān)注這個特性，如果需要指定，可以通過以下參數(shù)指定

-XX:+/-UseNUMA

8、Enable GC logging

總結(jié)

以上是生活随笔為你收集整理的JDK之ZGC介绍的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： IETF：名词历史简介互联网精神的典范
下一篇：在MySQL登录时出现Access de

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

JDK之ZGC介绍

otherwise reference in rax is considered good

總結(jié)