17-垃圾回收器
垃圾回收器
GC分類與性能指標
垃圾收集器沒有在規(guī)范中進行過多的規(guī)定,可以由不同的廠商、不同版本的JVM來實現(xiàn)。
由于JDK的版本處于高速迭代過程中,因此Java發(fā)展至今已經衍生了眾多的GC版本。
從不同角度分析垃圾收集器,可以將GC分為不同的類型。
Java不同版本新特性
- 語法層面:Lambda表達式、switch、自動拆箱裝箱、enum、<>
- API層面:Stream API、新的日期時間、Optional、String、集合框架
- 底層優(yōu)化:JVM優(yōu)化、GC的變化、元空間、靜態(tài)域、字符串常量池位置變化
垃圾收集器分類
按線程數(shù)分
按線程數(shù)分(垃圾回收線程數(shù)),可以分為串行垃圾回收器和并行垃圾回收器。
串行回收指的是在同一時間段內只允許有一個CPU用于執(zhí)行垃圾回收操作,此時工作線程被暫停,直至垃圾收集工作結束。
- 在諸如單CPU處理器或者較小的應用內存等硬件平臺不是特別優(yōu)越的場合,串行回收器的性能表現(xiàn)可以超過并行回收器和并發(fā)回收器。所以,串行回收默認被應用在客戶端的Client模式下的JVM中
- 在并發(fā)能力比較強的CPU上,并行回收器產生的停頓時間要短于串行回收器。
和串行回收相反,并行收集可以運用多個CPU同時執(zhí)行垃圾回收,因此提升了應用的吞吐量,不過并行回收仍然與串行回收一樣,采用獨占式,使用了“stop-the-world”機制。
按工作模式分
按照工作模式分,可以分為并發(fā)式垃圾回收器和獨占式垃圾回收器。
- 并發(fā)式垃圾回收器與應用程序線程交替工作,以盡可能減少應用程序的停頓時間。
- 獨占式垃圾回收器(Stop the world)一旦運行,就停止應用程序中的所有用戶線程,直到垃圾回收過程完全結束。
按碎片處理方式分
按碎片處理方式分,可分為壓縮式垃圾回收器和非壓縮式垃圾回收器。
- 壓縮式垃圾回收器會在回收完成后,對存活對象進行壓縮整理,消除回收后的碎片。
- 再分配對象空間使用:指針碰撞
- 非壓縮式的垃圾回收器不進行這步操作。
- 再分配對象空間使用:空間列表
按工作的內存區(qū)間分,又可分為年輕代垃圾回收器和老年代垃圾回收器。
評估GC的性能指標
- 吞吐量:運行用戶代碼的時間占總運行時間的比例(總運行時間 = 程序的運行時間 + 內存回收的時間)
- 垃圾收集開銷:吞吐量的補數(shù),垃圾收集所用時間與總運行時間的比例。
- 暫停時間:執(zhí)行垃圾收集時,程序的工作線程被暫停的時間。
- 收集頻率:相對于應用程序的執(zhí)行,收集操作發(fā)生的頻率。
- 內存占用:Java堆區(qū)所占的內存大小。
- 快速:一個對象從誕生到被回收所經歷的時間。
吞吐量、暫停時間、內存占用 這三者共同構成一個“不可能三角”。三者總體的表現(xiàn)會隨著技術進步而越來越好。一款優(yōu)秀的收集器通常最多同時滿足其中的兩項。
這三項里,暫停時間的重要性日益凸顯。因為隨著硬件發(fā)展,內存占用多些越來越能容忍,硬件性能的提升也有助于降低收集器運行時對應用程序的影響,即提高了吞吐量。而內存的擴大,對延遲反而帶來負面效果。
簡單來說,主要抓住兩點:
性能指標:吞吐量
吞吐量就是CPU用于運行用戶代碼的時間與CPU總消耗時間的比值,即吞吐量=運行用戶代碼時間 /(運行用戶代碼時間+垃圾收集時間)
比如:虛擬機總共運行了100分鐘,其中垃圾收集花掉1分鐘,那吞吐量就是99%。
這種情況下,應用程序能容忍較高的暫停時間,因此,高吞吐量的應用程序有更長的時間基準,快速響應是不必考慮的
吞吐量優(yōu)先,意味著在單位時間內,STW的時間最短:0.2+0.2=e.4
性能指標:暫停時間
“暫停時間”是指一個時間段內應用程序線程暫停,讓Gc線程執(zhí)行的狀態(tài)
例如,GC期間1ee毫秒的暫停時間意味著在這1e0毫秒期間內沒有應用程序線程是活動的。暫停時間優(yōu)先,意味著盡可能讓單次STW的時間最短:0.1+0.1 + 0.1+ 0.1+ 0.1=0.5
吞吐量vs暫停時間
高吞吐量較好因為這會讓應用程序的最終用戶感覺只有應用程序線程在做“生產性”工作。直覺上,吞吐量越高程序運行越快。
低暫停時間(低延遲)較好因為從最終用戶的角度來看不管是GC還是其他原因導致一個應用被掛起始終是不好的。這取決于應用程序的類型,有時候甚至短暫的200毫秒暫停都可能打斷終端用戶體驗。因此,具有低的較大暫停時間是非常重要的,特別是對于一個交互式應用程序。
不幸的是”高吞吐量”和”低暫停時間”是一對相互競爭的目標(矛盾)。
因為如果選擇以吞吐量優(yōu)先,那么必然需要降低內存回收的執(zhí)行頻率,但是這樣會導致GC需要更長的暫停時間來執(zhí)行內存回收。
相反的,如果選擇以低延遲優(yōu)先為原則,那么為了降低每次執(zhí)行內存回收時的暫停時間,也只能頻繁地執(zhí)行內存回收,但這又引起了年輕代內存的縮減和導致程序吞吐量的下降。
在設計(或使用)GC算法時,我們必須確定我們的目標:一個GC算法只可能針對兩個目標之一(即只專注于較大吞吐量或最小暫停時間),或嘗試找到一個二者的折衷。
現(xiàn)在標準:在最大吞吐量優(yōu)先的情況下,降低停頓時間
不同的垃圾回收器概述
垃圾收集機制是Java的招牌能力,極大地提高了開發(fā)效率。這當然也是面試的熱點。
那么,Java常見的垃圾收集器有哪些?
GC垃圾收集器是和JVM一脈相承的,它是和JVM進行搭配使用,在不同的使用場景對應的收集器也是有區(qū)別
垃圾回收器發(fā)展史
有了虛擬機,就一定需要收集垃圾的機制,這就是Garbage Collection,對應的產品我們稱為Garbage Collector。
- 1999年隨JDK1.3.1一起來的是串行方式的serialGc,它是第一款GC。ParNew垃圾收集器是Serial收集器的多線程版本
- 2002年2月26日,Parallel GC和Concurrent Mark Sweep GC跟隨JDK1.4.2一起發(fā)布·
- Parallel GC在JDK6之后成為HotSpot默認GC。
- 2012年,在JDK1.7u4版本中,G1可用。
- 2017年,JDK9中G1變成默認的垃圾收集器,以替代CMS。
- 2018年3月,JDK10中G1垃圾回收器的并行完整垃圾回收,實現(xiàn)并行性來改善最壞情況下的延遲。
- 2018年9月,JDK11發(fā)布。引入Epsilon 垃圾回收器,又被稱為 "No-Op(無操作)“ 回收器。同時,引入ZGC:可伸縮的低延遲垃圾回收器(Experimental)
- 2019年3月,JDK12發(fā)布。增強G1,自動返回未用堆內存給操作系統(tǒng)。同時,引入Shenandoah GC:低停頓時間的GC(Experimental)。·2019年9月,JDK13發(fā)布。增強zGC,自動返回未用堆內存給操作系統(tǒng)。
- 2020年3月,JDK14發(fā)布。刪除cMs垃圾回收器。擴展zGC在macos和Windows上的應用
7種經典的垃圾收集器
- 串行回收器:Serial、Serial old
- 并行回收器:ParNew、Parallel Scavenge、Parallel old
- 并發(fā)回收器:CMS、G11
7款經典收集器與垃圾分代之間的關系
新生代收集器:Serial、ParNew、Paralle1 Scavenge;
老年代收集器:Serial old、Parallel old、CMS;
整堆收集器:G1;
垃圾收集器的組合關系
- 兩個收集器間有連線,表明它們可以搭配使用:Serial/Serial old、Serial/CMS、ParNew/Serial old、ParNew/CMS、Parallel Scavenge/Serial 0ld、Parallel Scavenge/Parallel 01d、G1;
- 其中Serial o1d作為CMs出現(xiàn)"Concurrent Mode Failure"失敗的后備預案。
- (紅色虛線)由于維護和兼容性測試的成本,在JDK 8時將Serial+CMS、ParNew+Serial old這兩個組合聲明為廢棄(JEP173),并在JDK9中完全取消了這些組合的支持(JEP214),即:移除。
- (綠色虛線)JDK14中:棄用Paralle1 Scavenge和Serialold GC組合(JEP366)
- (青色虛線)JDK14中:刪除CMs垃圾回收器(JEP363)
為什么要有很多收集器,一個不夠嗎?因為Java的使用場景很多,移動端,服務器等。所以就需要針對不同的場景,提供不同的垃圾收集器,提高垃圾收集的性能。
雖然我們會對各個收集器進行比較,但并非為了挑選一個最好的收集器出來。沒有一種放之四海皆準、任何場景下都適用的完美收集器存在,更加沒有萬能的收集器。所以我們選擇的只是對具體應用最合適的收集器。
如何查看默認垃圾收集器
-XX:+PrintcommandLineFlags:查看命令行相關參數(shù)(包含使用的垃圾收集器)
使用命令行指令:jinfo -flag 相關垃圾回收器參數(shù) 進程ID
Serial回收器:串行回收
Serial收集器是最基本、歷史最悠久的垃圾收集器了。JDK1.3之前回收新生代唯一的選擇。
Serial收集器作為HotSpot中client模式下的默認新生代垃圾收集器。
Serial收集器采用復制算法、串行回收和"stop-the-World"機制的方式執(zhí)行內存回收。
除了年輕代之外,Serial收集器還提供用于執(zhí)行老年代垃圾收集的Serial old收集器。Serial old收集器同樣也采用了串行回收和"stop the World"機制,只不過內存回收算法使用的是標記-壓縮算法。
- Serial old是運行在Client模式下默認的老年代的垃圾回收器
- Serial 0ld在Server模式下主要有兩個用途:
- 與新生代的Parallel scavenge配合使用
- 作為老年代CMS收集器的后備垃圾收集方案
這個收集器是一個單線程的收集器,但它的“單線程”的意義并不僅僅說明它只會使用一個CPU或一條收集線程去完成垃圾收集工作,更重要的是在它進行垃圾收集時,必須暫停其他所有的工作線程,直到它收集結束(Stop The World)
優(yōu)勢:簡單而高效(與其他收集器的單線程比),對于限定單個CPU的環(huán)境來說,Serial收集器由于沒有線程交互的開銷,專心做垃圾收集自然可以獲得最高的單線程收集效率。
運行在client模式下的虛擬機是個不錯的選擇。
在用戶的桌面應用場景中,可用內存一般不大(幾十MB至一兩百MB),可以在較短時間內完成垃圾收集(幾十ms至一百多ms),只要不頻繁發(fā)生,使用串行回收器是可以接受的。
在HotSpot虛擬機中,使用**-XX:+UseSerialGC**參數(shù)可以指定年輕代和老年代都使用串行收集器。
- 等價于新生代用Serial GC,且老年代用Serial old GC
總結
這種垃圾收集器大家了解,現(xiàn)在已經不用串行的了。而且在限定單核cpu才可以用。現(xiàn)在都不是單核的了。
對于交互較強的應用而言,這種垃圾收集器是不能接受的。一般在Java web應用程序中是不會采用串行垃圾收集器的。
ParNew回收器:并行回收
如果說serialGC是年輕代中的單線程垃圾收集器,那么ParNew收集器則是serial收集器的多線程版本。
- Par是Parallel的縮寫,New:只能處理的是新生代
ParNew 收集器除了采用并行回收的方式執(zhí)行內存回收外,兩款垃圾收集器之間幾乎沒有任何區(qū)別。ParNew收集器在年輕代中同樣也是采用復制算法、"stop-the-World"機制。
ParNew 是很多JVM運行在Server模式下新生代的默認垃圾收集器。
- 對于新生代,回收次數(shù)頻繁,使用并行方式高效。
- 對于老年代,回收次數(shù)少,使用串行方式節(jié)省資源。(CPU并行需要切換線程,串行可以省去切換線程的資源)
由于ParNew收集器是基于并行回收,那么是否可以斷定ParNew收集器的回收效率在任何場景下都會比serial收集器更高效?
- ParNew收集器運行在多CPU的環(huán)境下,由于可以充分利用多CPU、多核心等物理硬件資源優(yōu)勢,可以更快速的完成垃圾收集,提高程序的吞吐量
- 但是在單個CPU的環(huán)境下,ParNew數(shù)據器不比Serial數(shù)據器更高效。雖然Serial收集器是基于串行回收,但是由于CPU不需要頻繁的做任務切換,因此可以有效避免多線程交互過程中產生的一些額外開銷
除Serial外,目前只有ParNew GC能與CMS收集器配合工作
在程序中,開發(fā)人員可以通過選項 “-XX:+UseParNewGC” 手動指定使用ParNew收集器執(zhí)行內存回收任務。它表示年輕代使用并行收集器,不影響老年代。
-XX:ParallelGCThreads限制線程數(shù)量,默認開啟和CPU數(shù)據相同的線程數(shù)。
Parallel回收器:吞吐量優(yōu)先
HotSpot的年輕代中除了擁有ParNew收集器是基于并行回收的以外,Parallel Scavenge收集器同樣也采用了復制算法、并行回收和"Stop the World"機制。
那么Parallel 收集器的出現(xiàn)是否多此一舉?
- 和ParNew收集器不同,Parallel Scavenge收集器的目標則是達到一個可控制的吞吐量(Throughput),它也被稱為吞吐量優(yōu)先的垃圾收集器。
- 自適應調節(jié)策略也是Parallel Scavenge與ParNew一個重要區(qū)別。
高吞吐量則可以高效率地利用CPU時間,盡快完成程序的運算任務,主要適合在后臺運算而不需要太多交互的任務。因此,常見在服務器環(huán)境中使用。例如,那些執(zhí)行批量處理、訂單處理、工資支付、科學計算的應用程序。
Parallel收集器在JDK1.6時提供了用于執(zhí)行老年代垃圾收集的Parallel old收集器,用來代替老年代的Serial old收集器。
Parallel old收集器采用了標記-壓縮算法,但同樣也是基于并行回收和"stop-the-World"機制。
在程序吞吐量優(yōu)先的應用場景中,Parallel收集器和Parallel old收集器的組合,在server模式下的內存回收性能很不錯。在Java8中,默認是此垃圾收集器。
參數(shù)配置
-XX:+UseParallelGC 手動指定年輕代使用Parallel并行收集器執(zhí)行內存回收任務。
-XX:+UseParalleloldGC 手動指定老年代都是使用并行回收收集器。
- 分別適用于新生代和老年代。默認jdk8是開啟的。
- 上面兩個參數(shù),默認開啟一個,另一個也會被開啟。(互相激活)
-XX:ParallelGCThreads設置年輕代并行收集器的線程數(shù)。一般地,最好與CPU數(shù)量相等,以避免過多的線程數(shù)影響垃圾收集性能。
-
在默認情況下,當CPU數(shù)量小于8個,ParallelGCThreads的值等于CPU數(shù)量。
-
當CPU數(shù)量大于8個,ParallelGCThreads的值等于3+[5*CPU Count]/8]
-XX:MaxGCPauseMillis 設置垃圾收集器最大停頓時間(即STw的時間)。單位是毫秒。
- 為了盡可能地把停頓時間控制在MaxGCPauseMills以內,收集器在工作時會調整Java堆大小或者其他一些參數(shù)。
- 對于用戶來講,停頓時間越短體驗越好。但是在服務器端,我們注重高并發(fā),整體的吞吐量。所以服務器端適合Parallel,進行控制。
- 該參數(shù)使用需謹慎。
-XX:GCTimeRatio垃圾收集時間占總時間的比例(=1/(N+1))。用于衡量吞吐量的大小。
-
取值范圍(0,100)。默認值99,也就是垃圾回收時間不超過1。
-
與前一個-XX:MaxGCPauseMillis參數(shù)有一定矛盾性。暫停時間越長,Radio參數(shù)就容易超過設定的比例。
-XX:+UseAdaptiveSizePolicy 設置Parallel Scavenge收集器具有自適應調節(jié)策略
-
在這種模式下,年輕代的大小、Eden和Survivor的比例、晉升老年代的對象年齡等參數(shù)會被自動調整,已達到在堆大小、吞吐量和停頓時間之間的平衡點。(默認開啟,回顧前面默認Eden:S0:S1=8:1:1,實際上由于自適應調節(jié)策略的存在,實際比例往往是6:1:1)
-
在手動調優(yōu)比較困難的場合,可以直接使用這種自適應的方式,僅指定虛擬機的最大堆、目標的吞吐量(GCTimeRatio)和停頓時間(MaxGCPauseMills),讓虛擬機自己完成調優(yōu)工作。
CMS回收器:低延遲
在JDK1.5時期,Hotspot推出了一款在強交互應用中幾乎可認為有劃時代意義的垃圾收集器:CMS(Concurrent-Mark-Sweep)收集器,這款收集器是HotSpot虛擬機中第一款真正意義上的并發(fā)收集器,它第一次實現(xiàn)了讓垃圾收集線程與用戶線程同時工作。
CMS收集器的關注點是盡可能縮短垃圾收集時用戶線程的停頓時間。停頓時間越短(低延遲)就越適合與用戶交互的程序,良好的響應速度能提升用戶體驗。
- 目前很大一部分的Java應用集中在互聯(lián)網站或者B/S系統(tǒng)的服務端上,這類應用尤其重視服務的響應速度,希望系統(tǒng)停頓時間最短,以給用戶帶來較好的體驗。CMS收集器就非常符合這類應用的需求。
CMS的垃圾收集算法采用標記-清除算法,并且也會**“stop-the-world”**
不幸的是,CMS作為老年代的收集器,卻無法與JDK1.4.0中已經存在的新生代收集器Parallel Scavenge配合工作,所以在JDK1.5中使用CMS來收集老年代的時候,新生代只能選擇ParNew或者Serial收集器中的一個。
在G1出現(xiàn)之前,CMS使用還是非常廣泛的。一直到今天,仍然有很多系統(tǒng)使用CMS GC。
CMS整個過程比之前的收集器要復雜,整個過程分為4個主要階段,即初始標記階段、并發(fā)標記階段、重新標記階段和并發(fā)清除階段。(涉及STW的階段主要是:初始標記 和 重新標記)
- 初始標記(Initial-Mark)階段:在這個階段中,程序中所有的工作線程都將會因為“stop-the-world”機制而出現(xiàn)短暫的暫停,這個階段的主要任務僅僅只是標記出GCRoots能直接關聯(lián)到的對象。一旦標記完成之后就會恢復之前被暫停的所有應用線程。由于直接關聯(lián)對象比較小,所以這里的速度非常快。
- 并發(fā)標記(Concurrent-Mark)階段:從GC Roots的直接關聯(lián)對象開始遍歷整個對象圖的過程,這個過程耗時較長但是不需要停頓用戶線程,可以與垃圾收集線程一起并發(fā)運行。
- 重新標記(Remark)階段:由于在并發(fā)標記階段中,程序的工作線程會和垃圾收集線程同時運行或者交叉運行,因此為了修正并發(fā)標記期間,因用戶程序繼續(xù)運作而導致標記產生變動的那一部分對象的標記記錄,這個階段的停頓時間通常會比初始標記階段稍長一些,但也遠比并發(fā)標記階段的時間短。
- 并發(fā)清除(Concurrent-Sweep)階段:此階段清理刪除掉標記階段判斷的已經死亡的對象,釋放內存空間。由于不需要移動存活對象,所以這個階段也是可以與用戶線程同時并發(fā)的
盡管CMS收集器采用的是并發(fā)回收(非獨占式),但是在其初始化標記和再次標記這兩個階段中仍然需要執(zhí)行“Stop-the-World”機制暫停程序中的工作線程,不過暫停時間并不會太長,因此可以說明目前所有的垃圾收集器都做不到完全不需要“stop-the-World”,只是盡可能地縮短暫停時間。
由于最耗費時間的并發(fā)標記與并發(fā)清除階段都不需要暫停工作,所以整體的回收是低停頓的。
另外,由于在垃圾收集階段用戶線程沒有中斷,所以在CMS回收過程中,還應該確保應用程序用戶線程有足夠的內存可用。因此,CMS收集器不能像其他收集器那樣等到老年代幾乎完全被填滿了再進行收集,而是當堆內存使用率達到某一閾值時,便開始進行回收,以確保應用程序在CMS工作過程中依然有足夠的空間支持應用程序運行。要是CMS運行期間預留的內存無法滿足程序需要,就會出現(xiàn)一次**“Concurrent Mode Failure”**失敗,這時虛擬機將啟動后備預案:臨時啟用Serial old收集器來重新進行老年代的垃圾收集,這樣停頓時間就很長了。
CMS收集器的垃圾收集算法采用的是標記清除算法,這意味著每次執(zhí)行完內存回收后,由于被執(zhí)行內存回收的無用對象所占用的內存空間極有可能是不連續(xù)的一些內存塊,不可避免地將會產生一些內存碎片。那么CMS在為新對象分配內存空間時,將無法使用指針碰撞(Bump the Pointer)技術,而只能夠選擇空閑列表(Free List)執(zhí)行內存分配。
CMS為什么不使用標記整理算法?
答案其實很簡答,因為當并發(fā)清除的時候,用Compact整理內存的話,原來的用戶線程使用的內存還怎么用呢?CMS是并發(fā)的,用戶線程還在執(zhí)行,但是如果用Compact整理內存會修改正在使用的對象地址,這肯定是不行的。要保證用戶線程能繼續(xù)執(zhí)行,前提的它運行的資源(對象地址)不受影響嘛。Mark Compact更適合“stop the world”這種場景下使用(用戶線程完全停下來來整理內存)。
優(yōu)點
- 并發(fā)收集
- 低延遲
缺點
-
會產生內存碎片,導致并發(fā)清除后,用戶線程可用的空間不足。在無法分配大對象的情況下,不得不提前觸發(fā)Full GC。
-
CMS收集器對CPU資源非常敏感。在并發(fā)階段,它雖然不會導致用戶停頓,但是會因為占用了一部分線程而導致應用程序變慢,總吞吐量會降低。
-
CMS收集器無法處理浮動垃圾。可能出現(xiàn)“Concurrent Mode Failure"失敗而導致另一次Full GC的產生。在并發(fā)標記階段由于程序的工作線程和垃圾收集線程是同時運行或者交叉運行的,那么在并發(fā)標記階段如果產生新的垃圾對象,CMS將無法對這些垃圾對象進行標記,最終會導致這些新產生的垃圾對象沒有被及時回收,從而只能在下一次執(zhí)行GC時釋放這些之前未被回收的內存空間。(重新標記只是將初始標記進來,在并發(fā)標記階段不確定是否是垃圾的部分重新標記修正確定下來,但是,并發(fā)標記中還有一種,是開始不是垃圾,但在用戶線程執(zhí)行過程中變成垃圾了,這部分重新標記是不包含的。因此,后續(xù)的并發(fā)清理也不會清理它)
設置的參數(shù)
-XX:+UseConcMarkSweepGC手動指定使用CMS收集器執(zhí)行內存回收任務。
- 開啟該參數(shù)后會自動將-XX:+UseParNewGC打開。即:ParNew(Young區(qū)用)+CMS(old區(qū)用)+Serial old的組合。
-XX:CMSInitiatingoccupanyFraction 設置堆內存使用率的閾值,一旦達到該閾值,便開始進行回收。
-
JDK5及以前版本的默認值為68,即當老年代的空間使用率達到68%時,會執(zhí)行一次cMs回收。JDK6及以上版本默認值為92%
-
如果內存增長緩慢,則可以設置一個稍大的值,大的閥值可以有效降低CMS的觸發(fā)頻率,減少老年代回收的次數(shù)可以較為明顯地改善應用程序性能。反之,如果應用程序內存使用率增長很快,則應該降低這個閾值,以避免頻繁觸發(fā)老年代串行收集器。因此通過該選項便可以有效降低Ful1Gc的執(zhí)行次數(shù)。
-XX:+UseCMSCompactAtFullCollection用于指定在執(zhí)行完Ful1
- GC后對內存空間進行壓縮整理,以此避免內存碎片的產生。不過由于內存壓縮整理過程無法并發(fā)執(zhí)行,所帶來的問題就是停頓時間變得更長了。
-XX:CMSFullGCsBeforecompaction 設置在執(zhí)行多少次FullGC后對內存空間進行壓縮整理。
-XX:ParallelcMSThreads 設置CMS的線程數(shù)量。
- CMS默認啟動的線程數(shù)是(ParallelGCThreads+3)/4,ParallelGCThreads是年輕代并行收集器的線程數(shù)。當CPU資源比較緊張時,受到CMS收集器線程的影響,應用程序的性能在垃圾回收階段可能會非常糟糕。
小結
HotSpot有這么多的垃圾回收器,那么如果有人問,Serial GC、Parallel GC、Concurrent Mark Sweep GC這三個GS有什么不同呢?
請記住以下口令:
- 如果你想要最小化地使用內存和并行開銷,請選Serial GC;(年輕代:Serial GC+Serial Old:老年代)
- 如果你想要最大化應用程序的吞吐量,請選Parallel GC;(年輕代:Parallel GC+Parallel Old:老年代)
- 如果你想要最小化GC的中斷或停頓時間,請選CMS GC。(年輕代:ParNew GC+CMS GC:老年代)
- 串行: Serial Serial Old
- 并行:ParNew Parallel Parallel Old
- 并發(fā):CMS
- 并發(fā)、并行:G1
JDK后續(xù)版本中CMS的變化
JDK9新特性:CMS被標記為Deprecate了(JEP291)
如果對JDK9及以上版本的HotSpot虛擬機使用參數(shù)-XX:+UseConcMarkSweepGC來開啟CMS收集器的話,用戶會收到一個警告信息,提示CMS未來將會被廢棄。但還可以用。
JDK14新特性:刪除CMS垃圾回收器(JEP363)
移除了CMS垃圾收集器,如果在JDK14中使用XX:+UseConcMarkSweepGC的話,JVM不會報錯,只是給出一個warning信息,但是不會exit。JVM會自動回退以默認GC方式(G1 GC)啟動JVM
G1回收器:區(qū)域化分代式
既然我們已經有了前面幾個強大的GC,為什么還要發(fā)布Garbage First(G1)?
原因就在于應用程序所應對的業(yè)務越來越龐大、復雜,用戶越來越多,沒有GC就不能保證應用程序正常進行,而經常造成STW的GC又跟不上實際的需求,所以才會不斷地嘗試對GC進行優(yōu)化。G1(Garbage-First)垃圾回收器是在Java7 update4之后引入的一個新的垃圾回收器,是當今收集器技術發(fā)展的最前沿成果之一。
與此同時,為了適應現(xiàn)在不斷擴大的內存和不斷增加的處理器數(shù)量,進一步降低暫停時間(pause time),同時兼顧良好的吞吐量。
官方給G1設定的目標是在延遲可控的情況下獲得盡可能高的吞吐量,所以才擔當起“全功能收集器”的重任與期望。
為什么名字叫 Garbage First(G1)呢?
因為G1是一個并行回收器,它把堆內存分割為很多不相關的區(qū)域(Region)(物理上不連續(xù)的)。使用不同的Region來表示Eden、幸存者0區(qū),幸存者1區(qū),老年代等。
G1 GC有計劃地避免在整個Java堆中進行全區(qū)域的垃圾收集。G1跟蹤各個Region里面的垃圾堆積的價值大小(回收所獲得的空間大小以及回收所需時間的經驗值),在后臺維護一個優(yōu)先列表,每次根據允許的收集時間,優(yōu)先回收價值最大的Region。
由于這種方式的側重點在于回收垃圾最大量的區(qū)間(Region),所以我們給G1一個名字:垃圾優(yōu)先(Garbage First)。
G1(Garbage-First)是一款面向服務端應用的垃圾收集器,主要針對配備多核CPU及大容量內存的機器,以極高概率滿足GC停頓時間的同時,還兼具高吞吐量的性能特征。
在JDK1.7版本正式啟用,移除了Experimenta1的標識,是JDK9以后的默認垃圾回收器,取代了CMS回收器以及Parallel+Parallel old組合。被orac1e官方稱為**“全功能的垃圾收集器**”。
與此同時,CMS已經在JDK9中被標記為廢棄(deprecated)。在jdk8中還不是默認的垃圾回收器,需要使用**-XX:+UseG1GC**來啟用。
G1垃圾收集器的優(yōu)點
與其他GC收集器相比,G1使用了全新的分區(qū)算法,其特點如下所示:
并行與并發(fā)
- 并行性:G1在回收期間,可以有多個GC線程同時工作,有效利用多核計算能力。此時用戶線程STW
- 并發(fā)性:G1擁有與應用程序交替執(zhí)行的能力,部分工作可以和應用程序同時執(zhí)行,因此,一般來說,不會在整個回收階段發(fā)生完全阻塞應用程序的情況
分代收集
- 從分代上看,G1依然屬于分代型垃圾回收器,它會區(qū)分年輕代和老年代,年輕代依然有Eden區(qū)和Survivor區(qū)。但從堆的結構上看,它不要求整個Eden區(qū)、年輕代或者老年代都是連續(xù)的,也不再堅持固定大小和固定數(shù)量。
- 將堆空間分為若干個區(qū)域(Region),這些區(qū)域中包含了邏輯上的年輕代和老年代。
- 和之前的各類回收器不同,它同時兼顧年輕代和老年代。對比其他回收器,或者工作在年輕代,或者工作在老年代;
G1所謂的分代,已經不是下面這樣的了
而是這樣的一個區(qū)域
空間整合
- CMS:“標記-清除”算法、內存碎片、若干次GC后進行一次碎片整理
- G1將內存劃分為一個個的region。內存的回收是以region作為基本單位的。Region之間是復制算法,但整體上實際可看作是標記-壓縮(Mark-Compact)算法,兩種算法都可以避免內存碎片。這種特性有利于程序長時間運行,分配大對象時不會因為無法找到連續(xù)內存空間而提前觸發(fā)下一次GC。尤其是當Java堆非常大的時候,G1的優(yōu)勢更加明顯。
可預測的停頓時間模型(即:軟實時soft real-time)
這是G1相對于CMS的另一大優(yōu)勢,G1除了追求低停頓外,還能建立可預測的停頓時間模型,能讓使用者明確指定在一個長度為M毫秒的時間片段內,消耗在垃圾收集上的時間不得超過N毫秒。
- 由于分區(qū)的原因,G1可以只選取部分區(qū)域進行內存回收,這樣縮小了回收的范圍,因此對于全局停頓情況的發(fā)生也能得到較好的控制。
- G1跟蹤各個Region里面的垃圾堆積的價值大小(回收所獲得的空間大小以及回收所需時間的經驗值),在后臺維護一個優(yōu)先列表,每次根據允許的收集時間,優(yōu)先回收價值最大的Region。保證了G1收集器在有限的時間內可以獲取盡可能高的收集效率。
- 相比于CMS GC,G1未必能做到CMS在最好情況下的延時停頓,但是最差情況要好很多。
G1垃圾收集器的缺點
相較于CMS,G1還不具備全方位、壓倒性優(yōu)勢。比如在用戶程序運行過程中,G1無論是為了垃圾收集產生的內存占用(Footprint)還是程序運行時的額外執(zhí)行負載(overload)都要比CMS要高。(G1要占用額外的內存空間)
從經驗上來說,在小內存應用上CMS的表現(xiàn)大概率會優(yōu)于G1,而G1在大內存應用上則發(fā)揮其優(yōu)勢。平衡點在6-8GB之間。
G1參數(shù)設置
- -XX:+UseG1GC:手動指定使用G1垃圾收集器執(zhí)行內存回收任務
- -XX:G1HeapRegionSize設置每個Region的大小。值是2的冪,范圍是1MB到32MB之間,目標是根據最小的Java堆大小劃分出約2048個區(qū)域。默認是堆內存的1/2000。
- -XX:MaxGCPauseMillis 設置期望達到的最大Gc停頓時間指標(JVM會盡力實現(xiàn),但不保證達到)。默認值是200ms
- -XX:+ParallelGcThread 設置STW工作線程數(shù)的值。最多設置為8
- -XX:ConcGCThreads 設置并發(fā)標記的線程數(shù)。將n設置為并行垃圾回收線程數(shù)(ParallelGcThreads)的1/4左右。
- -XX:InitiatingHeapoccupancyPercent 設置觸發(fā)并發(fā)Gc周期的Java堆占用率閾值。超過此值,就觸發(fā)GC。默認值是45。
并行指的是GC線程同時執(zhí)行,是有STW的,并發(fā)是指用戶線程和GC線程同時執(zhí)行,沒有STW
G1收集器的常見操作步驟
G1的設計原則就是簡化JVM性能調優(yōu),開發(fā)人員只需要簡單的三步即可完成調優(yōu):
- 第一步:開啟G1垃圾收集器
- 第二步:設置堆的最大內存
- 第三步:設置最大的停頓時間
G1中提供了三種垃圾回收模式:YoungGC、Mixed GC和FullGC,在不同的條件下被觸發(fā)。
G1收集器的適用場景
面向服務端應用,針對具有大內存、多處理器的機器。(在普通大小的堆里表現(xiàn)并不驚喜)
最主要的應用是需要低GC延遲,并具有大堆的應用程序提供解決方案;
- 如:在堆大小約6GB或更大時,可預測的暫停時間可以低于e.5秒;(G1通過每次只清理一部分而不是全部的Region的增量式清理來保證每次GC停頓時間不會過長)。
用來替換掉JDK1.5中的CMS收集器;在下面的情況時,使用G1可能比CMS好:
- 超過50%的Java堆被活動數(shù)據占用;
- 對象分配頻率或年代提升頻率變化很大;
- GC停頓時間過長(長于e.5至1秒)
HotSpot垃圾收集器里,除了G1以外,其他的垃圾收集器使用內置的JVM線程執(zhí)行GC的多線程操作,而G1 GC可以采用應用線程承擔后臺運行的GC工作,即當JVM的GC線程處理速度慢時,系統(tǒng)會調用應用程序線程幫助加速垃圾回收過程。
分區(qū)Region:化整為零
使用G1收集器時,它將整個Java堆劃分成約2048個大小相同的獨立Region塊,每個Region塊大小根據堆空間的實際大小而定,整體被控制在1MB到32MB之間,且為2的N次冪,即1MB,2MB,4MB,8MB,16MB,32MB。可以通過-XX:G1HeapRegionsize設定。所有的Region大小相同,且在JVM生命周期內不會被改變。
雖然還保留有新生代和老年代的概念,但新生代和老年代不再是物理隔離的了,它們都是一部分Region(不需要連續(xù))的集合。通過Region的動態(tài)分配方式實現(xiàn)邏輯上的連續(xù)。
-
一個region有可能屬于Eden,Survivor或者old/Tenured內存區(qū)域。但是一個region只可能屬于一個角色。圖中的E表示該region屬于Eden內存區(qū)域,s表示屬于survivor內存區(qū)域,o表示屬于0ld內存區(qū)域。圖中空白的表示未使用的內存空間。(注意:region的屬性是可變的,不是一成不變的。如一個Eden region,他經過young gc后,對象進到survivor region里,它本身則沒有數(shù)據,那就將它放在空閑列表里,可能后面GC就又把它作為old region使用分配對象空間)
-
G1垃圾收集器還增加了一種新的內存區(qū)域,叫做Humongous內存區(qū)域,如圖中的H塊。主要用于存儲大對象,如果超過1.5個region,就放到H。
**設置H的原因:**對于堆中的對象,默認直接會被分配到老年代,但是如果它是一個長期存在的大對象就會對垃圾收集器造成負面影響。為了解決這個問題,G1劃分了一個Humongous區(qū),它用來專門存放大對象。如果一個H區(qū)裝不下一個大對象,那么G1會尋找連續(xù)的H區(qū)來存儲。為了能找到連續(xù)的H區(qū),有時候不得不啟動FullGC。G1的大多數(shù)行為都把H區(qū)作為老年代的一部分來看待。
每個Region都是通過指針碰撞來分配空間
G1垃圾回收器的回收過程
G1GC的垃圾回收過程主要包括如下三個環(huán)節(jié):
- 年輕代GC(Young GC)
- 老年代并發(fā)標記過程(Concurrent Marking)
- 混合回收(Mixed GC)
(如果需要,單線程、獨占式、高強度的Full GC還是繼續(xù)存在的。它針對GC的評估失敗提供了一種失敗保護機制,即強力回收。)
順時針,young gc->young gc+concurrent mark->Mixed GC順序,進行垃圾回收。
應用程序分配內存,當年輕代的Eden區(qū)用盡時開始年輕代回收過程;G1的年輕代收集階段是一個并行的獨占式收集器。在年輕代回收期,G1GC暫停所有應用程序線程,啟動多線程執(zhí)行年輕代回收。然后從年輕代區(qū)間移動存活對象到Survivor區(qū)間或者老年區(qū)間,也有可能是兩個區(qū)間都會涉及。
當堆內存使用達到一定值(默認45%)時,開始老年代并發(fā)標記過程。
標記完成馬上開始混合回收過程。對于一個混合回收期,G1GC從老年區(qū)間移動存活對象到空閑區(qū)間,這些空閑區(qū)間也就成為了老年代的一部分。和年輕代不同,老年代G1回收器和其他GC不同,G1的老年代回收器不需要整個老年代被回收,一次只需要掃描/回收一小部分老年代的Region就可以了(按照性價比回收)。同時,這個老年代Region是和年輕代一起被回收的。
舉個例子:一個Web服務器,Java進程最大堆內存為4G,每分鐘響應1500個請求,每45秒鐘會新分配大約2G的內存。G1會每45秒鐘進行一次年輕代回收,每31個小時整個堆的使用率會達到45%,會開始老年代并發(fā)標記過程,標記完成后開始四到五次的混合回收。
Remembered Set(記憶集——RSet)
一個對象被不同區(qū)域引用的問題
一個Region不可能是孤立的,一個Region中的對象可能被其他任意Region中對象引用,判斷對象存活時,是否需要掃描整個Java堆才能保證準確?
在其他的分代收集器,也存在這樣的問題(而G1更突出)回收新生代也不得不同時掃描老年代?這樣的話會降低MinorGC的效率;
解決方法:
無論G1還是其他分代收集器,JVM都是使用Remembered Set來避免全局掃描:
每個Region都有一個對應的Remembered Set;每次Reference類型數(shù)據寫操作時,都會產生一個Write Barrier暫時中斷操作;
然后檢查將要寫入的引用指向的對象是否和該Reference類型數(shù)據在不同的Region(其他收集器:檢查老年代對象是否引用了新生代對象);如果不同,通過CardTable把相關引用信息記錄到引用指向對象的所在Region對應的Remembered Set中;當進行垃圾收集時,在GC根節(jié)點的枚舉范圍加入Remembered Set;就可以保證不進行全局掃描,也不會有遺漏。
G1回收過程-年輕代GC
JVM啟動時,G1先準備好Eden區(qū),程序在運行過程中不斷創(chuàng)建對象到Eden區(qū),當Eden空間耗盡時,G1會啟動一次年輕代垃圾回收過程。
YGC時,首先G1停止應用程序的執(zhí)行(Stop-The-World),G1創(chuàng)建回收集(Collection Set),回收集是指需要被回收的內存分段的集合,年輕代回收過程的回收集包含年輕代Eden區(qū)和Survivor區(qū)所有的內存分段。
然后開始如下回收過程:
- 第一階段,掃描根
根是指static變量指向的對象,正在執(zhí)行的方法調用鏈條上的局部變量等。根引用連同RSet記錄的外部引用作為掃描存活對象的入口。
- 第二階段,更新RSet
處理dirty card queue(見備注)中的card,更新RSet。此階段完成后**,RSet可以準確的反映老年代對所在的內存分段中對象的引用。**
- 第三階段,處理RSet
識別被老年代對象指向的Eden中的對象,這些被指向的Eden中的對象被認為是存活的對象。
- 第四階段,復制對象。
此階段,對象樹被遍歷,Eden區(qū)內存段中存活的對象會被復制到Survivor區(qū)中空的內存分段,Survivor區(qū)內存段中存活的對象如果年齡未達閾值,年齡會加1,達到閥值會被會被復制到o1d區(qū)中空的內存分段。如果Survivor空間不夠,Eden空間的部分數(shù)據會直接晉升到老年代空間。
- 第五階段,處理引用
處理Soft,Weak,Phantom,Final,JNI Weak 等引用。最終Eden空間的數(shù)據為空,GC停止工作,而目標內存中的對象都是連續(xù)存儲的,沒有碎片,所以復制過程可以達到內存整理的效果,減少碎片。
G1回收過程-并發(fā)標記過程
- 初始標記階段:標記從根節(jié)點直接可達的對象。這個階段是STW的,并且會觸發(fā)一次年輕代GC。
- 根區(qū)域掃描(Root Region Scanning):G1 Gc掃描survivor區(qū)直接可達的老年代區(qū)域對象,并標記被引用的對象。這一過程必須在youngGC之前完成。
- 并發(fā)標記(Concurrent Marking):在整個堆中進行并發(fā)標記(和應用程序并發(fā)執(zhí)行),此過程可能被youngGC中斷。在并發(fā)標記階段,若發(fā)現(xiàn)區(qū)域對象中的所有對象都是垃圾,那這個區(qū)域會被立即回收。同時,并發(fā)標記過程中,會計算每個區(qū)域的對象活性(區(qū)域中存活對象的比例)。
- 再次標記(Remark):由于應用程序持續(xù)進行,需要修正上一次的標記結果。是STW的。G1中采用了比CMS更快的初始快照算法:snapshot-at-the-beginning(SATB)。
- 獨占清理(cleanup,STW):計算各個區(qū)域的存活對象和GC回收比例,并進行排序,識別可以混合回收的區(qū)域。為下階段做鋪墊。是STW的。這個階段并不會實際上去做垃圾的收集
- 并發(fā)清理階段:識別并清理完全空閑的區(qū)域。
G1回收過程 - 混合回收
當越來越多的對象晉升到老年代o1d region時,為了避免堆內存被耗盡,虛擬機會觸發(fā)一個混合的垃圾收集器,即Mixed GC,該算法并不是一個old GC,除了回收整個Young Region,還會回收一部分的old Region。這里需要注意:是一部分老年代,而不是全部老年代。可以選擇哪些o1d Region進行收集,從而可以對垃圾回收的耗時時間進行控制。也要注意的是Mixed GC并不是Full GC。
并發(fā)標記結束以后,老年代中百分百為垃圾的內存分段被回收了,部分為垃圾的內存分段被計算了出來。默認情況下,這些老年代的內存分段會分8次(可以通過-XX:G1MixedGCCountTarget設置)被回收
混合回收的回收集(Collection Set)包括八分之一的老年代內存分段,Eden區(qū)內存分段,Survivor區(qū)內存分段。混合回收的算法和年輕代回收的算法完全一樣,只是回收集多了老年代的內存分段。具體過程請參考上面的年輕代回收過程。
由于老年代中的內存分段默認分8次回收,G1會優(yōu)先回收垃圾多的內存分段。垃圾占內存分段比例越高的,越會被先回收。并且有一個閾值會決定內存分段是否被回收,
XX:G1MixedGCLiveThresholdPercent,默認為65%,意思是垃圾占內存分段比例要達到65%才會被回收。如果垃圾占比太低,意味著存活的對象占比高,在復制的時候會花費更多的時間。
混合回收并不一定要進行8次。有一個閾值-XX:G1HeapWastePercent,默認值為10%,意思是允許整個堆內存中有10%的空間被浪費,意味著如果發(fā)現(xiàn)可以回收的垃圾占堆內存的比例低于10%,則不再進行混合回收。因為GC會花費很多的時間但是回收到的內存卻很少。
G1回收可選的過程4 - Full GC
G1的初衷就是要避免Full GC的出現(xiàn)。但是如果上述方式不能正常工作,G1會停止應用程序的執(zhí)行(stop-The-world),使用單線程的內存回收算法進行垃圾回收,性能會非常差,應用程序停頓時間會很長。
要避免Full GC的發(fā)生,一旦發(fā)生需要進行調整。什么時候會發(fā)生Full GC呢?比如堆內存太小,當G1在復制存活對象的時候沒有空的內存分段可用,則會回退到full gc,這種情況可以通過增大內存解決。
導致G1Full GC的原因可能有兩個:
- EVacuation的時候沒有足夠的to-space來存放晉升的對象;
- 并發(fā)處理過程完成之前空間耗盡。
G1回收的優(yōu)化建議
從oracle官方透露出來的信息可獲知,回收階段(Evacuation)其實本也有想過設計成與用戶程序一起并發(fā)執(zhí)行,但這件事情做起來比較復雜,考慮到G1只是回一部分Region,停頓時間是用戶可控制的,所以并不迫切去實現(xiàn),而選擇把這個特性放到了G1之后出現(xiàn)的低延遲垃圾收集器(即ZGC)中。另外,還考慮到G1不是僅僅面向低延遲,停頓用戶線程能夠最大幅度提高垃圾收集效率,為了保證吞吐量所以才選擇了完全暫停用戶線程的實現(xiàn)方案。
年輕代大小
- 避免使用-Xmn或-XX:NewRatio等相關選項顯式設置年輕代大小
- 固定年輕代的大小會覆蓋
暫停時間目標不要太過嚴苛
- G1 GC的吞吐量目標是90%的應用程序時間和10%的垃圾回收時間
- 評估G1 GC的吞吐量時,暫停時間目標不要太嚴苛。目標太過嚴苛表示你愿意承受更多的垃圾回收開銷,而這些會直接影響到吞吐量。
垃圾回收器總結
截止JDK1.8,一共有7款不同的垃圾收集器。每一款的垃圾收集器都有不同的特點,在具體使用的時候,需要根據具體的情況選用不同的垃圾收集器。
- 如果你想要最小化地使用內存和并行開銷,請選Serial GC;(年輕代:Serial GC+Serial Old:老年代)
- 如果你想要最大化應用程序的吞吐量,請選Parallel GC;(年輕代:Parallel GC+Parallel Old:老年代)
- 如果你想要最小化GC的中斷或停頓時間,請選CMS GC。(年輕代:ParNew GC+CMS GC:老年代)
- 串行: Serial Serial Old
- 并行:ParNew Parallel Parallel Old
- 并發(fā):CMS
- 并發(fā)、并行:G1
GC發(fā)展階段:Seria l=> Parallel(并行)=> CMS(并發(fā))=> G1 => ZGC
不同廠商、不同版本的虛擬機實現(xiàn)差距比較大。HotSpot虛擬機在JDK7/8后所有收集器及組合如下圖
怎么選擇垃圾回收器
Java垃圾收集器的配置對于JVM優(yōu)化來說是一個很重要的選擇,選擇合適的垃圾收集器可以讓JVM的性能有一個很大的提升。怎么選擇垃圾收集器?
- 優(yōu)先調整堆的大小讓JVM自適應完成。
- 如果內存小于100M,使用串行收集器
- 如果是單核、單機程序,并且沒有停頓時間的要求,串行收集器
- 如果是多CPU、需要高吞吐量、允許停頓時間超過1秒,選擇并行或者JVM自己選擇
- 如果是多CPU、追求低停頓時間,需快速響應(比如延遲不能超過1秒,如互聯(lián)網應用),使用并發(fā)收集器
- 官方推薦G1,性能高。現(xiàn)在互聯(lián)網的項目,基本都是使用G1。
最后需要明確一個觀點:
- 沒有最好的收集器,更沒有萬能的收集
- 調優(yōu)永遠是針對特定場景、特定需求,不存在一勞永逸的收集器
面試
對于垃圾收集,面試官可以循序漸進從理論、實踐各種角度深入,也未必是要求面試者什么都懂。但如果你懂得原理,一定會成為面試中的加分項。
這里較通用、基礎性的部分如下:
垃圾收集的算法有哪些?如何判斷一個對象是否可以回收?
垃圾收集器工作的基本流程。
另外,大家需要多關注垃圾回收器這一章的各種常用的參數(shù)(主要堆內存和GC方面)
GC日志分析
通過閱讀GC日志,我們可以了解Java虛擬機內存分配與回收策略。
內存分配與垃圾回收的參數(shù)列表
- -XX:+PrintGC輸出GC日志。類似:-verbose:gc
- -XX:+PrintGCDetails輸出GC的詳細日志
- -XX:+PrintGCTimestamps 輸出GC的時間戳(以基準時間的形式)
- -XX:+PrintGCDatestamps 輸出GC的時間戳(以日期的形式,如2013-05-04T21:53:59.234+0800)
- -XX:+PrintHeapAtGC在進行GC的前后打印出堆的信息
- -Xloggc:…/logs/gc.log日志文件的輸出路徑(要在當前工程下創(chuàng)建logs目錄)
verbose:gc
打開GC日志
-verbose:gc這個只會顯示總的GC堆的變化,如下:
參數(shù)解析
PrintGCDetails
打開GC日志
-verbose:gc -XX:+PrintGCDetails輸入信息如下
參數(shù)解析
補充
-
[GC"和"[Full GC"說明了這次垃圾收集的停頓類型,如果有"Full"則說明GC發(fā)生了"stop The World"
-
使用Seria1收集器在新生代的名字是Default New Generation,因此顯示的是"[DefNew"
-
使用ParNew收集器在新生代的名字會變成"[ParNew",意思是"Parallel New Generation"
-
使用Paralle1 scavenge收集器在新生代的名字是”[PSYoungGen"
-
老年代的收集和新生代道理一樣,名字也是收集器決定的
-
使用G1收集器的話,會顯示為"garbage-first heap"
-
Allocation Failure表明本次引起GC的原因是因為在年輕代中沒有足夠的空間能夠存儲新的數(shù)據了。
-
[PSYoungGen:5986K->696K(8704K)]5986K->704K(9216K)中括號內:GC回收前年輕代大小,回收后大小,(年輕代總大小)括號外:GC回收前年輕代和老年代大小,回收后大小,(年輕代和老年代總大小)
-
user代表用戶態(tài)回收耗時,sys內核態(tài)回收耗時,real實際耗時。由于多核的原因,時間總和可能會超過real時間
Young GC圖片
Full GC圖片、
GC回收舉例
我們編寫一個程序,用來說明GC收集的過程
/*** GC垃圾收集過程*/ public class GCUseTest {static final Integer _1MB = 1024 * 1024;public static void main(String[] args) {byte [] allocation1, allocation2, allocation3, allocation4;allocation1 = new byte[2 *_1MB];allocation2 = new byte[2 *_1MB];allocation3 = new byte[2 *_1MB];allocation4 = new byte[4 *_1MB];} }我們設置JVM啟動參數(shù)
-Xms10m -Xmx10m -XX:+PrintGCDetailsJDK7中:
首先我們會將3個2M的數(shù)組存放到Eden區(qū),然后后面4M的數(shù)組來了后,將無法存儲,因為Eden區(qū)只剩下2M的剩余空間了,那么將會進行一次Young GC操作,將原來Eden區(qū)的內容,存放到Survivor區(qū),但是Survivor區(qū)也存放不下,那么就會直接晉級存入Old 區(qū)
然后我們將4M對象存入到Eden區(qū)中
JDK8中:
大對象直接進老年代,Eden中三個2M的不動,新進來的4M在Eden中放不下,直接進老年代。
可以用一些工具去分析這些GC日志
常用的日志分析工具有:GCViewer、GCEasy、GCHisto、GCLogViewer、Hpjmeter、garbagecat等
GCViewer
GC easy
垃圾回收器的新發(fā)展
GC仍然處于飛速發(fā)展之中,目前的默認選項G1 GC在不斷的進行改進,很多我們原來認為的缺點,例如串行的Full GC、Card Table掃描的低效等,都已經被大幅改進,例如,JDK10以后,Full GC已經是并行運行,在很多場景下,其表現(xiàn)還略優(yōu)于Parallel GC的并行Full GC實現(xiàn)。
即使是SerialGC,雖然比較古老,但是簡單的設計和實現(xiàn)未必就是過時的,它本身的開銷,不管是GC相關數(shù)據結構的開銷,還是線程的開銷,都是非常小的,所以隨著云計算的興起,在serverless等新的應用場景下,Serial Gc找到了新的舞臺。
比較不幸的是CMSGC,因為其算法的理論缺陷等原因,雖然現(xiàn)在還有非常大的用戶群體,但在JDK9中已經被標記為廢棄,并在JDK14版本中移除
Epsilon:A No-Op GarbageCollector(Epsilon垃圾回收器,"No-Op(無操作)"回收器)http://openidk.iava.net/iep s/318
- 只做內存分配,不做回收
ZGC:A Scalable Low-Latency Garbage Collector(Experimental)(ZGC:可伸縮的低延遲垃圾回收器,處于實驗性階段)
現(xiàn)在G1回收器已成為默認回收器好幾年了。我們還看到了引入了兩個新的收集器:ZGC(JDK11出現(xiàn))和Shenandoah(Open JDK12)
主打特點:低停頓時間
Open JDK12的Shenandoash GC
Open JDK12的shenandoash GC:低停頓時間的GC(實驗性)
Shenandoah,無疑是眾多GC中最孤獨的一個。是第一款不由oracle公司團隊領導開發(fā)的Hotspot垃圾收集器。不可避免的受到官方的排擠。比如號稱openJDK和OracleJDk沒有區(qū)別的Oracle公司仍拒絕在oracleJDK12中支持Shenandoah。
Shenandoah垃圾回收器最初由RedHat進行的一項垃圾收集器研究項目Pauseless GC的實現(xiàn),旨在針對JVM上的內存回收實現(xiàn)低停頓的需求。在2014年貢獻給OpenJDK。
Red Hat研發(fā)Shenandoah團隊對外宣稱,Shenandoah垃圾回收器的暫停時間與堆大小無關,這意味著無論將堆設置為200MB還是200GB,99.9%的目標都可以把垃圾收集的停頓時間限制在十毫秒以內。不過實際使用性能將取決于實際工作堆的大小和工作負載。
這是RedHat在2016年發(fā)表的論文數(shù)據,測試內容是使用Es對200GB的維基百科數(shù)據進行索引。從結果看:
停頓時間比其他幾款收集器確實有了質的飛躍,但也未實現(xiàn)最大停頓時間控制在十毫秒以內的目標。
而吞吐量方面出現(xiàn)了明顯的下降,總運行時間是所有測試收集器里最長的。
總結
- shenandoah Gc的弱項:高運行負擔下的吞吐量下降。
- shenandoah GC的強項:低延遲時間。
革命性的ZGC(JDK14新特性)
zGC與shenandoah目標高度相似,在盡可能對吞吐量影響不大的前提下,實現(xiàn)在任意堆內存大小下都可以把垃圾收集的停頓時間限制在十毫秒以內的低延遲。
《深入理解Java虛擬機》一書中這樣定義ZGC:ZGC收集器是一款基于Region內存布局的,(暫時)不設分代的,使用了讀屏障、染色指針和內存多重映射等技術來實現(xiàn)可并發(fā)的標記-壓縮算法的,以低延遲為首要目標的一款垃圾收集器。
ZGC的工作過程可以分為4個階段:并發(fā)標記 - 并發(fā)預備重分配 - 并發(fā)重分配 - 并發(fā)重映射 等。
ZGC幾乎在所有地方并發(fā)執(zhí)行的,除了初始標記的是STW的。所以停頓時間幾乎就耗費在初始標記上,這部分的實際時間是非常少的。
停頓時間對比
雖然ZGC還在試驗狀態(tài),沒有完成所有特性,但此時性能已經相當亮眼,用“令人震驚、革命性”來形容,不為過。
未來將在服務端、大內存、低延遲應用的首選垃圾收集器。
JDK14之前,ZGC僅Linux才支持。
盡管許多使用zGc的用戶都使用類Linux的環(huán)境,但在Windows和macos上,人們也需要zGC進行開發(fā)部署和測試。許多桌面應用也可以從ZGC中受益。因此,2GC特性被移植到了Windows和macos上。
現(xiàn)在mac或Windows上也能使用ZGC了,示例如下:
-XX:+UnlockExperimentalVMOptions-XX:+UseZGCAliGC
AliGC是阿里巴巴JVM團隊基于G1算法,面向大堆(LargeHeap)應用場景。指定場景下的對比:
當然,其它廠商也提供了各種別具一格的GC實現(xiàn),例如比較有名的低延遲GC Zing
總結
- 上一篇: 16-垃圾回收相关概念
- 下一篇: JUC学习笔记及拓展