《深入理解Java虚拟机》笔记3——7种垃圾收集器
如果說收集算法是內(nèi)存回收的方法論,那么垃圾收集器就是內(nèi)存回收的具體實現(xiàn)。**Java虛擬機規(guī)范中對垃圾收集器應(yīng)該如何實現(xiàn)并沒有任何規(guī)定,因此不同的廠商、版本的虛擬機所提供的垃圾收集器都可能會有很大差別,并且一般都會提供參數(shù)供用戶根據(jù)自己的應(yīng)用特點和要求組合出各個年代所使用的收集器。接下來討論的收集器基于JDK1.7 Update 14 之后的HotSpot虛擬機(在此版本中正式提供了商用的G1收集器,之前G1仍處于實驗狀態(tài)),該虛擬機包含的所有收集器如下圖所示:
?
以上是 HotSpot 虛擬機中的 7 個垃圾收集器,連線表示垃圾收集器可以配合使用。
- 單線程與多線程:單線程指的是垃圾收集器只使用一個線程進(jìn)行收集,而多線程使用多個線程;
- 串行與并行:串行指的是垃圾收集器與用戶程序交替執(zhí)行,這意味著在執(zhí)行垃圾收集的時候需要停頓用戶程序;并行指的是垃圾收集器和用戶程序同時執(zhí)行。除了 CMS 和 G1 之外,其它垃圾收集器都是以串行的方式執(zhí)行。
相關(guān)概念
并行和并發(fā)
- 并行(Parallel):指多條垃圾收集線程并行工作,但此時用戶線程仍然處于等待狀態(tài)。
- 并發(fā)(Concurrent):指用戶線程與垃圾收集線程同時執(zhí)行(但不一定是并行的,可能會交替執(zhí)行),用戶程序在繼續(xù)運行。而垃圾收集程序運行在另一個CPU上。
吞吐量(Throughput)
吞吐量就是CPU用于運行用戶代碼的時間與CPU總消耗時間的比值,即
吞吐量 = 運行用戶代碼時間 /(運行用戶代碼時間 + 垃圾收集時間)。
假設(shè)虛擬機總共運行了100分鐘,其中垃圾收集花掉1分鐘,那吞吐量就是99%。
Minor GC 和 Full GC
- 新生代GC(Minor GC):指發(fā)生在新生代的垃圾收集動作,因為Java對象大多都具備朝生夕滅的特性,所以Minor GC非常頻繁,一般回收速度也比較快。具體原理見上一篇文章。
- 老年代GC(Major GC / Full GC):指發(fā)生在老年代的GC,出現(xiàn)了Major GC,經(jīng)常會伴隨至少一次的Minor GC(但非絕對的,在Parallel Scavenge收集器的收集策略里就有直接進(jìn)行Major GC的策略選擇過程)。Major GC的速度一般會比Minor GC慢10倍以上。
各收集器闡述
1. Serial 收集器
?
Serial 翻譯為串行,也就是說它以串行的方式執(zhí)行。
它是單線程的收集器,只會使用一個線程進(jìn)行垃圾收集工作。
它的優(yōu)點是簡單高效,對于單個 CPU 環(huán)境來說,由于沒有線程交互的開銷,因此擁有最高的單線程收集效率。
它是 Client 模式下的默認(rèn)新生代收集器,因為在該應(yīng)用場景下,分配給虛擬機管理的內(nèi)存一般來說不會很大。Serial 收集器收集幾十兆甚至一兩百兆的新生代停頓時間可以控制在一百多毫秒以內(nèi),只要不是太頻繁,這點停頓是可以接受的。
2. ParNew 收集器
?
它是 Serial 收集器的多線程版本。
是 Server 模式下的虛擬機首選新生代收集器,除了性能原因外,主要是因為除了 Serial 收集器,只有它能與 CMS 收集器配合工作。
默認(rèn)開啟的線程數(shù)量與 CPU 數(shù)量相同,可以使用 -XX:ParallelGCThreads 參數(shù)來設(shè)置線程數(shù)。
3. Parallel Scavenge 收集器
與 ParNew 一樣是多線程收集器。
其它收集器關(guān)注點是盡可能縮短垃圾收集時用戶線程的停頓時間,而它的目標(biāo)是達(dá)到一個可控制的吞吐量,它被稱為“吞吐量優(yōu)先”收集器。這里的吞吐量指 CPU 用于運行用戶代碼的時間占總時間的比值。
停頓時間越短就越適合需要與用戶交互的程序,良好的響應(yīng)速度能提升用戶體驗。而高吞吐量則可以高效率地利用 CPU 時間,盡快完成程序的運算任務(wù),適合在后臺運算而不需要太多交互的任務(wù)。
縮短停頓時間是以犧牲吞吐量和新生代空間來換取的:新生代空間變小,垃圾回收變得頻繁,導(dǎo)致吞吐量下降。
可以通過一個開關(guān)參數(shù)打開 GC 自適應(yīng)的調(diào)節(jié)策略(GC Ergonomics),就不需要手工指定新生代的大小(-Xmn)、Eden 和 Survivor 區(qū)的比例、晉升老年代對象年齡等細(xì)節(jié)參數(shù)了。虛擬機會根據(jù)當(dāng)前系統(tǒng)的運行情況收集性能監(jiān)控信息,動態(tài)調(diào)整這些參數(shù)以提供最合適的停頓時間或者最大的吞吐量。
4. Serial Old 收集器
?
是 Serial 收集器的老年代版本,也是給 Client 模式下的虛擬機使用。如果用在 Server 模式下,它有兩大用途:
- 在 JDK 1.5 以及之前版本(Parallel Old 誕生以前)中與 Parallel Scavenge 收集器搭配使用。
- 作為 CMS 收集器的后備預(yù)案,在并發(fā)收集發(fā)生 Concurrent Mode Failure 時使用。
5. Parallel Old 收集器
?
是 Parallel Scavenge 收集器的老年代版本。
在注重吞吐量以及 CPU 資源敏感的場合,都可以優(yōu)先考慮 Parallel Scavenge 加 Parallel Old 收集器。
6. CMS 收集器
?
CMS(Concurrent Mark Sweep),Mark Sweep 指的是標(biāo)記 - 清除算法。
分為以下四個流程:
- 初始標(biāo)記:僅僅只是標(biāo)記一下 GC Roots 能直接關(guān)聯(lián)到的對象,速度很快,需要停頓。
- 并發(fā)標(biāo)記:進(jìn)行 GC Roots Tracing 的過程,它在整個回收過程中耗時最長,不需要停頓。
- 重新標(biāo)記:為了修正并發(fā)標(biāo)記期間因用戶程序繼續(xù)運作而導(dǎo)致標(biāo)記產(chǎn)生變動的那一部分對象的標(biāo)記記錄,需要停頓。
- 并發(fā)清除:不需要停頓。
在整個過程中耗時最長的并發(fā)標(biāo)記和并發(fā)清除過程中,收集器線程都可以與用戶線程一起工作,不需要進(jìn)行停頓。
具有以下缺點:
- 吞吐量低:低停頓時間是以犧牲吞吐量為代價的,導(dǎo)致 CPU 利用率不夠高。
- 無法處理浮動垃圾,可能出現(xiàn) Concurrent Mode Failure。浮動垃圾是指并發(fā)清除階段由于用戶線程繼續(xù)運行而產(chǎn)生的垃圾,這部分垃圾只能到下一次 GC 時才能進(jìn)行回收。由于浮動垃圾的存在,因此需要預(yù)留出一部分內(nèi)存,意味著 CMS 收集不能像其它收集器那樣等待老年代快滿的時候再回收。如果預(yù)留的內(nèi)存不夠存放浮動垃圾,就會出現(xiàn) Concurrent Mode Failure,這時虛擬機將臨時啟用 Serial Old 來替代 CMS。
- 標(biāo)記 - 清除算法導(dǎo)致的空間碎片,往往出現(xiàn)老年代空間剩余,但無法找到足夠大連續(xù)空間來分配當(dāng)前對象,不得不提前觸發(fā)一次 Full GC。
7. G1 收集器
G1(Garbage-First),它是一款面向服務(wù)端應(yīng)用的垃圾收集器,在多 CPU 和大內(nèi)存的場景下有很好的性能。HotSpot 開發(fā)團(tuán)隊賦予它的使命是未來可以替換掉 CMS 收集器。
堆被分為新生代和老年代,其它收集器進(jìn)行收集的范圍都是整個新生代或者老年代,而 G1 可以直接對新生代和老年代一起回收。
?
G1 把堆劃分成多個大小相等的獨立區(qū)域(Region),新生代和老年代不再物理隔離。
?
通過引入 Region 的概念,從而將原來的一整塊內(nèi)存空間劃分成多個的小空間,使得每個小空間可以單獨進(jìn)行垃圾回收。這種劃分方法帶來了很大的靈活性,使得可預(yù)測的停頓時間模型成為可能。通過記錄每個 Region 垃圾回收時間以及回收所獲得的空間(這兩個值是通過過去回收的經(jīng)驗獲得),并維護(hù)一個優(yōu)先列表,每次根據(jù)允許的收集時間,優(yōu)先回收價值最大的 Region。
每個 Region 都有一個 Remembered Set,用來記錄該 Region 對象的引用對象所在的 Region。通過使用 Remembered Set,在做可達(dá)性分析的時候就可以避免全堆掃描。
?
如果不計算維護(hù) Remembered Set 的操作,G1 收集器的運作大致可劃分為以下幾個步驟:
- 初始標(biāo)記
- 并發(fā)標(biāo)記
- 最終標(biāo)記:為了修正在并發(fā)標(biāo)記期間因用戶程序繼續(xù)運作而導(dǎo)致標(biāo)記產(chǎn)生變動的那一部分標(biāo)記記錄,虛擬機將這段時間對象變化記錄在線程的 Remembered Set Logs 里面,最終標(biāo)記階段需要把 Remembered Set Logs 的數(shù)據(jù)合并到 Remembered Set 中。這階段需要停頓線程,但是可并行執(zhí)行。
- 篩選回收:首先對各個 Region 中的回收價值和成本進(jìn)行排序,根據(jù)用戶所期望的 GC 停頓時間來制定回收計劃。此階段其實也可以做到與用戶程序一起并發(fā)執(zhí)行,但是因為只回收一部分 Region,時間是用戶可控制的,而且停頓用戶線程將大幅度提高收集效率。
具備如下特點:
- 空間整合:整體來看是基于“標(biāo)記 - 整理”算法實現(xiàn)的收集器,從局部(兩個 Region 之間)上來看是基于“復(fù)制”算法實現(xiàn)的,這意味著運行期間不會產(chǎn)生內(nèi)存空間碎片。
- 可預(yù)測的停頓:能讓使用者明確指定在一個長度為 M 毫秒的時間片段內(nèi),消耗在 GC 上的時間不得超過 N 毫秒。
總結(jié)
| ? | Serial | 串行 | 新生代 | 復(fù)制算法 | 響應(yīng)速度優(yōu)先 | 單CPU環(huán)境下的Client模式 | ? |
| ? | Serial Old | 串行 | 老年代 | 標(biāo)記-整理 | 響應(yīng)速度優(yōu)先 | 單CPU環(huán)境下的Client模式、CMS的后備預(yù)案 | ? |
| ? | ParNew | 并行 | 新生代 | 復(fù)制算法 | 響應(yīng)速度優(yōu)先 | 多CPU環(huán)境時在Server模式下與CMS配合 | ? |
| ? | Parallel Scavenge | 并行 | 新生代 | 復(fù)制算法 | 吞吐量優(yōu)先 | 在后臺運算而不需要太多交互的任務(wù) | ? |
| ? | Parallel Old | 并行 | 老年代 | 標(biāo)記-整理 | 吞吐量優(yōu)先 | 在后臺運算而不需要太多交互的任務(wù) | ? |
| ? | CMS | 并發(fā) | 老年代 | 標(biāo)記-清除 | 響應(yīng)速度優(yōu)先 | 集中在互聯(lián)網(wǎng)站或B/S系統(tǒng)服務(wù)端上的Java應(yīng)用 | ? |
| ? | G1 | 并發(fā) | both | 標(biāo)記-整理+復(fù)制算法 | 響應(yīng)速度優(yōu)先 | 面向服務(wù)端應(yīng)用,將來替換CMS | ? |
參考資料
- 《深入理解Java虛擬機——JVM高級特性與最佳實踐》-周志明
- CS-Note——Java:java虛擬機
?
原文:https://meandni.com/2019/01/11/jvm_note3/
總結(jié)
以上是生活随笔為你收集整理的《深入理解Java虚拟机》笔记3——7种垃圾收集器的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《深入理解java虚拟机》笔记2——GC
- 下一篇: 《深入理解Java虚拟机》笔记4——类文