JVM基本原理
2019獨角獸企業重金招聘Python工程師標準>>>
Java技術體系模塊圖
全文純理論,比較枯燥,先上張圖感受下Java的強大:
什么是JVM?
JVM是Java Virtual Machine(Java虛擬機)的縮寫,JVM是一種用于計算設備的規范,它是一個虛構出來的計算機,是通過在實際的計算機上仿真模擬各種計算機功能來實現的。Java虛擬機包括一套字節碼指令集、一組寄存器、一個棧、一個垃圾回收堆和一個存儲方法域。 JVM屏蔽了與具體操作系統平臺相關的信息,使Java程序只需生成在Java虛擬機上運行的目標代碼(字節碼),就可以在多種平臺上不加修改地運行。JVM在執行字節碼時,實際上最終還是把字節碼解釋成具體平臺上的機器指令執行。
Java語言的一個非常重要的特點就是與平臺的無關性,而使用Java虛擬機是實現這一特點的關鍵。一般的高級語言如果要在不同的平臺上運行,至少需要編譯成不同的目標代碼。而引入Java虛擬機后,Java語言在不同平臺上運行時不需要重新編譯。這就是Java能夠“一次編譯,到處運行”的原因。
JRE/JDK/JVM是什么關系?
JRE(JavaRuntimeEnvironment,Java運行環境),也就是Java平臺。所有的Java 程序都要在JRE下才能運行。普通用戶只需要運行已開發好的java程序,安裝JRE即可。
JDK(Java Development Kit)是程序開發者用來編譯、調試java程序用的開發工具包。JDK的工具也是Java程序,也需要JRE才能運行。為了保持JDK的獨立性和完整性,在JDK的安裝過程中,JRE也是安裝的一部分。所以,在JDK的安裝目錄下有一個名為jre的目錄,用于存放JRE文件。
JVM(JavaVirtualMachine,Java虛擬機)是JRE的一部分。它是一個虛構出來的計算機,是通過在實際的計算機上仿真模擬各種計算機功能來實現的。JVM有自己完善的硬件架構,如處理器、堆棧、寄存器等,還具有相應的指令系統。Java語言最重要的特點就是跨平臺運行。使用JVM就是為了支持與操作系統無關,實現跨平臺。
JVM原理
JVM是java的核心和基礎,在java編譯器和os平臺之間的虛擬處理器。它是一種利用軟件方法實現的抽象的計算機基于下層的操作系統和硬件平臺,可以在上面執行java的字節碼程序。
java編譯器只要面向JVM,生成JVM能理解的代碼或字節碼文件。Java源文件經編譯成字節碼程序,通過JVM將每一條指令翻譯成不同平臺機器碼,通過特定平臺運行。
JVM執行程序的過程
JRE(java運行時環境)是由JVM構造的Java程序運行的環境,也是操作系統的一個應用程序的一個進程,因此他也有他自己的運行的生命周期,也有自己的代碼和數據空間。JVM在整個jdk中處于最底層,負責于操作系統的交互,用來屏蔽操作系統環境,提供一個完整的Java運行環境,因此也是虛擬計算機。
JVM工作原理
windows操作系統裝入JVM是通過jdk中Java.exe來完成,通過下面4步來完成JVM環境。
JVM裝入環境
裝載JVM.dll
通過第一步已經找到了JVM的路徑,Java通過LoadJavaVM來裝入JVM.dll文件。裝入工作很簡單就是調用Windows API函數。
LoadLibrary裝載JVM.dll動態連接庫,然后把JVM.dll中的導出函數JNI_CreateJavaVM和JNI_GetDefaultJavaVMInitArgs掛接到InvocationFunctions變量的CreateJavaVM和GetDefaultJavaVMInitArgs函數指針變量上。JVM.dll的裝載工作宣告完成。
初始化JVM,獲得本地調用接口
這樣就可以在Java中調用JVM的函數了。調用InvocationFunctions->CreateJavaVM也就是JVM中JNI_CreateJavaVM方法獲得JNIEnv結構的實例。
運行Java程序
Java程序有兩種方式一種是jar包,一種是class。
運行jar,Java -jar XXX.jar運行的時候,Java.exe調用GetMainClassName函數,該函數先獲得JNIEnv實例然后調用Java類Java.util.jar.JarFileJNIEnv中方法getManifest()并從返回的Manifest對象中取getAttributes("Main-Class")的值即jar包中文件:META-INF/MANIFEST.MF指定的Main-Class的主類名作為運行的主類。之后main函數會調用Java.c中LoadClass方法裝載該主類(使用JNIEnv實例的FindClass)。main函數直接調用Java.c中LoadClass方法裝載該類。
如果是執行class方法。main函數直接調用Java.c中LoadClass方法裝載該類。 然后main函數調用JNIEnv實例的GetStaticMethodID方法查找裝載的class主類中 “public static void main(String[] args)”方法,并判斷該方法是否為public方法,然后調用JNIEnv實例的 CallStaticVoidMethod方法調用該Java類的main方法。
JVM的生命周期
a)?啟動。啟動一個Java程序時,一個JVM實例就產生了,任何一個擁有public?static?void main(String[]?args)函數的class都可以作為JVM實例運行的起點。
b)?運行。main()作為該程序初始線程的起點,任何其他線程均由該線程啟動。JVM內部有兩種線程:守護線程和非守護線程,main()屬于非守護線程,守護線程通常由JVM自己使用,java程序也可以表明自己創建的線程是守護線程。
c)?消亡。當程序中的所有非守護線程都終止時,JVM才退出;若安全管理器允許,程序也可以使用Runtime類或者System.exit()來退出。
JVM的體系結構
兩張圖都是結構圖,比較類似。但是理解的角度不一樣,所以都拿出來看看。其中Java棧稱為虛擬機棧更合理一些。
- 類裝載器(ClassLoader)(用來裝載.class文件)
- 執行引擎(執行字節碼,或者執行本地方法)
- 運行時數據區(方法區、堆、java棧、PC寄存器、本地方法棧)
JVM運行時數據區
PC寄存器
PC寄存器是用于存儲每個線程下一步將執行的JVM指令,如該方法為native的,則PC寄存器中不存儲任何信息。也稱程序計數器?,是最小的一塊內存區域,它的作用是當前線程所執行的字節碼的行號指示器,在虛擬機的模型里,字節碼解釋器工作時就是通過改變這個計數器的值來選取下一條需要執行的字節碼指令,分支、循環、異常處理、線程恢復等基礎功能都需要依賴計數器完成。
虛擬機(JVM)棧
JVM棧是線程私有的,每個線程創建的同時都會創建JVM棧,JVM棧中存放的為當前線程中局部基本類型的變量(java中定義的八種基本類型:boolean、char、byte、short、int、long、float、double)、部分的返回結果以及Stack?Frame,非基本類型的對象在JVM棧上僅存放一個指向堆上的地址。
本地方法棧(Native?Method?Stacks)
JVM采用本地方法堆棧來支持native方法的執行,此區域用于存儲每個native方法調用的狀態。
與虛擬機棧基本類似,區別在于虛擬機棧為虛擬機執行的java方法服務,而本地方法棧則是為Native方法服務。
堆(Heap)
它是JVM用來存儲對象實例以及數組值的區域,可以認為Java中所有通過new創建的對象的內存都在此分配,Heap中的對象的內存需要等待GC進行回收。
方法區(Method?Area)
運行時常量池(Runtime?Constant?Pool)
存放的為類中的固定的常量信息、方法和Field的引用信息等,其空間從方法區域中分配。
JVM垃圾回收
GC (Garbage Collection)的基本原理:將內存中不再被使用的對象進行回收,GC中用于回收的方法稱為收集器,由于GC需要消耗一些資源和時間,Java在對對象的生命周期特征進行分析后,按照新生代、舊生代的方式來對對象進行收集,以盡可能的縮短GC對應用造成的暫停。
不同的對象引用類型,?GC會采用不同的方法進行回收,JVM對象的引用分為了四種類型:
在New Generation塊中,垃圾回收一般用Copying的算法,速度快。每次GC的時候,存活下來的對象首先由Eden拷貝到某個Survivor Space, 當Survivor Space空間滿了后, 剩下的live對象就被直接拷貝到Old Generation中去。因此,每次GC后,Eden內存塊會被清空。在Old Generation塊中,垃圾回收一般用mark-compact的算法,速度慢些,但減少內存要求。垃圾回收分多級,0級為全部(Full)的垃圾回收,會回收OLD段中的垃圾;1級或以上為部分垃圾回收,只會回收NEW中的垃圾,內存溢出通常發生于OLD段或Perm段垃圾回收后,仍然無內存空間容納新的Java對象的情況。
URL被訪問時,內存申請過程:
JVM調優建議
- ms/mx:定義YOUNG+OLD段的總尺寸,ms為JVM啟動時YOUNG+OLD的內存大小;mx為最大可占用的YOUNG+OLD內存大小。在用戶生產環境上一般將這兩個值設為相同,以減少運行期間系統在內存申請上所花的開銷。
- NewSize/MaxNewSize:定義YOUNG段的尺寸,NewSize為JVM啟動時YOUNG的內存大小;MaxNewSize為最大可占用的YOUNG內存大小。在用戶生產環境上一般將這兩個值設為相同,以減少運行期間系統在內存申請上所花的開銷。
- PermSize/MaxPermSize:定義Perm段的尺寸,PermSize為JVM啟動時Perm的內存大小;MaxPermSize為最大可占用的Perm內存大小。在用戶生產環境上一般將這兩個值設為相同,以減少運行期間系統在內存申請上所花的開銷。
- SurvivorRatio:設置Survivor空間和Eden空間的比例。
內存溢出的可能性
OLD段溢出
這種內存溢出是最常見的情況之一,產生的原因可能是:
單個程序持續進行消耗內存的處理,如循環幾千次的字符串處理,對字符串處理應建議使用StringBuffer。此時不會報內存溢出錯,卻會使系統持續垃圾收集,無法處理其它請求,相關問題程序可通過Thread Dump獲取(見系統問題診斷一章)單個程序所申請內存過大,有的程序會申請幾十乃至幾百兆內存,此時JVM也會因無法申請到資源而出現內存溢出,對此首先要找到相關功能,然后交予程序員修改,要找到相關程序,必須在Apache日志中尋找。
當Java對象使用完畢后,其所引用的對象卻沒有銷毀,使得JVM認為他還是活躍的對象而不進行回收,這樣累計占用了大量內存而無法釋放。由于目前市面上還沒有對系統影響小的內存分析工具,故此時只能和程序員一起定位。
Perm段溢出
JVM管理兩種類型的內存,堆和非堆。堆是給開發人員用的上面說的就是,是在 JVM 啟動時創建;非堆是留給 JVM 自己用的,用來存放類的信息的。它和堆不同,運行期內 GC 不會釋放空間。如果 web app 用了大量的第三方 jar 或者應用有太多的 class 文件而恰好 MaxPermSize 設置較小,超出了也會導致這塊內存的占用過多造成溢出,或者 tomcat 熱部署時侯不會清理前面加載的環境,只會將 context 更改為新部署的,非堆存的內容就會越來越多。
C Heap溢出
系統對C Heap沒有限制,故C Heap發生問題時,Java進程所占內存會持續增長,直到占用所有可用系統內存。
其他
如JVM有2個GC線程,第一個線程負責回收Heap的Young區。第二個線程在Heap不足時,遍歷Heap,將Young 區升級為Older區。Older區的大小等于-Xmx減去-Xmn,不能將-Xms的值設的過大,因為第二個線程被迫運行會降低JVM的性能。
為什么一些程序頻繁發生GC?有如下原因:
- 程序內調用了System.gc()或Runtime.gc()。
- 一些中間件軟件調用自己的GC方法,此時需要設置參數禁止這些GC。l ? ? ? ? Java的Heap太小,一般默認的Heap值都很小。
- 頻繁實例化對象,Release對象。此時盡量保存并重用對象,例如使用StringBuffer()和String()。如果你發現每次GC后,Heap的剩余空間會是總空間的50%,這表示你的Heap處于健康狀態。許多Server端的Java程序每次GC后最好能有65%的剩余空間。
經驗之談
Server端JVM最好將-Xms和-Xmx設為相同值。為了優化GC,最好讓-Xmn值約等于-Xmx的1/3。
增加Heap的大小雖然會降低GC的頻率,但也增加了每次GC的時間。并且GC運行時,所有的用戶線程將暫停,也就是GC期間,Java應用程序不做任何工作。
Heap大小并不決定進程的內存使用量。進程的內存使用量要大于-Xmx定義的值,因為Java為其他任務分配內存,例如每個線程的Stack等。
每個線程都有他自己的Stack,Stack的大小限制著線程的數量。如果Stack過大就好導致內存溢漏。-Xss參數決定Stack大小,例如-Xss1024K。如果Stack太小,也會導致Stack溢漏。
硬件環境也影響GC的效率,例如機器的種類,內存,swap空間,和CPU的數量。如果你的程序需要頻繁創建很多transient對象,會導致JVM頻繁GC。這種情況你可以增加機器的內存,來減少Swap空間的使用。
4種GC:
-
第一種為單線程GC,也是默認的GC。,該GC適用于單CPU機器。
-
第二種為Throughput GC,是多線程的GC,適用于多CPU,使用大量線程的程序。第二種GC與第一種GC相似,不同在于GC在收集Young區是多線程的,但在Old區和第一種一樣,仍然采用單線程。-XX:+UseParallelGC參數啟動該GC。
-
第三種為Concurrent Low Pause GC,類似于第一種,適用于多CPU,并要求縮短因GC造成程序停滯的時間。這種GC可以在Old區的回收同時,運行應用程序。-XX:+UseConcMarkSweepGC參數啟動該GC。
-
第四種為Incremental Low Pause GC,適用于要求縮短因GC造成程序停滯的時間。這種GC可以在Young區回收的同時,回收一部分Old區對象。-Xincgc參數啟動該GC。
#調試工具
- jps
- jmap
- Jstat
- Jvisualvm: window下啟動遠程監控,并在被監控服務端,啟動jstatd服務。
轉載于:https://my.oschina.net/zhaoyi1/blog/912774
總結
- 上一篇: Java-小技巧-004-jdk时间,j
- 下一篇: Firefox 有 6 成用户仍使用 A