簡(jiǎn)介
Java與C++之間有一堆由內(nèi)存動(dòng)態(tài)分配與垃圾收集技術(shù)所圍成的“高墻”,墻外面的人想進(jìn)去,墻里面的人卻想出來(lái)。 —— 《深入理解Java虛擬機(jī):JVM高級(jí)特性與最佳實(shí)踐》
運(yùn)行時(shí)數(shù)據(jù)區(qū)域
Java虛擬機(jī)在執(zhí)行Java程序的過(guò)程中會(huì)把它所管理的內(nèi)存劃分為若干個(gè)不同的數(shù)據(jù)區(qū)域。這些區(qū)域都有各自的用途。以及創(chuàng)建和銷(xiāo)毀的時(shí)間。有的區(qū)域隨著虛擬機(jī)進(jìn)程的啟動(dòng)而存在,有些區(qū)域則依賴(lài)用戶(hù)線程的啟動(dòng)和結(jié)束而建立和銷(xiāo)毀。
程序計(jì)數(shù)器
程序計(jì)數(shù)器只占用了一塊比較小的內(nèi)存空間。
可以看作是當(dāng)前線程所執(zhí)行的字節(jié)碼文件(class)的行號(hào)指示器。在虛擬機(jī)的世界中,字節(jié)碼解析器就是通過(guò)改變計(jì)數(shù)器的值來(lái)選取下一條執(zhí)行的字節(jié)碼指令,分支、循環(huán)、跳轉(zhuǎn)、異常處理、線程恢復(fù)等,都需要通過(guò)程序計(jì)數(shù)器來(lái)實(shí)現(xiàn)。
因?yàn)樘幚砥髟谝粋€(gè)確定的時(shí)刻只會(huì)執(zhí)行一個(gè)線程中的指令,線程切換后,是通過(guò)計(jì)數(shù)器來(lái)記錄執(zhí)行痕跡,因而可以看出,程序計(jì)數(shù)器是每個(gè)線程私有的
如果執(zhí)行的是java方法,那么記錄的是正在執(zhí)行的虛擬機(jī)字節(jié)碼指令的地址的地址,如果是native方法,計(jì)數(shù)器的值為空(undefined)
這個(gè)內(nèi)存區(qū)域是唯一一個(gè)在java虛擬機(jī)規(guī)范中沒(méi)有規(guī)定任務(wù)OutOfMemoryError的情況區(qū)域
Java虛擬機(jī)棧
與程序計(jì)數(shù)器一樣,Java虛擬機(jī)棧也是線程私有的,它的生命周期與線程相同。虛擬機(jī)棧描述的是java方法執(zhí)行的內(nèi)存模型,每個(gè)方法都在執(zhí)行的同時(shí)會(huì)創(chuàng)建一個(gè)棧幀用于存儲(chǔ)局部變量表、操作數(shù)棧、動(dòng)態(tài)鏈接、方法出口等信息。每一個(gè)方法從調(diào)用直至執(zhí)行完成的過(guò)程,就對(duì)應(yīng)著一個(gè)棧幀在虛擬機(jī)棧中從入棧到出棧的過(guò)程。
局部變量表
局部變量表是一組變量值的存儲(chǔ)空間,用于存放方法參數(shù)和局部變量。變量槽(Variable Slot)是局部變量表的最小單位,沒(méi)有強(qiáng)制規(guī)定大小為32位,雖然32位足夠存放大部分類(lèi)型的數(shù)據(jù)。一個(gè)Slot可以方法boolean、byte、char、short、int、float、reference、和returnAddress 8種類(lèi)型。其中reference表示對(duì)一個(gè)對(duì)象實(shí)例的引用,通過(guò)它可以得到對(duì)象在java堆中存放的起始地址的索引和該數(shù)據(jù)所屬數(shù)據(jù)類(lèi)型的方法區(qū)的類(lèi)型信息。returnAddress則指向一條字節(jié)碼指令的地址。對(duì)于64位的long和double變量而言,虛擬機(jī)會(huì)為其分配兩個(gè)連續(xù)的slot空間。
虛擬機(jī)通過(guò)索引定位的方式使用局部變量表。為了節(jié)省棧幀空間,局部變量表中的Slot是可以重要的。當(dāng)離開(kāi)了某些變量的作用域之后,這些變量對(duì)應(yīng)的Slot就可以交給其他變量使用。
操作數(shù)棧
操作數(shù)棧也稱(chēng)為操作棧,是一個(gè)后入先出的棧。方法執(zhí)行中進(jìn)行算術(shù)運(yùn)算或者是調(diào)用其他的方法進(jìn)行參數(shù)傳遞的時(shí)候是通過(guò)操作數(shù)棧進(jìn)行的。在概念模型中,兩個(gè)棧幀是相互獨(dú)立的。但是大多數(shù)虛擬機(jī)的實(shí)現(xiàn)都會(huì)進(jìn)行優(yōu)化,令兩個(gè)棧幀出現(xiàn)一部分重疊。令下面的部分操作數(shù)棧與上面的局部變量表重疊在一塊,這樣在方法調(diào)用的時(shí)候可以共用一部分?jǐn)?shù)據(jù),無(wú)需進(jìn)行額外的參數(shù)復(fù)制傳遞
動(dòng)態(tài)鏈接
每個(gè)棧幀都包含一個(gè)執(zhí)行運(yùn)行時(shí)常量池中該棧幀所屬方法的引用,持有這個(gè)引用是為了支持方法調(diào)用過(guò)程中的動(dòng)態(tài)鏈接
方法返回地址
當(dāng)一個(gè)方法開(kāi)始執(zhí)行以后,只有兩種方法可以退出當(dāng)前方法:
-
當(dāng)執(zhí)行遇到返回指令,會(huì)將返回值傳遞給上層的方法調(diào)用者,這種退出的方式稱(chēng)為正常完成出口,一般來(lái)說(shuō),調(diào)用者的PC計(jì)數(shù)器可以作為返回地址
-
當(dāng)執(zhí)行遇到一次,并且當(dāng)前方法體內(nèi)沒(méi)有得到處理,就會(huì)導(dǎo)致方法退出,此時(shí)沒(méi)有返回值,稱(chēng)為異常完成出口,返回地址要通過(guò)異常處理器表來(lái)確定
當(dāng)方法返回時(shí),可能進(jìn)行3個(gè)操作:
-
恢復(fù)上層方法的局部變量表和操作數(shù)棧
-
把返回值壓入調(diào)用者調(diào)用棧幀的操作數(shù)棧
-
調(diào)整PC計(jì)數(shù)器的值以指向方法調(diào)用指令后面的一條指令
本地方法棧
本地方法棧與虛擬機(jī)棧所發(fā)揮的作用是非常相似的,它們之間的區(qū)別不過(guò)是虛擬機(jī)棧為虛擬機(jī)執(zhí)行Java方法(也就是字節(jié)碼)服務(wù),而本地的方法棧則為虛擬機(jī)使用到的Native方法服務(wù)。在虛擬機(jī)規(guī)范中對(duì)本地方法棧中方法使用的語(yǔ)言,使用方式和數(shù)據(jù)結(jié)構(gòu)并沒(méi)有強(qiáng)制規(guī)定,因此具體的虛擬機(jī)可以自由實(shí)現(xiàn)它。甚至有的虛擬機(jī)(譬如 Sun HotSport虛擬機(jī))直接就把本地方法棧和虛擬機(jī)棧合二為一,本地方法棧區(qū)域也會(huì)拋出StackOverflowError和OutOfMemoryError異常
Java堆
對(duì)于大多數(shù)應(yīng)用來(lái)說(shuō),Java堆是Java虛擬機(jī)所管理的內(nèi)存中最大的一塊。Java堆是被所有線程共享的一塊內(nèi)存區(qū)域,在虛擬機(jī)啟動(dòng)時(shí)創(chuàng)建。此內(nèi)存區(qū)域的唯一目的就是存放對(duì)象實(shí)例,幾乎所有的對(duì)象實(shí)例都在這里分配內(nèi)存。
Java堆是垃圾收集管理器的主要區(qū)域。因此很多時(shí)候也被稱(chēng)做“GC”堆。從內(nèi)存回收的角度來(lái)看,由于現(xiàn)在收集器基本都采用分代收集算法。所以Java堆中還可以細(xì)分為:新生代和老年代:再細(xì)致一點(diǎn)的有Eden空間、From Survivor空間、ToSurvivor空間等,從內(nèi)存分配的角度來(lái)看,線程共享的Java堆中可能劃分出多個(gè)線程私用的分配緩沖區(qū)。不過(guò)無(wú)論如何如何劃分,都與存放內(nèi)容無(wú)關(guān),無(wú)論哪個(gè)區(qū)域,存儲(chǔ)的都任然是對(duì)象實(shí)例,進(jìn)一步劃分的目的是為了更好地回收內(nèi)存,或者更快地分配內(nèi)存。
Java堆可以處理物理上不連續(xù)的內(nèi)存空間,只要邏輯上是連續(xù)的即可。如果在堆中沒(méi)有內(nèi)存完成實(shí)例分配,并且堆也無(wú)法再擴(kuò)展時(shí),將會(huì)拋出OutOfMenoryError異常
方法區(qū)
方法區(qū)與Java堆一樣,是各個(gè)線程共享的內(nèi)存區(qū)域,它用于存儲(chǔ)已被虛擬機(jī)加載的類(lèi)信息、常量、靜態(tài)變量、即時(shí)編譯器編譯后的代碼等數(shù)據(jù),
方法區(qū)也叫永久代。在過(guò)去(自定義類(lèi)加載器還不是很常見(jiàn)的時(shí)候),類(lèi)大多是”static”的,很少被卸載或收集,因此被稱(chēng)為“永久的(Permanent)”。雖然Java虛擬機(jī)規(guī)范把方法區(qū)描述為堆的一個(gè)邏輯部分,但是它卻有一個(gè)別名叫做Non-Heap(非堆),目的應(yīng)該是與Java 堆區(qū)分開(kāi)來(lái)。同時(shí),由于類(lèi)class是JVM實(shí)現(xiàn)的一部分,并不是由應(yīng)用創(chuàng)建的,所以又被認(rèn)為是“非堆(non-heap)”內(nèi)存。
運(yùn)行時(shí)常量池
運(yùn)行時(shí)常量池是方法區(qū)的一部分,Class文件中除了有類(lèi)的版本、字段、方法、接口等描述信息外們還有一項(xiàng)信息是常量池,用于存放編譯期生成的各種常量和符合引用,這部分內(nèi)容將在類(lèi)加載后進(jìn)入方法區(qū)的運(yùn)行時(shí)常量池中存放
直接內(nèi)存
直接內(nèi)存并不是虛擬機(jī)運(yùn)行時(shí)數(shù)據(jù)區(qū)的一部分,也不是Java虛擬機(jī)規(guī)范中定義的內(nèi)存區(qū)域。在JDK1.4中新加入了MIO(New Input/Output)類(lèi),引入了一種基于通道(Channel)與緩沖區(qū)(Buffer)的I/O方式,他可以使用Native函數(shù)庫(kù)直接分配堆外內(nèi)存,然后通過(guò)一個(gè)存儲(chǔ)在Java堆中的DirectByteBuffer對(duì)象作為這塊內(nèi)存的引用進(jìn)行操作。這樣能在一些場(chǎng)景中顯著提高性能,因此避免了在Java堆和Native堆中來(lái)回復(fù)制數(shù)據(jù)
new 一個(gè)對(duì)象 發(fā)生了什么?
對(duì)象創(chuàng)建
Java是一門(mén)面向?qū)ο蟮木幊陶Z(yǔ)言,在Java程序運(yùn)行過(guò)程中無(wú)時(shí)無(wú)刻都有對(duì)象被創(chuàng)建出來(lái),在語(yǔ)言層面只是使用new關(guān)鍵字,而在虛擬機(jī)中,對(duì)象的創(chuàng)建又是怎樣一個(gè)過(guò)程呢?
-
類(lèi)加載檢查
虛擬機(jī)遇到一條new 指令時(shí),首先將去檢查這個(gè)指令的參數(shù)是否能在常量池中定位到一個(gè)類(lèi)的符合引用,并且檢查這個(gè)符合引用代表的類(lèi)是否已被加載、解析和初始化過(guò)。如果沒(méi)有,那必須先執(zhí)行相應(yīng)的類(lèi)加載過(guò)程。
-
對(duì)象分配內(nèi)存
在類(lèi)加載檢查通過(guò)后,接下來(lái)虛擬機(jī)將為新生對(duì)象分配內(nèi)存。對(duì)象所需內(nèi)存的大小在類(lèi)加載完成后便可完全確定,為對(duì)象分配空間的任務(wù)等同于把一塊確定大小的內(nèi)存從Java堆中劃分出來(lái)。根據(jù)Java堆中的內(nèi)存是否規(guī)整,有2種處理方式。
-
指針碰撞(Bump the pointer)
Java堆中的內(nèi)存是規(guī)整的,所有用過(guò)的內(nèi)存都放在一邊,空閑的內(nèi)存放在另一邊,中間放著一個(gè)指針作為分界點(diǎn)的指示器,分配內(nèi)存也就是把指針向空閑空間那邊移動(dòng)一段與內(nèi)存大小相等的距離。例如:Serial、ParNew等收集器。
-
空閑列表(Free List)
堆中的內(nèi)存不是規(guī)整的,已使用的內(nèi)存和空閑的內(nèi)存相互交錯(cuò),就沒(méi)有辦法簡(jiǎn)單的進(jìn)行指針碰撞了。虛擬機(jī)必須維護(hù)一張列表,記錄哪些內(nèi)存塊是可用的,在分配的時(shí)候從列表中找到一塊足夠大的空間劃分給對(duì)象實(shí)例,并更新列表上的記錄。例如:CMS這種基于Mark-Sweep算法的收集器。
-
并發(fā)處理
對(duì)象創(chuàng)建在虛擬機(jī)中是非常頻繁的行為,即使是僅僅修改一個(gè)指針?biāo)赶虻奈恢?,在并發(fā)情況下也并不是線程安全的,可能出現(xiàn)正在給對(duì)象A分配內(nèi)存,指針還沒(méi)來(lái)得及修改,對(duì)象B又同時(shí)使用了原來(lái)的指針來(lái)分配內(nèi)存的情況。處理方案有2種。
-
同步處理
對(duì)分配內(nèi)存空間的動(dòng)作進(jìn)行同步處理,實(shí)際上虛擬機(jī)采用CAS配上失敗重試的方式保證更新操作的原子性
-
TLAB
把內(nèi)存分配的動(dòng)作按照線程劃分在不同的空間之中進(jìn)行,即每個(gè)線程在Java堆中預(yù)先分配一小塊內(nèi)存,稱(chēng)為本地線程分配緩沖(Thread Local Allocation Buffer,TLAB)。那個(gè)線程要分配內(nèi)存,就在哪個(gè)線程的TLAB上分配,只有TLAB用完并分配新的TLAB時(shí),才需同步鎖定。
-
內(nèi)存空間初始化
虛擬機(jī)將分配到的內(nèi)存空間都初始化為零值(不包括對(duì)象頭),如果使用了TLAB,這一工作過(guò)程也可以提前至TLAB分配時(shí)進(jìn)行。
內(nèi)存空間初始化保證了對(duì)象的實(shí)例字段在Java代碼中可以不賦初始值就直接使用,程序能訪問(wèn)到這些字段的數(shù)據(jù)類(lèi)型所對(duì)應(yīng)的零值。
1. 對(duì)象設(shè)置
接下來(lái),虛擬機(jī)要對(duì)對(duì)象進(jìn)行必要的設(shè)置,例如這個(gè)對(duì)象是那個(gè)類(lèi)的實(shí)例、如何才能找到類(lèi)的元數(shù)據(jù)信息、對(duì)象的哈希碼、對(duì)象的GC分代年齡等信息。這些信息存放在對(duì)象的對(duì)象頭中。
2. 執(zhí)行init()
在上面的工作都完成之后,從虛擬機(jī)的角度看,一個(gè)新的對(duì)象已經(jīng)產(chǎn)生了。但是從Java程序的角度看,對(duì)象的創(chuàng)建才剛剛開(kāi)始init()方法還沒(méi)有執(zhí)行,所有的字段都還是零。
所以,一般來(lái)說(shuō)(由字節(jié)碼中是否跟隨invokespecial指令所決定),執(zhí)行new指令之后會(huì)接著執(zhí)行init()方法,把對(duì)象按照程序員的意愿進(jìn)行初始化,這樣一個(gè)真正可用的對(duì)象才算產(chǎn)生出來(lái)。
對(duì)象內(nèi)存布局
對(duì)象的內(nèi)存結(jié)構(gòu)又可以被分為:對(duì)象頭,實(shí)例數(shù)據(jù),對(duì)象填充。
-
對(duì)象頭
對(duì)象頭包括兩部分信息
第一部分用于存儲(chǔ)對(duì)象自身的運(yùn)行時(shí)數(shù)據(jù), 如哈希碼(HashCode)、GC分代年齡、鎖狀態(tài)標(biāo)志、線程持有的鎖、偏向線程ID、偏向時(shí)間戳等等,這部分?jǐn)?shù)據(jù)的長(zhǎng)度在32位和64位的虛擬機(jī)(暫 不考慮開(kāi)啟壓縮指針的場(chǎng)景)中分別為32個(gè)和64個(gè)Bits,官方稱(chēng)它為“Mark Word”。
存儲(chǔ)內(nèi)容 | 標(biāo)志位 | 狀態(tài) |
---|---|---|
對(duì)象哈希碼、對(duì)象分代年齡 | 01 | 未鎖定 |
指向鎖記錄的指針 | 00 | 輕量級(jí)鎖定 |
指向重量級(jí)鎖的指針 | 10 | 膨脹(重量級(jí)鎖定) |
空,不需要記錄信息 | 11 | GC標(biāo)記 |
偏向線程ID、偏向時(shí)間戳、對(duì)象分代年齡 | 01 | 可偏向 |
第二部分是類(lèi)型指針,即是對(duì)象指向它的類(lèi)的元數(shù)據(jù)的指針,虛擬機(jī)通過(guò)這個(gè)指針來(lái)確定這個(gè)對(duì)象是哪個(gè)類(lèi)的實(shí)例
-
實(shí)例數(shù)據(jù)
對(duì)象真正存儲(chǔ)的有效信息,也是在程序代碼中定義的各種類(lèi)型字段內(nèi)容。無(wú)論是從父類(lèi)繼承下來(lái)的還是子類(lèi)定義的,都需要記錄下來(lái)。
-
對(duì)象填充
沒(méi)有實(shí)際意義,僅僅起著占位符的作用。以為對(duì)象的大小必須是8字節(jié)的整數(shù)倍。
對(duì)象訪問(wèn)定位
建立對(duì)象是為了使用對(duì)象,我們的Java程序需要通過(guò)棧上的reference數(shù)據(jù)來(lái)操作堆上的具體對(duì)象。由于在Java虛擬機(jī)規(guī)范里面只規(guī)定了reference類(lèi)型是一個(gè)指向?qū)ο蟮囊?,并沒(méi)有定義這個(gè)引用應(yīng)該通過(guò)什么種方式去定位、訪問(wèn)到堆中的對(duì)象的具體位置,對(duì)象訪問(wèn)方式也是取決于虛擬機(jī)實(shí)現(xiàn)而定的。主流的訪問(wèn)方式有使用句柄和直接指針兩種。
-
句柄訪問(wèn)
如果使用句柄訪問(wèn)的話,Java堆中將會(huì)劃分出一塊內(nèi)存來(lái)作為句柄池,reference中存儲(chǔ)的就是對(duì)象的句柄地址,而句柄中包含了對(duì)象實(shí)例數(shù)據(jù)與類(lèi)型數(shù)據(jù)的具體各自的地址信息。
-
指針訪問(wèn)對(duì)象
使用直接指針訪問(wèn)的話,Java堆對(duì)象的布局中就必須考慮如何放置訪問(wèn)類(lèi)型數(shù)據(jù)的相關(guān)信息,reference中存儲(chǔ)的直接就是對(duì)象地址
這兩種對(duì)象訪問(wèn)方式各有優(yōu)勢(shì),使用句柄來(lái)訪問(wèn)的最大好處就是reference中存儲(chǔ)的是穩(wěn)定句柄地址,在對(duì)象被移動(dòng)(垃圾收集時(shí)移動(dòng)對(duì)象是非常普遍的行為)時(shí)只會(huì)改變句柄中的實(shí)例數(shù)據(jù)指針,而reference本身不需要被修改。
使用直接指針來(lái)訪問(wèn)最大的好處就是速度更快,它節(jié)省了一次指針定位的時(shí)間開(kāi)銷(xiāo),由于對(duì)象訪問(wèn)的在Java中非常頻繁,因此這類(lèi)開(kāi)銷(xiāo)積小成多也是一項(xiàng)非常可 觀的執(zhí)行成本。從上一部分講解的對(duì)象內(nèi)存布局可以看出,就虛擬機(jī)HotSpot而言,它是使用第二種方式進(jìn)行對(duì)象訪問(wèn),但在整個(gè)軟件開(kāi)發(fā)的范圍來(lái)看,各種 語(yǔ)言、框架中使用句柄來(lái)訪問(wèn)的情況也十分常見(jiàn)