您現(xiàn)在的位置：首頁(yè) ? 知識(shí)庫(kù) ? 軟件開(kāi)發(fā) 軟件開(kāi)發(fā)

JVM學(xué)習(xí)筆記-內(nèi)存管理機(jī)制

發(fā)布日期：2017-09-07

簡(jiǎn)介

Java與C++之間有一堆由內(nèi)存動(dòng)態(tài)分配與垃圾收集技術(shù)所圍成的“高墻”，墻外面的人想進(jìn)去，墻里面的人卻想出來(lái)。 —— 《深入理解Java虛擬機(jī)：JVM高級(jí)特性與最佳實(shí)踐》

運(yùn)行時(shí)數(shù)據(jù)區(qū)域

Java虛擬機(jī)在執(zhí)行Java程序的過(guò)程中會(huì)把它所管理的內(nèi)存劃分為若干個(gè)不同的數(shù)據(jù)區(qū)域。這些區(qū)域都有各自的用途。以及創(chuàng)建和銷(xiāo)毀的時(shí)間。有的區(qū)域隨著虛擬機(jī)進(jìn)程的啟動(dòng)而存在，有些區(qū)域則依賴(lài)用戶(hù)線程的啟動(dòng)和結(jié)束而建立和銷(xiāo)毀。

程序計(jì)數(shù)器

程序計(jì)數(shù)器只占用了一塊比較小的內(nèi)存空間。

可以看作是當(dāng)前線程所執(zhí)行的字節(jié)碼文件（class）的行號(hào)指示器。在虛擬機(jī)的世界中，字節(jié)碼解析器就是通過(guò)改變計(jì)數(shù)器的值來(lái)選取下一條執(zhí)行的字節(jié)碼指令，分支、循環(huán)、跳轉(zhuǎn)、異常處理、線程恢復(fù)等，都需要通過(guò)程序計(jì)數(shù)器來(lái)實(shí)現(xiàn)。

因?yàn)樘幚砥髟谝粋€(gè)確定的時(shí)刻只會(huì)執(zhí)行一個(gè)線程中的指令，線程切換后，是通過(guò)計(jì)數(shù)器來(lái)記錄執(zhí)行痕跡，因而可以看出，程序計(jì)數(shù)器是每個(gè)線程私有的

如果執(zhí)行的是java方法，那么記錄的是正在執(zhí)行的虛擬機(jī)字節(jié)碼指令的地址的地址，如果是native方法，計(jì)數(shù)器的值為空（undefined）

這個(gè)內(nèi)存區(qū)域是唯一一個(gè)在java虛擬機(jī)規(guī)范中沒(méi)有規(guī)定任務(wù)OutOfMemoryError的情況區(qū)域

Java虛擬機(jī)棧

與程序計(jì)數(shù)器一樣，Java虛擬機(jī)棧也是線程私有的，它的生命周期與線程相同。虛擬機(jī)棧描述的是java方法執(zhí)行的內(nèi)存模型，每個(gè)方法都在執(zhí)行的同時(shí)會(huì)創(chuàng)建一個(gè)棧幀用于存儲(chǔ)局部變量表、操作數(shù)棧、動(dòng)態(tài)鏈接、方法出口等信息。每一個(gè)方法從調(diào)用直至執(zhí)行完成的過(guò)程，就對(duì)應(yīng)著一個(gè)棧幀在虛擬機(jī)棧中從入棧到出棧的過(guò)程。

局部變量表

局部變量表是一組變量值的存儲(chǔ)空間，用于存放方法參數(shù)和局部變量。變量槽（Variable Slot）是局部變量表的最小單位，沒(méi)有強(qiáng)制規(guī)定大小為32位，雖然32位足夠存放大部分類(lèi)型的數(shù)據(jù)。一個(gè)Slot可以方法boolean、byte、char、short、int、float、reference、和returnAddress 8種類(lèi)型。其中reference表示對(duì)一個(gè)對(duì)象實(shí)例的引用，通過(guò)它可以得到對(duì)象在java堆中存放的起始地址的索引和該數(shù)據(jù)所屬數(shù)據(jù)類(lèi)型的方法區(qū)的類(lèi)型信息。returnAddress則指向一條字節(jié)碼指令的地址。對(duì)于64位的long和double變量而言，虛擬機(jī)會(huì)為其分配兩個(gè)連續(xù)的slot空間。

虛擬機(jī)通過(guò)索引定位的方式使用局部變量表。為了節(jié)省棧幀空間，局部變量表中的Slot是可以重要的。當(dāng)離開(kāi)了某些變量的作用域之后，這些變量對(duì)應(yīng)的Slot就可以交給其他變量使用。

操作數(shù)棧

操作數(shù)棧也稱(chēng)為操作棧，是一個(gè)后入先出的棧。方法執(zhí)行中進(jìn)行算術(shù)運(yùn)算或者是調(diào)用其他的方法進(jìn)行參數(shù)傳遞的時(shí)候是通過(guò)操作數(shù)棧進(jìn)行的。在概念模型中，兩個(gè)棧幀是相互獨(dú)立的。但是大多數(shù)虛擬機(jī)的實(shí)現(xiàn)都會(huì)進(jìn)行優(yōu)化，令兩個(gè)棧幀出現(xiàn)一部分重疊。令下面的部分操作數(shù)棧與上面的局部變量表重疊在一塊，這樣在方法調(diào)用的時(shí)候可以共用一部分?jǐn)?shù)據(jù)，無(wú)需進(jìn)行額外的參數(shù)復(fù)制傳遞

動(dòng)態(tài)鏈接

每個(gè)棧幀都包含一個(gè)執(zhí)行運(yùn)行時(shí)常量池中該棧幀所屬方法的引用，持有這個(gè)引用是為了支持方法調(diào)用過(guò)程中的動(dòng)態(tài)鏈接

方法返回地址

當(dāng)一個(gè)方法開(kāi)始執(zhí)行以后，只有兩種方法可以退出當(dāng)前方法：

當(dāng)執(zhí)行遇到返回指令，會(huì)將返回值傳遞給上層的方法調(diào)用者，這種退出的方式稱(chēng)為正常完成出口，一般來(lái)說(shuō)，調(diào)用者的PC計(jì)數(shù)器可以作為返回地址
當(dāng)執(zhí)行遇到一次，并且當(dāng)前方法體內(nèi)沒(méi)有得到處理，就會(huì)導(dǎo)致方法退出，此時(shí)沒(méi)有返回值，稱(chēng)為異常完成出口，返回地址要通過(guò)異常處理器表來(lái)確定

當(dāng)方法返回時(shí)，可能進(jìn)行3個(gè)操作：

恢復(fù)上層方法的局部變量表和操作數(shù)棧
把返回值壓入調(diào)用者調(diào)用棧幀的操作數(shù)棧
調(diào)整PC計(jì)數(shù)器的值以指向方法調(diào)用指令后面的一條指令

本地方法棧

本地方法棧與虛擬機(jī)棧所發(fā)揮的作用是非常相似的，它們之間的區(qū)別不過(guò)是虛擬機(jī)棧為虛擬機(jī)執(zhí)行Java方法（也就是字節(jié)碼）服務(wù)，而本地的方法棧則為虛擬機(jī)使用到的Native方法服務(wù)。在虛擬機(jī)規(guī)范中對(duì)本地方法棧中方法使用的語(yǔ)言，使用方式和數(shù)據(jù)結(jié)構(gòu)并沒(méi)有強(qiáng)制規(guī)定，因此具體的虛擬機(jī)可以自由實(shí)現(xiàn)它。甚至有的虛擬機(jī)（譬如 Sun HotSport虛擬機(jī)）直接就把本地方法棧和虛擬機(jī)棧合二為一，本地方法棧區(qū)域也會(huì)拋出StackOverflowError和OutOfMemoryError異常

Java堆

對(duì)于大多數(shù)應(yīng)用來(lái)說(shuō)，Java堆是Java虛擬機(jī)所管理的內(nèi)存中最大的一塊。Java堆是被所有線程共享的一塊內(nèi)存區(qū)域，在虛擬機(jī)啟動(dòng)時(shí)創(chuàng)建。此內(nèi)存區(qū)域的唯一目的就是存放對(duì)象實(shí)例，幾乎所有的對(duì)象實(shí)例都在這里分配內(nèi)存。

Java堆是垃圾收集管理器的主要區(qū)域。因此很多時(shí)候也被稱(chēng)做“GC”堆。從內(nèi)存回收的角度來(lái)看，由于現(xiàn)在收集器基本都采用分代收集算法。所以Java堆中還可以細(xì)分為：新生代和老年代：再細(xì)致一點(diǎn)的有Eden空間、From Survivor空間、ToSurvivor空間等，從內(nèi)存分配的角度來(lái)看，線程共享的Java堆中可能劃分出多個(gè)線程私用的分配緩沖區(qū)。不過(guò)無(wú)論如何如何劃分，都與存放內(nèi)容無(wú)關(guān)，無(wú)論哪個(gè)區(qū)域，存儲(chǔ)的都任然是對(duì)象實(shí)例，進(jìn)一步劃分的目的是為了更好地回收內(nèi)存，或者更快地分配內(nèi)存。

Java堆可以處理物理上不連續(xù)的內(nèi)存空間，只要邏輯上是連續(xù)的即可。如果在堆中沒(méi)有內(nèi)存完成實(shí)例分配，并且堆也無(wú)法再擴(kuò)展時(shí)，將會(huì)拋出OutOfMenoryError異常

方法區(qū)

方法區(qū)與Java堆一樣，是各個(gè)線程共享的內(nèi)存區(qū)域，它用于存儲(chǔ)已被虛擬機(jī)加載的類(lèi)信息、常量、靜態(tài)變量、即時(shí)編譯器編譯后的代碼等數(shù)據(jù)，

方法區(qū)也叫永久代。在過(guò)去（自定義類(lèi)加載器還不是很常見(jiàn)的時(shí)候），類(lèi)大多是”static”的，很少被卸載或收集，因此被稱(chēng)為“永久的(Permanent)”。雖然Java虛擬機(jī)規(guī)范把方法區(qū)描述為堆的一個(gè)邏輯部分，但是它卻有一個(gè)別名叫做Non-Heap（非堆），目的應(yīng)該是與Java 堆區(qū)分開(kāi)來(lái)。同時(shí)，由于類(lèi)class是JVM實(shí)現(xiàn)的一部分，并不是由應(yīng)用創(chuàng)建的，所以又被認(rèn)為是“非堆(non-heap)”內(nèi)存。

運(yùn)行時(shí)常量池

運(yùn)行時(shí)常量池是方法區(qū)的一部分，Class文件中除了有類(lèi)的版本、字段、方法、接口等描述信息外們還有一項(xiàng)信息是常量池，用于存放編譯期生成的各種常量和符合引用，這部分內(nèi)容將在類(lèi)加載后進(jìn)入方法區(qū)的運(yùn)行時(shí)常量池中存放

直接內(nèi)存

直接內(nèi)存并不是虛擬機(jī)運(yùn)行時(shí)數(shù)據(jù)區(qū)的一部分，也不是Java虛擬機(jī)規(guī)范中定義的內(nèi)存區(qū)域。在JDK1.4中新加入了MIO（New Input/Output）類(lèi)，引入了一種基于通道（Channel）與緩沖區(qū)（Buffer）的I/O方式，他可以使用Native函數(shù)庫(kù)直接分配堆外內(nèi)存，然后通過(guò)一個(gè)存儲(chǔ)在Java堆中的DirectByteBuffer對(duì)象作為這塊內(nèi)存的引用進(jìn)行操作。這樣能在一些場(chǎng)景中顯著提高性能，因此避免了在Java堆和Native堆中來(lái)回復(fù)制數(shù)據(jù)

new 一個(gè)對(duì)象發(fā)生了什么？

對(duì)象創(chuàng)建

Java是一門(mén)面向?qū)ο蟮木幊陶Z(yǔ)言，在Java程序運(yùn)行過(guò)程中無(wú)時(shí)無(wú)刻都有對(duì)象被創(chuàng)建出來(lái)，在語(yǔ)言層面只是使用new關(guān)鍵字，而在虛擬機(jī)中，對(duì)象的創(chuàng)建又是怎樣一個(gè)過(guò)程呢？

類(lèi)加載檢查

虛擬機(jī)遇到一條new 指令時(shí)，首先將去檢查這個(gè)指令的參數(shù)是否能在常量池中定位到一個(gè)類(lèi)的符合引用，并且檢查這個(gè)符合引用代表的類(lèi)是否已被加載、解析和初始化過(guò)。如果沒(méi)有，那必須先執(zhí)行相應(yīng)的類(lèi)加載過(guò)程。
對(duì)象分配內(nèi)存

在類(lèi)加載檢查通過(guò)后，接下來(lái)虛擬機(jī)將為新生對(duì)象分配內(nèi)存。對(duì)象所需內(nèi)存的大小在類(lèi)加載完成后便可完全確定，為對(duì)象分配空間的任務(wù)等同于把一塊確定大小的內(nèi)存從Java堆中劃分出來(lái)。根據(jù)Java堆中的內(nèi)存是否規(guī)整，有2種處理方式。

指針碰撞(Bump the pointer)

Java堆中的內(nèi)存是規(guī)整的，所有用過(guò)的內(nèi)存都放在一邊，空閑的內(nèi)存放在另一邊，中間放著一個(gè)指針作為分界點(diǎn)的指示器，分配內(nèi)存也就是把指針向空閑空間那邊移動(dòng)一段與內(nèi)存大小相等的距離。例如：Serial、ParNew等收集器。

空閑列表(Free List)

堆中的內(nèi)存不是規(guī)整的，已使用的內(nèi)存和空閑的內(nèi)存相互交錯(cuò)，就沒(méi)有辦法簡(jiǎn)單的進(jìn)行指針碰撞了。虛擬機(jī)必須維護(hù)一張列表，記錄哪些內(nèi)存塊是可用的，在分配的時(shí)候從列表中找到一塊足夠大的空間劃分給對(duì)象實(shí)例，并更新列表上的記錄。例如：CMS這種基于Mark-Sweep算法的收集器。

并發(fā)處理

對(duì)象創(chuàng)建在虛擬機(jī)中是非常頻繁的行為，即使是僅僅修改一個(gè)指針?biāo)赶虻奈恢?，在并發(fā)情況下也并不是線程安全的，可能出現(xiàn)正在給對(duì)象A分配內(nèi)存，指針還沒(méi)來(lái)得及修改，對(duì)象B又同時(shí)使用了原來(lái)的指針來(lái)分配內(nèi)存的情況。處理方案有2種。

同步處理

對(duì)分配內(nèi)存空間的動(dòng)作進(jìn)行同步處理，實(shí)際上虛擬機(jī)采用CAS配上失敗重試的方式保證更新操作的原子性

TLAB

把內(nèi)存分配的動(dòng)作按照線程劃分在不同的空間之中進(jìn)行，即每個(gè)線程在Java堆中預(yù)先分配一小塊內(nèi)存，稱(chēng)為本地線程分配緩沖（Thread Local Allocation Buffer，TLAB）。那個(gè)線程要分配內(nèi)存，就在哪個(gè)線程的TLAB上分配，只有TLAB用完并分配新的TLAB時(shí)，才需同步鎖定。
內(nèi)存空間初始化

虛擬機(jī)將分配到的內(nèi)存空間都初始化為零值（不包括對(duì)象頭）,如果使用了TLAB，這一工作過(guò)程也可以提前至TLAB分配時(shí)進(jìn)行。

內(nèi)存空間初始化保證了對(duì)象的實(shí)例字段在Java代碼中可以不賦初始值就直接使用，程序能訪問(wèn)到這些字段的數(shù)據(jù)類(lèi)型所對(duì)應(yīng)的零值。

1. 對(duì)象設(shè)置

接下來(lái)，虛擬機(jī)要對(duì)對(duì)象進(jìn)行必要的設(shè)置，例如這個(gè)對(duì)象是那個(gè)類(lèi)的實(shí)例、如何才能找到類(lèi)的元數(shù)據(jù)信息、對(duì)象的哈希碼、對(duì)象的GC分代年齡等信息。這些信息存放在對(duì)象的對(duì)象頭中。

2. 執(zhí)行init()

在上面的工作都完成之后，從虛擬機(jī)的角度看，一個(gè)新的對(duì)象已經(jīng)產(chǎn)生了。但是從Java程序的角度看，對(duì)象的創(chuàng)建才剛剛開(kāi)始init()方法還沒(méi)有執(zhí)行，所有的字段都還是零。

所以，一般來(lái)說(shuō)（由字節(jié)碼中是否跟隨invokespecial指令所決定），執(zhí)行new指令之后會(huì)接著執(zhí)行init()方法，把對(duì)象按照程序員的意愿進(jìn)行初始化，這樣一個(gè)真正可用的對(duì)象才算產(chǎn)生出來(lái)。

對(duì)象內(nèi)存布局

對(duì)象的內(nèi)存結(jié)構(gòu)又可以被分為：對(duì)象頭，實(shí)例數(shù)據(jù)，對(duì)象填充。

對(duì)象頭

對(duì)象頭包括兩部分信息

第一部分用于存儲(chǔ)對(duì)象自身的運(yùn)行時(shí)數(shù)據(jù)，如哈希碼（HashCode）、GC分代年齡、鎖狀態(tài)標(biāo)志、線程持有的鎖、偏向線程ID、偏向時(shí)間戳等等，這部分?jǐn)?shù)據(jù)的長(zhǎng)度在32位和64位的虛擬機(jī)（暫不考慮開(kāi)啟壓縮指針的場(chǎng)景）中分別為32個(gè)和64個(gè)Bits，官方稱(chēng)它為“Mark Word”。

存儲(chǔ)內(nèi)容	標(biāo)志位	狀態(tài)
對(duì)象哈希碼、對(duì)象分代年齡	01	未鎖定
指向鎖記錄的指針	00	輕量級(jí)鎖定
指向重量級(jí)鎖的指針	10	膨脹（重量級(jí)鎖定）
空，不需要記錄信息	11	GC標(biāo)記
偏向線程ID、偏向時(shí)間戳、對(duì)象分代年齡	01	可偏向

第二部分是類(lèi)型指針，即是對(duì)象指向它的類(lèi)的元數(shù)據(jù)的指針，虛擬機(jī)通過(guò)這個(gè)指針來(lái)確定這個(gè)對(duì)象是哪個(gè)類(lèi)的實(shí)例

實(shí)例數(shù)據(jù)

對(duì)象真正存儲(chǔ)的有效信息，也是在程序代碼中定義的各種類(lèi)型字段內(nèi)容。無(wú)論是從父類(lèi)繼承下來(lái)的還是子類(lèi)定義的，都需要記錄下來(lái)。

對(duì)象填充

沒(méi)有實(shí)際意義，僅僅起著占位符的作用。以為對(duì)象的大小必須是8字節(jié)的整數(shù)倍。

對(duì)象訪問(wèn)定位

建立對(duì)象是為了使用對(duì)象，我們的Java程序需要通過(guò)棧上的reference數(shù)據(jù)來(lái)操作堆上的具體對(duì)象。由于在Java虛擬機(jī)規(guī)范里面只規(guī)定了reference類(lèi)型是一個(gè)指向?qū)ο蟮囊?，并沒(méi)有定義這個(gè)引用應(yīng)該通過(guò)什么種方式去定位、訪問(wèn)到堆中的對(duì)象的具體位置，對(duì)象訪問(wèn)方式也是取決于虛擬機(jī)實(shí)現(xiàn)而定的。主流的訪問(wèn)方式有使用句柄和直接指針兩種。

句柄訪問(wèn)

如果使用句柄訪問(wèn)的話，Java堆中將會(huì)劃分出一塊內(nèi)存來(lái)作為句柄池，reference中存儲(chǔ)的就是對(duì)象的句柄地址，而句柄中包含了對(duì)象實(shí)例數(shù)據(jù)與類(lèi)型數(shù)據(jù)的具體各自的地址信息。

指針訪問(wèn)對(duì)象

使用直接指針訪問(wèn)的話，Java堆對(duì)象的布局中就必須考慮如何放置訪問(wèn)類(lèi)型數(shù)據(jù)的相關(guān)信息，reference中存儲(chǔ)的直接就是對(duì)象地址

這兩種對(duì)象訪問(wèn)方式各有優(yōu)勢(shì)，使用句柄來(lái)訪問(wèn)的最大好處就是reference中存儲(chǔ)的是穩(wěn)定句柄地址，在對(duì)象被移動(dòng)（垃圾收集時(shí)移動(dòng)對(duì)象是非常普遍的行為）時(shí)只會(huì)改變句柄中的實(shí)例數(shù)據(jù)指針，而reference本身不需要被修改。

使用直接指針來(lái)訪問(wèn)最大的好處就是速度更快，它節(jié)省了一次指針定位的時(shí)間開(kāi)銷(xiāo)，由于對(duì)象訪問(wèn)的在Java中非常頻繁，因此這類(lèi)開(kāi)銷(xiāo)積小成多也是一項(xiàng)非常可觀的執(zhí)行成本。從上一部分講解的對(duì)象內(nèi)存布局可以看出，就虛擬機(jī)HotSpot而言，它是使用第二種方式進(jìn)行對(duì)象訪問(wèn)，但在整個(gè)軟件開(kāi)發(fā)的范圍來(lái)看，各種語(yǔ)言、框架中使用句柄來(lái)訪問(wèn)的情況也十分常見(jiàn)

上一篇：區(qū)塊鏈與微服務(wù)天生是一對(duì)
下一篇：完整的APP開(kāi)發(fā)流程熟記于心

【打印此文】【關(guān)閉窗口】

簡(jiǎn)介

運(yùn)行時(shí)數(shù)據(jù)區(qū)域

new 一個(gè)對(duì)象 發(fā)生了什么？

new 一個(gè)對(duì)象發(fā)生了什么？