程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> JAVA編程 >> 關於JAVA >> Java進階學習(十) 內存管理與垃圾回收

Java進階學習(十) 內存管理與垃圾回收

編輯:關於JAVA

整個教程中已經不時的出現一些內存管理和垃圾回收的相關知識。這裡進行一個小小的總結。

Java是在JVM所虛擬出的內存環境中運行的。內存分為棧(stack)和堆(heap)兩部分。我們將分別考察這兩個區域。

棧的基本概念參考紙上談兵: 棧 (stack)。許多語言利用棧數據結構來記錄函數調用的次序和相關變量(參考Linux從程序到進程)。

在Java中,JVM中的棧記錄了線程的方法調用。每個線程擁有一個棧。在某個線程的運行過程中,如果有新的方法調用,那麼該線程對應的棧就會增加一個存儲單元,即幀(frame)。在frame中,保存有該方法調用的參數、局部變量和返回地址。

調用棧

Java的參數和局部變量只能是基本類型的變量(比如int),或者對象的引用(reference)。因此,在棧中,只保存有基本類型的變量和對象引用。

引用所指向的對象保存在堆中。(引用可能為Null值,即不指向任何對象)

引用與對象

當被調用方法運行結束時,該方法對應的幀將被刪除,參數和局部變量所占據的空間也隨之釋放。線程回到原方法,繼續執行。當所有的棧都清空時,程序也隨之運行結束。

如上所述,棧(stack)可以自己照顧自己。但堆必須要小心對待。堆是JVM中一塊可自由分配給對象的區域。當我們談論垃圾回收(garbage collection)時,我們主要回收堆(heap)的空間。

Java的普通對象存活在堆中。與棧不同,堆的空間不會隨著方法調用結束而清空。因此,在某個方法中創建的對象,可以在方法調用結束之後,繼續存在於堆中。這帶來的一個問題是,如果我們不斷的創建新的對象,內存空間將最終消耗殆盡。

查看本欄目

垃圾回收

垃圾回收(garbage collection,簡稱GC)可以自動清空堆中不再使用的對象。垃圾回收機制最早出現於1959年,被用於解決Lisp語言中的問題。垃圾回收是Java的一大特征。並不是所有的語言都有垃圾回收功能。比如在C/C++中,並沒有垃圾回收的機制。程序員需要手動釋放堆中的內存。

由於不需要手動釋放內存,程序員在編程中也可以減少犯錯的機會。利用垃圾回收,程序員可以避免一些指針和內存洩露相關的bug(這一類bug通常很隱蔽)。但另一方面,垃圾回收需要耗費更多的計算時間。垃圾回收實際上是將原本屬於程序員的責任轉移給計算機。使用垃圾回收的程序需要更長的運行時間。

在Java中,對象的是通過引用使用的(把對象相像成致命的毒物,引用就像是用於提取毒物的鑷子)。如果不再有引用指向對象,那麼我們就再也無從調用或者處理該對象。這樣的對象將不可到達(unreachable)。垃圾回收用於釋放不可到達對象所占據的內存。這是垃圾回收的基本原則。

(不可到達對象是死對象,是垃圾回收所要回收的垃圾)

早期的垃圾回收采用引用計數(reference counting)的機制。每個對象包含一個計數器。當有新的指向該對象的引用時,計數器加1。當引用移除時,計數器減1。當計數器為0時,認為該對象可以進行垃圾回收。

然而,一個可能的問題是,如果有兩個對象循環引用(cyclic reference),比如兩個對象互相引用,而且此時沒有其它(指向A或者指向B)的引用,我們實際上根本無法通過引用到達這兩個對象。

因此,我們以棧和static數據為根(root),從根出發,跟隨所有的引用,就可以找到所有的可到達對象。也就是說,一個可到達對象,一定被根引用,或者被其他可到達對象引用。

橙色,可到達;綠色,不可到達

JVM實施

JVM的垃圾回收是多種機制的混合。JVM會根據程序運行狀況,自行決定采用哪種垃圾回收。

我們先來了解"mark and sweep"。這種機制下,每個對象將有標記信息,用於表示該對象是否可到達。當垃圾回收啟動時,Java程序暫停運行。JVM從根出發,找到所有的可到達對象,並標記(mark)。隨後,JVM需要掃描整個堆,找到剩余的對象,並清空這些對象所占據的內存。

另一種是"copy and sweep"。這種機制下,堆被分為兩個區域。對象總存活於兩個區域中的一個。當垃圾回收啟動時,Java程序暫停運行。JVM從根出發,找到可到達對象,將可到達對象復制到空白區域中並緊密排列,修改由於對象移動所造成的引用地址的變化。最後,直接清空對象原先存活的整個區域,使其成為新的空白區域。

可以看到,"copy and sweep"需要更加復雜的操作,但也讓對象可以緊密排列,避免"mark and sweep"中可能出現的空隙。在新建對象時,"copy and sweep"可以提供大塊的連續空間。因此,如果對象都比較"長壽",那麼適用於"mark and sweep"。如果對象的"新陳代謝"比較活躍,那麼適用於"copy and sweep"。

上面兩種機制是通過分代回收(generational collection)混合在一起的。每個對象記錄有它的世代(generation)信息。所謂的世代,是指該對象所經歷的垃圾回收的次數。世代越久遠的對象,在內存中存活的時間越久。

根據對Java程序的統計觀察,世代越久的對象,越不可能被垃圾回收(富人越富,窮人越窮)。因此,當我們在垃圾回收時,要更多關注那些年輕的對象。

現在,具體看一下JVM中的堆:

查看本欄目

我們看到,堆分為三代。其中的永久世代(permanent generation)中存活的是Class對象。這些對象不會被垃圾回收。我們在RTTI中已經了解到,每個Class對象代表一個類,包含有類相關的數據與方法,並提供類定義的代碼。每個對象在創建時,都要參照相應的Class對象。每個對象都包含有指向其對應Class對象的引用。

年輕世代(young generation)和成熟世代(tenured generation)需要進行垃圾回收。年輕世代中的對象世代較近,而成熟世代中的對象世代較久。

世代

年輕世代進一步分為三個區域

eden(伊甸): 新生對象存活於該區域。新生對象指從上次GC後新建的對象。

新生對象生活於伊甸園

from, to: 這兩個區域大小相等,相當於copy and sweep中的兩個區域。

當新建對象無法放入eden區時,將出發minor collection。JVM采用copy and sweep的策略,將eden區與from區的可到達對象復制到to區。經過一次垃圾回收,eden區和from區清空,to區中則緊密的存放著存活對象。隨後,from區成為新的to區, to區成為新的from區。

如果進行minor collection的時候,發現to區放不下,則將部分對象放入成熟世代。另一方面,即使to區沒有滿,JVM依然會移動世代足夠久遠的對象到成熟世代。

如果成熟世代放滿對象,無法移入新的對象,那麼將觸發major collection。JVM采用mark and sweep的策略,對成熟世代進行垃圾回收。

總結

以上是對JVM內存管理的一個概述。實際上,JVM擁有眾多版本。不同版本實施的GC機制會有不小的差異。另一方面,Java本身並沒有規定JVM的GC實施方式。GC依然是JVM發展的一個熱點方向。我們可以預期JVM的GC機制在未來會發生許多變化。

作者:Vamei 出處:http://www.cnblogs.com/vamei

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved