JVM 垃圾回收算法
《深入理解Java虚拟机:JVM高级特性与最佳实践》-笔记
一、概述
垃圾回收,Garbage Collection,简称GC。
GC需要完成三件事:
- 哪些内存需要回收?
- 什么时候回收?
- 如何回收?
二、对象存活判断
判断对象是否存活一般有两种方式:
- 引用计数:每个对象有一个引用计数属性,新增一个引用时计数加1,引用释放时计数减1,计数为0时可以回收。此方法简单,无法解决对象相互循环引用的问题。
- 可达性分析(Reachability Analysis):从GC Roots开始向下搜索,搜索所走过的路径称为引用链。当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。不可达对象。
在Java语言中,GC Roots包括:
- 虚拟机栈中引用的对象。
- 方法区中类静态属性实体引用的对象。
- 方法区中常量引用的对象。
- 本地方法栈中JNI引用的对象。
三、JVM的垃圾回收过程
首先从GC Roots开始进行可达性分析,判断哪些是不可达对象。
对于不可达对象,判断是否需要执行其finalize方法,如果对象没有覆盖finalize方法或已经执行过finalize方法则视为不需要执行,进行回收;如果需要,则把对象加入F-Queue队列。
对于F-Queue队列里的对象,稍后虚拟机会自动建立一个低优先级的线程去触发其finalize方法,但不会等待这个方法返回。
如果在finalize方法的执行过程中,对象重新被引用,那么进行第二次标记时将被移出F-Queue,在finalize方法执行完成后,对象仍然没有被引用,则进行回收。
对于被移出F-Queue的对象,如果它下一次面临回收时,将不会再执行其finalize方法。
finalize方法只执行一次。
四、垃圾收集算法
标记-清除算法
Mark-Sweep:先标记所有需要回收对象,然后统一回收。
问题
- 效率问题,标记和清除两个过程的效率都不高。
- 空间问题,会产生大量不连续的内存碎片。分配大对象时容易提前触发GC。
复制算法
Copying:把可用内存分为大小相等的两块,每次只使用一块。当一块用完时,将存活对象复制到另一块,再一次清理掉已使用的内存块。
实现简单,分配快,只需要顺序移动堆顶指针就可以进行分配,允许高效。代价是内存浪费大。
IBM的研究表明,新产生的对象98%都是很快就死忙的。
HotSpot将内存分为一块较大的Eden和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。回收时,将Eden和Survivor中存活的对象一次性复制到另一个Survivor上,然后清理掉Eden和用过的Survivor。
在上面的复制过程中,如果Survivor空间不够,则需要引入一种分配担保机制来处理,在HotSpot中是将对象分配到年老代。
标记-压缩
Mark-Compact:先标记,然后将存活对象移向一边,再清理掉边界以外的内存。
分代收集算法
一般的虚拟机都是分代收集算法,也就是把内存分为几个块,不同的块用不同的回收算法。
一般将内存分为新生代和年老代,在新生代一般采用复制算法,年老代采用标记-压缩算法。
五、Java 里的引用
- 强引用(Strong Reference):一般的赋值就是建立强引用,只要有强引用就不会被回收。
- 软引用(Soft Reference):在系统将要发生内存溢出时进行回收,如果回收后还是不够内存才跑出内存溢出异常。内存足够则不会回收。
- 弱引用(Weak Reference):只能存活到下一次GC时,不管内存是否足够。
- 虚引用(Phantom Reference):对对象的生存时间没影响,目的是为了在对象被回收时得到系统通知。