jvm垃圾回收算法详解，看这一篇就够了（求点赞）

IT 老哥

一个在大厂做高级Java开发的程序猿

关注微信公众号：IT 老哥

回复：Java 全套教程，即可领取：Java 基础、Java web、JavaEE 全部的教程，包括 spring boot 等

回复：简历模板，即可获取 100 份精美简历

回复：Java 学习路线，即可获取最新最全的一份学习路线图

回复：Java 电子书，即可领取 13 本顶级程序员必读书籍

前言（求点赞）

我们今天先聊聊jvm的垃圾回收算法，大家先了解垃圾算法有哪些，在去学习有哪些垃圾回收器，然后我们在学习如何对jvm进行参数调优。

垃圾回收（Garbage Collection，GC），顾名思义就是释放垃圾占用的空间，防止内存泄露。有效的使用可以使用的内存，对内存堆中已经死亡的或者长时间没有使用的对象进行清除和回收。

如何找到程序里的垃圾

引用计数法

给每个对象添加一个计数器RC，当有地方引用该对象时计数器加1，当引用失效时计数器减1。用对象计数器是否为0来判断对象是否可被回收。缺点：无法解决循环引用的问题。

先创建一个字符串，String m = new String("jack");，这时候 "jack" 有一个引用，就是m。然后将m设置为null，这时候 "jack" 的引用次数就等于 0 了，在引用计数算法中，意味着这块内容就需要被回收了。

引用计数算法是将垃圾回收分摊到整个应用程序的运行当中了，而不是在进行垃圾收集时，要挂起整个应用的运行，直到对堆中所有对象的处理都结束。因此，采用引用计数的垃圾收集不属于严格意义上的Stop-The-World的垃圾收集机制。

看似很美好，但我们知道JVM的垃圾回收就是Stop-The-World的，那是什么原因导致我们最终放弃了引用计数算法呢？看下面的例子。

    public class ReferenceCountingGC {
    
      public Object instance;
    
      public ReferenceCountingGC(String name) {
      }
    
      public static void testGC(){
    
        ReferenceCountingGC a = new ReferenceCountingGC("objA");
        ReferenceCountingGC b = new ReferenceCountingGC("objB");
    
        // a和b互相引用了
        a.instance = b;
        b.instance = a;
    
        a = null;
        b = null;
      }
    }

我们可以看到，最后这2个对象已经不可能再被访问了，但由于他们相互引用着对方，导致它们的引用计数永远都不会为0，通过引用计数算法，也就永远无法通知GC收集器回收它们。

可达性分析算法

通过GC ROOT的对象作为搜索起始点，通过引用向下搜索，所走过的路径称为引用链。通过对象是否有到达引用链的路径来判断对象是否可被回收（可作为GC ROOT的对象：虚拟机栈中引用的对象，方法区中类静态属性引用的对象，方法区中常量引用的对象，本地方法栈中JNI引用的对象）

通过可达性算法，成功解决了引用计数所无法解决的循环依赖问题，只要你无法与GC Root建立直接或间接的连接，系统就会判定你为可回收对象。那这样就引申出了另一个问题，哪些属于GC Root。

Java内存区域中可以作为GC ROOT的对象：

虚拟机栈中引用的对象

    public class StackLocalParameter {
    
      public StackLocalParameter(String name) {}
    
      public static void testGC() {
        StackLocalParameter s = new StackLocalParameter("localParameter");
        s = null;
      }
    }

此时的s，即为GC Root，当s置空时，localParameter对象也断掉了与GC Root的引用链，将被回收。

方法区中类静态属性引用的对象

    public class MethodAreaStaicProperties {
    
      public static MethodAreaStaicProperties m;
    
      public MethodAreaStaicProperties(String name) {}
    
      public static void testGC(){
        MethodAreaStaicProperties s = new MethodAreaStaicProperties("properties");
        s.m = new MethodAreaStaicProperties("parameter");
        s = null;
      }
    }

此时的s，即为GC Root，s置为null，经过GC后，s所指向的properties对象由于无法与GC Root建立关系被回收。而m作为类的静态属性，也属于GC Root，parameter 对象依然与GC root建立着连接，所以此时parameter对象并不会被回收。

方法区中常量引用的对象

    public class MethodAreaStaicProperties {
    
      public static final MethodAreaStaicProperties m = MethodAreaStaicProperties("final");
    
      public MethodAreaStaicProperties(String name) {}
    
      public static void testGC() {
        MethodAreaStaicProperties s = new MethodAreaStaicProperties("staticProperties");
        s = null;
      }
    }

m即为方法区中的常量引用，也为GC Root，s置为null后，final对象也不会因没有与GC Root建立联系而被回收。

本地方法栈中引用的对象

任何native接口都会使用某种本地方法栈，实现的本地方法接口是使用C连接模型的话，那么它的本地方法栈就是C栈。当线程调用Java方法时，虚拟机会创建一个新的栈帧并压入Java栈。然而当它调用的是本地方法时，虚拟机会保持Java栈不变，不再在线程的Java栈中压入新的帧，虚拟机只是简单地动态连接并直接调用指定的本地方法。

垃圾回收算法

在确定了哪些垃圾可以被回收后，垃圾收集器要做的事情就是开始进行垃圾回收，但是这里面涉及到一个问题是：如何高效地进行垃圾回收。这里我们讨论几种常见的垃圾收集算法的核心思想。

标记-清除算法

标记清除算法（Mark-Sweep）是最基础的一种垃圾回收算法，它分为2部分，先把内存区域中的这些对象进行标记，哪些属于可回收标记出来，然后把这些垃圾拎出来清理掉。就像上图一样，清理掉的垃圾就变成未使用的内存区域，等待被再次使用。但它存在一个很大的问题，那就是内存碎片。

上图中等方块的假设是2M，小一些的是1M，大一些的是4M。等我们回收完，内存就会切成了很多段。我们知道开辟内存空间时，需要的是连续的内存区域，这时候我们需要一个2M的内存区域，其中有2个1M是没法用的。这样就导致，其实我们本身还有这么多的内存的，但却用不了。

复制算法

复制算法（Copying）是在标记清除算法基础上演化而来，解决标记清除算法的内存碎片问题。它将可用内存按容量划分为大小相等的两块，每次只使用其中的一块。当这一块的内存用完了，就将还存活着的对象复制到另外一块上面，然后再把已使用过的内存空间一次清理掉。保证了内存的连续可用，内存分配时也就不用考虑内存碎片等复杂情况。复制算法暴露了另一个问题，例如硬盘本来有500G，但却只能用200G，代价实在太高。