JVM (三)运行时数据区

 2023-01-11
原文作者:小飞机yt 原文地址:https://juejin.cn/post/6935362175322030088

目录

JVM内存布局规定了JAVA在运行过程中内存申请、分配、管理的策略,保证了JVM的高效稳定运行。

202301011635464381.png

  • 灰色的为单独的线程所私:独立的程序计数器,本地方法栈,和虚拟机栈
  • 红色为多个线程所共享:线程间共享,方法区,堆区

一般来说,jvm优化95%是优化堆区,5%优化的是方法区,至于栈区无非出入栈操作优化较少

1.PC寄存器(程序计数器)

pc寄存器用来存储指向下一条指令的地址,也即将要执行的指令代码,执行引擎根据程序计数器读取下一条指令地址,然后根据指令进行执行

在活动线程中,只有位于栈顶的栈帧才是有效的,称为当前栈帧,与这个栈帧相关联的方法称为当前方法。

202301011635470362.png

1.1程序计数器的作用

  • 1.它是一块很小的内存空间,几乎可以忽略不计。也是运行速度最快的存储区域
  • 2.在jvm规范中,每个线程都有它自己的程序计数器,是线程私有的,生命周期与线程的生命周期保持一致
  • 3.任何时间一个线程都只有一个方法在执行,也就是所谓的当前方法。程序计数器会存储当前线程正在执行的java方法的JVM指令地址;或者,如果实在执行native方法,则是未指定值(undefined),因为程序计数器不负责本地方法栈。
  • 4.它是程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成
  • 5.字节码解释器工作时就是通过改变这个计数器的值来选取吓一跳需要执行的字节码指令
  • 6.它是唯一一个在java虚拟机规范中没有规定任何OOM(Out Of Memery)情况的区域,而且没有垃圾回收

利用javap -v xxx.class反编译字节码文件,查看指令等信息

202301011635477913.png

执行引擎根据PC寄存器的内容,在方法区内读取对应的指令,然后在局部变量内读取数据,或修改线程下的操作栈

1.2程序计数器常问问题

  • 1.使用PC寄存器存储字节码指令地址有什么用呢(为什么使用PC寄存器记录当前线程的执行地址呢)

    • (1)多线程宏观上是并行(多个事件在同一时刻同时发生)的,但实际上是并发交替执行的
    • (2)因为CPU需要不停的切换各个线程,这时候切换回来以后,就得知道接着从哪开始继续执行
    • (3)JVM的字节码解释器就需要通过改变PC寄存器的值来明确下一条应该执行什么样的字节码指令 所以,众多线程在并发执行过程中,任何一个确定的时刻,一个处理器或者多核处理器中的一个内核,只会执行某个线程中的一条指令。这样必然导致经常中断或恢复,如何保证分毫无差呢?每个线程在创建后,都会产生自己的程序计数器和栈帧,程序计数器在各个线程之间互不影响。
  • 2.PC寄存器为什么会设定为线程私有?

    • (1)我们都知道所谓的多线程在一个特定的时间段内只会执行其中某一个线程的方法,CPU会不停滴做任务切换,这样必然会导致经常中断或恢复,如何保证分毫无差呢?
    • (2)为了能够准确地记录各个线程正在执行的当前字节码指令地址,最好的办法自然是为每一个线程都分配一个PC寄存器,这样一来各个线程之间便可以进行独立计算,从而不会出现相互干扰的情况。

2.java虚拟机栈

java的指令都是根据栈来设计的,不同CPU的架构不同,所以不能够设计为基于寄存器的

2.1内存中的栈与堆

栈是运行时的单位,而堆是存储的单位

  • 1.栈解决程序的运行问题,即程序如何执行,或者说如何处理数据。堆解决的是数据存储的问题,即数据怎么放、放在哪儿。
  • 2.一般来讲,对象主要都是放在堆空间的,是运行时数据区比较大的一块
  • 3.栈空间存放 基本数据类型的局部变量,以及引用数据类型的对象的引用

2.2虚拟机栈的内部结构

虚拟机栈的作用:每个线程创建时都会创建一个虚拟机栈,栈中由栈帧组成,每个栈帧代表一个方法。保存方法的局部变量,部分结果,并参与方法的调用与返回。

栈帧内容

  • 1.局部变量表(Local Variables)
  • 2.操作数栈(Operand Stack)(或表达式栈)
  • 3.动态链接(Dynamic Linking)(或执行"运行时常量池"的方法引用)----深入理解Java多态特性必读!!
  • 4.方法返回地址(Return Adress)(或方法正常退出或者异常退出的定义)
  • 5.一些附加信息

202301011635484964.png

3.局部变量表

主要作用用来存储运行过程中用到的变量,执行引擎根据指令向里面添加数据或取出数据

    1. 定义为一个数字数组,主要用于存储方法参数和定义在方法体内的局部变量 ,这些数据类型包括各类基本数据类型、对象引用(reference),以及returnAddressleixing
    1. 由于局部变量表是建立在线程的栈上,是线程私有的数据,因此不存在数据安全问题
    1. 局部变量表所需的容量大小是在编译期确定下来的 ,并保存在方法的Code属性的maximum local variables数据项中。 在方法运行期间是不会改变局部变量表的大小的
    1. 局部变量表中的变量只在当前方法调用中有效 。在方法执行时,虚拟机通过使用局部变量表完成参数值到参数变量列表的传递过程。当方法调用结束后,随着方法栈帧的销毁,局部变量表也会随之销毁。

3.1查看局部变量表

利用javap命令对字节码文件进行解析查看main()方法对应栈帧的局部变量表,如图:

202301011635491905.png

3.2Slot槽

  • 1.在局部变量表相当于一个数组,最基本的存储单位是Slot(变量槽)

  • 2 局部变量表中存放编译期可知的各种基本数据类型(8种),引用类型(reference),returnAddress类型的变量。

  • 3.在局部变量表里,32位以内的类型只占用一个slot(包括returnAddress类型),64位的类型(long和double)占用两个slot。

    • byte、short、char、float在存储前被转换为int,boolean也被转换为int,0表示false,非0表示true;

    • long和double则占据两个slot。

      202301011635499856.png

3.2.1Slot槽的特点
  • 1.当一个实例方法被调用的时候,它的方法参数和方法体内部定义的局部变量将会按照声明顺序被复制到局部变量表中的每一个slot上
  • 2.如果需要访问局部变量表中一个64bit的局部变量值时,只需要使用前一个索引即可。(比如:访问long或者double类型变量)
  • 3.如果当前帧是由构造方法或者实例方法创建的(意思是当前帧所对应的方法是构造器方法或者是普通的实例方法),那么该对象引用this将会存放在index为0的slot处,其余的参数按照参数表顺序排列。 (非静态方法的局部变量表index=0的位置存放this指针)
  • 4.静态方法中不能引用this,是因为静态方法所对应的栈帧当中的局部变量表中不存在this
3.2.2Slot槽的重复利用

栈帧中的局部变量表中的槽位是可以重复利用的,如果一个局部变量过了其作用域,那么在其作用域之后申明的新的局部变量就很有可能会复用过期局部变量的槽位,从而达到节省资源的目的。

    private void test2() {
            int a = 0;
            {
                int b = 0;
                b = a+1;
            }
            //变量c使用之前以及经销毁的变量b占据的slot位置
            int c = a+1;
        }

在以上情况下使用slot的数量为3个,this占0号、a单独占1个槽号、c重复使用了b的槽号

4.变量的分类

按照在类中声明的位置分:

  • 成员变量: 在使用前,都经历过默认初始化赋值

    • static变量 :类变量:随类的加载而加载,在方法区分配,类加载链接的准备preparation阶段给类变量默认赋0值——>初始化阶段initialization给类变量显式赋值即静态代码块赋值;
    • 非static变量 :实例变量:随着对象的创建,会在堆空间分配实例变量空间,并进行默认赋值.
  • 局部变量:在使用前,必须要进行显式赋值的!否则,编译不通过

5.操作数栈

是一个先进后出的栈结构,只要的作用是在程序运行期间存储计算所需要的值或者临时结果

在方法执行过程中,根据字节码指令,往栈中写入数据或提取数据,即入栈(push)或出栈(pop),某些字节码指令将值压入操作数栈,其余的字节码指令将操作数取出栈,使用他们后再把结果压入栈。(如字节码指令bipush操作)比如:执行复制、交换、求和等操作

5.1代码举例

202301011635508137.png

202301011635522258.png 0:将变量15压入操作数栈

202301011635528089.png1:将操作数栈的变量赋值给局部变量

2023010116355393910.png2:将变量8压入操作数栈

2023010116355462011.png3:将操作数栈的变量赋值给局部变量

2023010116355552812.png4.将局部变量中的15取出,放入操作数栈

2023010116355649613.png5.将局部变量中的8取出,放入操作数栈

2023010116355734614.pngiadd操作将操作数栈中的变量相加,然后存储到操作数栈

2023010116355817715.png将操作数栈中的结果返回局部变量表

5.2操作数栈的特点

  • 操作数栈, 主要用于保存计算过程的中间结果,同时作为计算过程中变量临时的存储空间
  • 操作数栈就是jvm执行引擎的一个工作区,当一个方法开始执行的时候,一个新的栈帧也会随之被创建出来,这个方法的操作数栈是空的
  • 每一个操作数栈都会拥有一个明确的栈深度用于存储数值,其所需的 最大深度在编译期就定义好了 ,保存在方法的code属性中,为max_stack的值。
  • 栈中的任何一个元素都是可以任意的java数据类型.32bit的类型占用一个栈单位深度,64bit的类型占用两个栈深度单位
  • 操作数栈并非采用访问索引的方式来进行数据访问的,而是只能通过标准的入栈push和出栈pop操作来完成一次数据访问
  • 如果被调用的方法带有返回值的话,其返回值将会被压入当前栈帧的操作数栈中,并更新PC寄存器中下一条需要执行的字节码指令。
  • 操作数栈中的元素的数据类型必须与字节码指令的序列严格匹配,这由编译器在编译期间进行验证,同时在类加载过程中的类验证阶段的数据流分析阶段要再次验证。

6.动态链接

1.运行时常量池位于方法区(注意: JDK1.7 及之后版本的 JVM 已经将运行时常量池从方法区中移了出来,在 Java 堆(Heap)中开辟了一块区域存放运行时常量池。)

2023010116355899016.png

2.每一个栈帧内部都包含一个指向运行时常量池Constant pool或该栈帧所属方法的引用。包含这个引用的目的就是为了支持当前方法的代码能够实现动态链接。比如invokedynamic指令

3.在Java源文件被编译成字节码文件中时,所有的变量和方法引用都作为符号引用(symbolic Refenrence)保存在class字节码文件(javap反编译查看)的常量池里。比如:描述一个方法调用了另外的其他方法时,就是通过常量池中指向方法的符号引用来表示的,那么动态链接的作用就是为了将这些符号引用(#)最终转换为调用方法的直接引用。

2023010116355971317.png

6.1方法的调用

  • 1.静态链接 当一个 字节码文件被装载进JVM内部时,如果被调用的目标方法在编译期可知,且运行期保持不变时。这种情况下将调用方法的符号引用转换为直接引用的过程称之为静态链接。
  • 2.动态链接 如果被调用的方法在编译期无法被确定下来,也就是说,只能够在程序运行期将调用方法的符号引用转换为直接引用,由于这种引用转换过程具备动态性,因此也就被称之为动态链接。

对应的方法的绑定机制为: 早起绑定 (Early Binding)和 晚期绑定 (Late Bingding)。绑定是一个字段、方法或者类在符号引用被替换为直接引用的过程,这仅仅发生一次。

  • 1.早期绑定 早期绑定就是指被调用的目标方法如果在编译期可知,且运行期保持不变时,即可将这个方法与所属的类型进行绑定,这样一来,由于明确了被调用的目标方法究竟是哪一个,因此也就可以使用静态链接的方式将符号引用转换为直接引用。
  • 2.晚期绑定 如果被调用的方法在编译期无法被确定下来,只能够在程序运行期根据实际的类型绑定相关的方法,这种绑定方式也就被称之为晚期绑定。

6.2 方法调用指令

普通调用指令:

  • 1.invokestatic:调用静态方法,解析阶段确定唯一方法版本;
  • 2.invokespecial:调用方法、私有及父类方法,解析阶段确定唯一方法版本;
  • 3.invokevirtual调用所有虚方法;
  • 4.invokeinterface:调用接口方法; 动态调用指令(Java7新增):
  • 5.invokedynamic:动态解析出需要调用的方法,然后执行

前四条指令固化在虚拟机内部,方法的调用执行不可人为干预,而invokedynamic指令则支持由用户确定方法版本。

其中invokestatic指令和invokespecial指令调用的方法称为非虚方法

其中invokevirtual(final修饰的除外,JVM会把final方法调用也归为invokevirtual指令,但要注意final方法调用不是虚方法)、invokeinterface指令调用的方法称称为虚方法。

    /**
     * 解析调用中非虚方法、虚方法的测试
     */
    class Father {
        public Father(){
            System.out.println("Father默认构造器");
        }
    
        public static void showStatic(String s){
            System.out.println("Father show static"+s);
        }
    
        public final void showFinal(){
            System.out.println("Father show final");
        }
    
        public void showCommon(){
            System.out.println("Father show common");
        }
    
    }
    
    public class Son extends Father{
        public Son(){
            super();
        }
    
        public Son(int age){
            this();
        }
    
        public static void main(String[] args) {
            Son son = new Son();
            son.show();
        }
    
        //不是重写的父类方法,因为静态方法不能被重写
        public static void showStatic(String s){
            System.out.println("Son show static"+s);
        }
    
        private void showPrivate(String s){
            System.out.println("Son show private"+s);
        }
    
        public void show(){
            //invokestatic
            showStatic(" 大头儿子");
            //invokestatic
            super.showStatic(" 大头儿子");
            //invokespecial
            showPrivate(" hello!");
            //invokespecial
            super.showCommon();
            //invokevirtual 因为此方法声明有final 不能被子类重写,所以也认为该方法是非虚方法
            showFinal();
            //虚方法如下
            //invokevirtual
            showCommon();//没有显式加super,被认为是虚方法,因为子类可能重写showCommon
            info();
    
            MethodInterface in = null;
            //invokeinterface  不确定接口实现类是哪一个 需要重写
            in.methodA();
    
        }
    
        public void info(){
    
        }
    
    }
    
    interface MethodInterface {
        void methodA();
    }

6.3方法重写的本质

每个方法方法在调用时,都需要在常量池查找方法的引用地址,如果没有对应的方法,则在其父类方法中查找,如果找不到则会报错.

在面向对象编程中,会很频繁期使用到动态分派,如果在每次动态分派的过程中都要重新在累的方法元数据中搜索合适的目标的话就可能影响到执行效率。因此,为了提高性能,jvm采用在类的方法区建立一个 虚方法表 (virtual method table)(非虚方法不会出现在表中)来实现。使用索引表来代替查找。

  • 每个类中都有一个虚方法表,表中存放着各个方法的实际入口。
  • 那么虚方法表什么时候被创建? 虚方法表会在类加载的链接阶段被创建 并开始初始化,类的变量初始值准备完成之后,jvm会把该类的虚方法表也初始化完毕。

例子:我们定义三个类、一个Friendly接口

2023010116360087518.png

    //friendly接口
    interface Friendly{
      void sayHello();
      void sayGoodbye();
    }
    
    //Dog类
    class Dog{
      public void sayHello(){
      }
      public String toString(){
        return "Dog";
      }
    }
    //可卡犬
    class CockerSpaniel extends Dog implements Friendly{
      public void sayHello(){
        super.sayHello();
      }
      public void sayGoodbye(){
      }
    }

Dog类的虚方法表

2023010116360156619.png

可卡犬虚方法表:可卡犬若是使用toString方法无需向上找Object类,只需找到Dog类即可;这是一个效率的提升

2023010116360282220.png

7.方法返回地址

存放调用该方法的方法的PC寄存器的值

  • 1.调用者(方法的调用者可能也是一个方法)的pc计数器的值作为返回地址,即调用该方法的指令的下一条指令的地址。而通过异常退出时,返回地址是要通过异常表来确定,栈帧中一般不会保存这部分信息。
  • 2.在方法执行的过程中遇到了异常(Exception),并且这个异常没有在方法内进行处理,也就是只要在本方法的异常表中没有搜素到匹配的异常处理器,就会导致方法退出,简称异常完成出口方法执行过程中抛出异常时的异常处理,存储在一个异常处理表,方便在发生异常的时候找到处理异常的代码。