Fork me on GitHub

JVM系列(二)

Java内存区域

1. 运行时数据区域

在上一篇博客中提到了虚拟机的运行的时候,需要加载类,以及存储数据等,因此需要有个区域用来存储运行时的数据。

上一篇博客也提到了JVM的体系结构,可以看出这幅图中的运行时数据区的划分是和JVM体系结构相关的。

Java虚拟机在执行Java程序的过程中会把自己所管理的内存区域划分成若干个数据区域吗,这些区域都有各自的用途以及创建和销毁的时间,有的区域随着虚拟机进程的启动而存在,有些区域则依赖用户的线程的启动和结束而建立和销毁。

1.PC寄存器

PC寄存器,也就是我们常说的程序计数器,是一块较小的内存空间,用于存放一条指令的地址, 这条指令便是虚拟机要执行的下一条指令。它可以看作是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型中,字节码解释器就是通过改变这个计数器的值来选取下一条要执行的指令。

每条线程都需要有一个独立的程序计数器,因为多线程是通过线程轮流切换并分配时间处理执行的方式实现的,因此为了保证线程切换之后,能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,且各个线程的程序计数器互不影响。这类内存区域称为线程私有的内存

如果线程正在执行的是一个Java方法,则这个计数器记录的是正在执行的指令地址,如果是Native方法,这个计数器的值就为空,此区域是唯一一个Java虚拟机规范没有规定任何OOM情况的区域。

2.Java栈

与PC寄存器一样,Java栈也是线程私有的,它的生命周期与线程相同,每个方法的执行和结束都对应着一个栈帧(栈的基本单位)的入栈和出栈。每个方法对应一个栈帧,用于存储局部表,操作数栈,动态链接,方法出口等。

局部变量表的内存空间是在编译期间完成分配的,当进入一个方法时,整个方法需要在帧中分配多大的局部变量空间是完全确定的。

在Java虚拟机规范中,对这个区域规定了两种异常情况,一个是StackOverflowError异常,如果一个线程请求的栈深度大于虚拟机所允许的深度,将会抛出这个异常。一个是OOM异常,对于可以动态扩展的虚拟机栈,如果扩展无法申请到足够的内存,便会报出此异常。

3.本地方法栈

本地方法栈是为Native方法服务的,而Java栈是为Java方法服务的,当Java调用C/C++等Native方法时, 便会使用本地方法栈,它也是线程私有的。

4.Java堆

Java堆是被所有线程共享的一块内存区域,在虚拟机被启动时创建,此内存区域的唯一目的便是存放对象实例以及数组,在java中数组也是对象。虚拟机规范的描述是:所有的对象实例和数组都要在堆上分配。(实例变量是存储在堆上的对象中的,一个对象有一份实例变量)

随着逃逸分析和TLAB技术的成熟,便出现了对象实例不一定在堆上分配空间的情况。在此介绍下这两个技术。

逃逸技术

逃逸分析,是一种可以有效减少Java 程序中同步负载和内存堆分配压力的跨函数全局数据流分析[算法。通过逃逸分析,Hotspot编译器能够分析出一个新的对象的引用的使用范围从而决定是否要将这个对象分配到堆上。

逃逸分析是指分析指针动态范围的方法,当变量(或者对象)在方法中分配后,其指针有可能被返回或者被全局引用,这样就会被其他过程或者线程所引用,这种现象称作指针(或者引用)的逃逸(Escape)。

对象的三种逃逸状态

GlobalEscape(全局逃逸):即一个对象的引用逃出了方法和线程,如:一个对象的引用是赋值给类变量,或者作为返回值返回给调用方法。

ArgEscape(参数级逃逸):即在方法调用过程中,将对象的引用作为参数传递给方法。

NoEscape(没有逃逸):只是在方法中new出来,在方法中使用,可以不将这种对象分配在传统的堆上,而是分配在栈上。

1
2
3
4
5
public void test(){
A a = new A();
B b = new B();
A.XXX(b);
}

上面是一个简单的实例,按照我们以往的想法,无非是对象的引用a,b分配在栈中,而new出来的A,B对象是存储在堆中的,而使用了逃逸技术,显然new出的A对象是属于没有逃逸的,而new出的B对象虽然作为参数传递给了A的方法,然而A是没有逃逸的,因此这两个对象都是属于NoEscape,可分配在栈中。

逃逸技术还有其他应用,如

清除同步:线程同步的代价是降低了并发性和性能。逃逸分析可以判断某个对象是否始终被一个线程访问,若是的话,就可以撤销对该对象的同步保护,从而提高并发程度和性能。

矢量替代:逃逸分析方法如果发现对象的内存存储结构不需要连续进行的话,就可以将对象的部分甚至全部都保存在CPU寄存器内,这样能大大提高访问速度。

TALB

JVM在内存新生代Eden Space中开辟了一小块线程私有的区域,称作TLAB(Thread-local allocation buffer)。在Java程序中很多对象都是小对象且用过即丢,它们不存在线程共享也适合被快速GC,所以对于小对象通常JVM会优先分配在TLAB上,并且TLAB上的分配由于是线程私有所以没有锁开销。

总结

对象不在堆上分配主要的原因是堆是共享的,在堆上分配对象有锁的开销,且堆上的分配的对象内存需要GC才能进行回收。

5.方法区

方法区和Java堆一样,是各个线程共享的内存区域。它用于存储已被虚拟机加载的类信息、常量、静态变量,即时编译器编译后的代码等数据。

方法区是一个相对稳定的内存区, 因为它存放的是类型信息, 而类型信息在被加载到方法区中之后, 除了必要的连接和初始化, 一般不会有较大改动 。一般情况下, JVM也不会卸载类型信息, 所以方法区也可以称为JVM的静态区。 一个类型的生命周期一般就是整个程序的生命周期。 一个JVM实例中只存在一个方法区, 方法区中的所有类型数据被所有线程共享。

6.运行时常量池

运行时常量池是方法区的一部分。Class文件中除了有类的版本,字段,方法等,还有一项信息就是常量池,用于存放编译期生成的各种字面量和符号引用,而这些内容将会在类加载之后进入方法区的运行时常量。同时,运行期间也能将新的常量放入池中。

-------------本文结束感谢您的阅读-------------

本文标题:JVM系列(二)

文章作者:AllenYu

发布时间:2019年01月12日 - 16:01

最后更新:2019年01月12日 - 16:01

原始链接:http://yuzeduan.github.io/2019/01/12/JVM系列-二/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。