Fork me on GitHub

JVM系列(三)

关于对象

1.前言

前一篇文章向大家介绍了Java的内存区域,而众所周知,Java是一门面向对象的语言,我们也了解了几乎所有的对象都是存储在JVM的运行数据区中的堆中,然而,却不知道对象的内存布局是怎样的,它不像我们的基本类型那样简单的存储结构,还有,我们知道Java栈中的对象引用是指向对象的,但是却不知道具体是如何引用的。因此本文将会以此展开介绍。

2.对象的内存布局

2.1 概述

对象在内存中的存储可以分为三个区域:对象头(Header),实例数据(Instance Data)和对齐填充(Padding)。

2.2 对象头

长度 内容 存储内容
32/64bit Mark Word 存储对象的hashcode和锁信息等
32/64bit Class MetaData Address 存储到对象类型数据的指针
32/64bit Array length 如果对象是数组,则存储数组的长度

上图表示的是,第一部分的Mark Word存储的是对象自身的运行数据,如哈希码,GC分代年龄,锁状态标记,偏向锁ID,偏向时间戳等。而如果对象是数组的话,则对象头需要有一块用于记录数组长度的数据。它们的长度取决于虚拟机,在32位和64位的虚拟机,它们分别为32bit和64bit(未开启压缩指针)。

2.2.1 Mark Word

其实,在对象运行时需要的存储数据很多,超出了32位,64位结构所能记录的限度。因此,它被设计成一个非固定的数据结构以便在极小的空间内存储更多的信息,它会根据对象的状态复用自己的存储空间。

32bit中的Mark Word存储结构

由上图可知,对象头会有1个位用于存储是否为偏向锁,两个位存储锁标记位,由这两个决定锁的状态,从而改变Mark Word中的数据结构,至于各类锁的详细内容,不属于本文内容,将会在并发系列中详解。

64bit中Mark Word结构

64bit下的Mark Word的其他锁状态的数据结构状态与32bit下的一致。

2.2.2 类型指针

这一部分用于存储对象的类型指针,即对象指向它的类元数据(存储在方法区)的指针,虚拟机根据这个指针确定对象是哪个类的实例,该指的长度为JVM的一个字大小。(并不是所有的虚拟机实现都必须在对象数据上保留类型指针,即查找对象的元数据不一定通过经过对象本身)

2.2.3 Array Length

如果对象是个数组的话,对象头中就必须要有一块用于记录数组长度的数据,不然虚拟机无法确定数组的大小。32位的JVM上,长度为32位;64位JVM则为64位。64位JVM如果开启+UseCompressedOops选项,该区域长度也将由64位压缩至32位。

2.3 实例数据

还记得在分析java的内存区域的时候,提到的,一个类的实例变量是存在在堆中的对象中的。是的,实例数据就是我们类定义的实例变量,每个类的不同对象都有一份的数据,因此称为实例变量。无论是从父类继承下来的,还是自己本身定义的,都要记录下来。

HotSpot虚拟机默认的分配策略为longs/doubles、ints、shorts/chars、bytes/booleans、oops(Ordinary Object Pointers),从分配策略中可以看出,相同宽度的字段总是被分配到一起。在满足这个前提条件的情况下,在父类中定义的变量会出现在子类之前。如果 CompactFields参数值为true(默认为true),那子类之中较窄的变量也可能会插入到父类变量的空隙之中。

2.4 对齐填充

对齐填充并不是必要的,它仅仅起着占位符的作用。因为tHotSpot VM的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说就是对象的大小必须是8字节的整数倍。因此,对于普通对象来说,其对象头的所占的字节数是8的整数倍(32bit下是1倍,64bit下是2倍)。此时则出现在实例数据部分可能没有对齐,就需要对齐填充来补全。假如是数组对象,由于对象头多了Array Length域,因此可能对象头也需要对齐填充。

对齐填充的规则是以8字节为单位,不足8字节,剩余字节(每个单位)不足以填充下个内存数据,则使用对齐填充补全。

1
2
3
String s;
byte i;
int i;

String存储的是对象的引用,占4个字节,byte占1个字节,此时余下的3字节不足以存储int 的4字节,因此int存储在下一个单位,余下的3字节,对齐填充。下一个单位剩余了4字节,此时已没有实例数据,因此也需要对齐填充。

3. 对象的访问定位

对象的使用,贯穿整个程序,而我们最熟悉的,便是使用一个对象的引用去创建一个对象,此时,就可以使用这个对象的引用去访问创建的对象了。而对象的引用如何去定位堆中的对象,虚拟机规范是没有具体规定的,因此就出现了不同的对象访问定位方式,主流的访问方式有使用句柄和直接指针两种。

3.1 句柄访问

还记得上面提到的提到类型指针提到的,并不是所有虚拟机都需要在对象数据上保留类型指针,因为使用的便是这种句柄访问的方法。

如果使用的句柄访问方法,则需要在堆中划出一块内存存储句柄池。引用中存储的便是对象的句柄地址,而句柄中包含了对象实例数据和类型数据各自的具体地址信息。

3.2 直接指针访问

使用直接指针访问的方法,则reference中存储的就是对象的地址,才使用类型指针访问方法区中的对象类型数据。

3.3 对比

  • 使用句柄访问的最大好处就是refercence存储的是稳定的句柄地址,在对象被移动时只需改变句柄中的对象实例还素数据指针即可,不需要去改变引用的值。(垃圾收集时,移动对象是非常普遍的行为)。
  • 使用指针直接访问的方式的最大好处便是速度更快,节省了一次指针定位的时间开销。因为在java中对象的访问是非常频繁的,因此这类开销积少成多也是会影响程序效率。
  • 对于HotSpot来说,它是使用第二种方式的,但就整个软件开发的范围看,各种语言和框架使用句柄来访问也很常见。
-------------本文结束感谢您的阅读-------------

本文标题:JVM系列(三)

文章作者:AllenYu

发布时间:2019年01月14日 - 15:01

最后更新:2019年01月14日 - 15:01

原始链接:http://yuzeduan.github.io/2019/01/14/JVM系列-三/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。