title | shortTitle | author | date | category | tag | description | head | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
JVM面试题,54道Java虚拟机八股文(1.5万字51张手绘图),面渣逆袭必看👍 |
面渣逆袭-JVM |
三分恶 |
2025-01-10 |
|
|
下载次数超 1 万次,1.5 万字 51 张手绘图,详解 55 道 Java 虚拟机面试高频题(让天下没有难背的八股),面渣背会这些 JVM 八股文,这次吊打面试官,我觉得稳了(手动 dog)。 |
|
1.5 万字 51 张手绘图,详解 54 道 Java 虚拟机面试高频题(让天下没有难背的八股),面渣背会这些 JVM 八股文,这次吊打面试官,我觉得稳了(手动 dog)。整理:沉默王二,戳转载链接,作者:三分恶,戳原文链接。
亮白版本更适合拿出来打印,这也是很多学生党喜欢的方式,打印出来背诵的效率会更高。
2024 年 12 月 30 日开始着手第二版更新。
- 对于高频题,会标注在《Java 面试指南(付费)》中出现的位置,哪家公司,原题是什么;如果你想节省时间的话,可以优先背诵这些题目,尽快做到知彼知己,百战不殆。
- 结合项目(技术派、pmhub)来组织语言,让面试官最大程度感受到你的诚意,而不是机械化的背诵。
- 修复第一版中出现的问题,包括球友们的私信反馈,网站留言区的评论,以及 GitHub 仓库中的 issue,让这份面试指南更加完善。
- 优化排版,增加手绘图,重新组织答案,使其更加口语化,从而更贴近面试官的预期。
由于 PDF 没办法自我更新,所以需要最新版的小伙伴,可以微信搜【沉默王二】,或者扫描/长按识别下面的二维码,关注二哥的公众号,回复【222】即可拉取最新版本。
当然了,请允许我的一点点私心,那就是星球的 PDF 版本会比公众号早一个月时间,毕竟星球用户都付费过了,我有必要让他们先享受到一点点福利。相信大家也都能理解,毕竟在线版是免费的,CDN、服务器、域名、OSS 等等都是需要成本的。
更别说我付出的时间和精力了。
百度网盘、阿里云盘、夸克网盘都可以下载到最新版本,我会第一时间更新上去。
展示一下暗黑版本的 PDF 吧,排版清晰,字体优雅,更加适合夜服,晚上看会更舒服一点。
JVM,也就是 Java 虚拟机,它是 Java 实现跨平台的基石。
程序运行之前,需要先通过编译器将 Java 源代码文件编译成 Java 字节码文件;
程序运行时,JVM 会对字节码文件进行逐行解释,翻译成机器码指令,并交给对应的操作系统去执行。
这样就实现了 Java 一次编译,处处运行的特性。
①、JVM 可以自动管理内存,通过垃圾回收器回收不再使用的对象并释放内存空间。
②、JVM 包含一个即时编译器 JIT,它可以在运行时将热点代码缓存到 codeCache 中,下次执行的时候不用再一行一行的解释,而是直接执行缓存后的机器码,执行效率会大幅提高。
③、任何可以通过 Java 编译的语言,比如说 Groovy、Kotlin、Scala 等,都可以在 JVM 上运行。
学习 JVM 可以帮助我们开发者更好地优化程序性能、避免内存问题。
比如说了解 JVM 的内存模型和垃圾回收机制,可以帮助我们更合理地配置内存、减少 GC 停顿。
比如说掌握 JVM 的类加载机制可以帮助我们排查类加载冲突或异常。
再比如说,JVM 还提供了很多调试和监控工具,可以帮助我们分析内存和线程的使用情况,从而解决内存溢出内存泄露等问题。
- Java 面试指南(付费)收录的京东同学 10 后端实习一面的原题:有了解 JVM 吗
- Java 面试指南(付费)收录的字节跳动同学 20 测开一面的原题:了解过 JVM 么?讲一下 JVM 的特性
增补于 2024 年 03 月 08 日。
推荐阅读:大白话带你认识 JVM
JVM 大致可以划分为三个部分:类加载器、运行时数据区和执行引擎。
① 类加载器,负责从文件系统、网络或其他来源加载 Class 文件,将 Class 文件中的二进制数据读入到内存当中。
② 运行时数据区,JVM 在执行 Java 程序时,需要在内存中分配空间来处理各种数据,这些内存区域按照 Java 虚拟机规范可以划分为方法区、堆、虚拟机栈、程序计数器和本地方法栈。
③ 执行引擎,也是 JVM 的心脏,负责执行字节码。它包括一个虚拟处理器、即时编译器 JIT 和垃圾回收器。
- Java 面试指南(付费)收录的腾讯 Java 后端实习一面原题:说说 JVM 的组织架构
- Java 面试指南(付费)收录的得物面经同学 9 面试题目原题:JVM的架构,具体阐述一下各个部分的功能?
推荐阅读:深入理解 JVM 的运行时数据区
按照 Java 虚拟机规范,JVM 的内存区域可以细分为程序计数器
、虚拟机栈
、本地方法栈
、堆
和方法区
。
其中方法区
和堆
是线程共享的,虚拟机栈
、本地方法栈
和程序计数器
是线程私有的。
程序计数器也被称为 PC 寄存器,是一块较小的内存空间。它可以看作是当前线程所执行的字节码行号指示器。
Java 虚拟机栈的生命周期与线程相同。
当线程执行一个方法时,会创建一个对应的栈帧,用于存储局部变量表、操作数栈、动态链接、方法出口等信息,然后栈帧会被压入虚拟机栈中。当方法执行完毕后,栈帧会从虚拟机栈中移除。
对于静态方法,由于不需要访问实例对象 this,因此在局部变量表中不会有任何变量。
对于非静态方法,即使是一个完全空的方法,局部变量表中也会有一个用于存储 this 引用的变量。this 引用指向当前实例对象,在方法调用时被隐式传入。
详细解释一下:
比如说有这样一段代码:
public class VarDemo1 {
public void emptyMethod() {
// 什么都没有
}
public static void staticEmptyMethod() {
// 什么都没有
}
}
用 javap -v VarDemo1
命令查看编译后的字节码,就可以在 emptyMethod 中看到这样的内容:
这里的 locals=1
表示局部变量表有一个变量,即 this,Slot 0 位置存储了 this 引用。
而在静态方法 staticEmptyMethod 中,你会看到这样的内容:
这里的 locals=0 表示局部变量表为空,因为静态方法属于类级别方法,不需要 this 引用,也就没有局部变量。
本地方法栈与虚拟机栈相似,区别在于虚拟机栈是为 JVM 执行 Java 编写的方法服务的,而本地方法栈是为 Java 调用本地 native 方法服务的,通常由 C/C++ 编写。
在本地方法栈中,主要存放了 native 方法的局部变量、动态链接和方法出口等信息。当一个 Java 程序调用一个 native 方法时,JVM 会切换到本地方法栈来执行这个方法。
当 Java 应用需要与操作系统底层或硬件交互时,通常会用到本地方法栈。
比如调用操作系统的特定功能,如内存管理、文件操作、系统时间、系统调用等。
详细说明一下:
比如说获取系统时间的 System.currentTimeMillis()
方法就是调用本地方法,来获取操作系统当前时间的。
再比如 JVM 自身的一些底层功能也需要通过本地方法来实现。像 Object 类中的 hashCode()
方法、clone()
方法等。
推荐阅读:手把手教你用 C语言实现 Java native 本地方法
native 方法是在 Java 中通过 native 关键字声明的,用于调用非 Java 语言,如 C/C++ 编写的代码。Java 可以通过 JNI,也就是 Java Native Interface 与底层系统、硬件设备、或者本地库进行交互。
堆是 JVM 中最大的一块内存区域,被所有线程共享,在 JVM 启动时创建,主要用来存储 new 出来的对象。
Java 中“几乎”所有的对象都会在堆中分配,堆也是垃圾收集器管理的目标区域。
从内存回收的角度来看,由于垃圾收集器大部分都是基于分代收集理论设计的,所以堆又被细分为新生代
、老年代
、Eden空间
、From Survivor空间
、To Survivor空间
等。
随着 JIT 编译器的发展和逃逸技术的逐渐成熟,“所有的对象都会分配到堆上”就不再那么绝对了。
从 JDK 7 开始,JVM 默认开启了逃逸分析,意味着如果某些方法中的对象引用没有被返回或者没有在方法体外使用,也就是未逃逸出去,那么对象可以直接在栈上分配内存。
堆属于线程共享的内存区域,几乎所有 new 出来的对象都会堆上分配,生命周期不由单个方法调用所决定,可以在方法调用结束后继续存在,直到不再被任何变量引用,最后被垃圾收集器回收。
栈属于线程私有的内存区域,主要存储局部变量、方法参数、对象引用等,通常随着方法调用的结束而自动释放,不需要垃圾收集器处理。
方法区并不真实存在,属于 Java 虚拟机规范中的一个逻辑概念,用于存储已被 JVM 加载的类信息、常量、静态变量、即时编译器编译后的代码缓存等。
在 HotSpot 虚拟机中,方法区的实现称为永久代 PermGen,但在 Java 8 及之后的版本中,已经被元空间 Metaspace 所替代。
对于局部变量,它存储在当前方法栈帧中的局部变量表中。当方法执行完毕,栈帧被回收,局部变量也会被释放。
public void method() {
int localVar = 100; // 局部变量,存储在栈帧中的局部变量表里
}
对于静态变量来说,它存储在 Java 虚拟机规范中的方法区中,在 Java 7 中是永久带,在 Java8 及以后 是元空间。
public class StaticVarDemo {
public static int staticVar = 100; // 静态变量,存储在方法区中
}
- Java 面试指南(付费)收录的京东同学 10 后端实习一面的原题:堆和栈的区别是什么
- Java 面试指南(付费)收录的比亚迪面经同学 3 Java 技术一面面试原题:介绍一下 JVM 运行时数据区
- Java 面试指南(付费)收录的字节跳动面经同学 1 Java 后端技术一面面试原题:讲一下 JVM 内存结构?
- Java 面试指南(付费)收录的京东面经同学 1 Java 技术一面面试原题:说说 JVM 运行时数据区
- Java 面试指南(付费)收录的美团面经同学 2 Java 后端技术一面面试原题:JVM 内存结构了解吗?
- Java 面试指南(付费)收录的快手面经同学 1 部门主站技术部面试原题:请说一下 Java 的内存区域,程序计数器等?
- Java 面试指南(付费)收录的字节跳动面经同学 8 Java 后端实习一面面试原题:jvm 内存分布,有垃圾回收的是哪些地方
- Java 面试指南(付费)收录的得物面经同学 8 一面面试原题:说一说 jvm 内存区域
- Java 面试指南(付费)收录的美团面经同学 3 Java 后端技术一面面试原题:jmm 内存模型 栈 方法区存放的是什么
- Java 面试指南(付费)收录的收钱吧面经同学 1 Java 后端一面面试原题:你提到了栈帧,那局部变量表除了栈帧还有什么?一个什么都没有的空方法,完全空的参数什么都没有,那局部变量表里有没有变量?
- Java 面试指南(付费)收录的招银网络科技面经同学 9 Java 后端技术一面面试原题:Java堆内存和栈内存的区别
- Java 面试指南(付费)收录的 OPPO 面经同学 1 面试原题:说一下JVM内存模型
- Java 面试指南(付费)收录的深信服面经同学 3 Java 后端线下一面面试原题:JVM变量存在堆栈的位置?
- Java 面试指南(付费)收录的TP联洲同学 5 Java 后端一面的原题:Jvm内存区域,本地方法栈的运行场景,Native方法解释一下
- Java 面试指南(付费)收录的字节跳动同学 17 后端技术面试原题:jvm结构 运行时数据区有什么结构 堆存什么
- Java 面试指南(付费)收录的腾讯面经同学 29 Java 后端一面原题:new一个对象存放在哪里?(运行时数据区),局部变量存在JVM哪里
JDK 1.6 使用永久代来实现方法区:
JDK 1.7 时仍然是永久带,但发生了一些细微变化,比如将字符串常量池、静态变量存放到了堆上。
在 JDK 1.8 时,直接在内存中划出了一块区域,叫元空间,来取代之前放在 JVM 内存中的永久代,并将运行时常量池、类常量池都移动到了元空间。
客观上,永久代会导致 Java 应用程序更容易出现内存溢出的问题,因为它要受到 JVM 内存大小的限制。
HotSpot 虚拟机的永久代大小可以通过 -XX:MaxPermSize
参数来设置,32 位机器默认的大小为 64M,64 位的机器则为 85M。
而 J9 和 JRockit 虚拟机就不存在这种限制,只要没有触碰到进程可用的内存上限,例如 32 位系统中的 4GB 限制,就不会出问题。
主观上,当 Oracle 收购 BEA 获得了 JRockit 的所有权后,就准备把 JRockit 中的优秀功能移植到 HotSpot 中。
如 Java Mission Control 管理工具。
但因为两个虚拟机对方法区实现有差异,导致这项工作遇到了很多阻力。
考虑到 HotSpot 虚拟机未来的发展,JDK 6 的时候,开发团队就打算放弃永久代了。
JDK 7 的时候,前进了一小步,把原本放在永久代的字符串常量池、静态变量等移动到了堆中。
JDK 8 就终于完成了这项移出工作,这样的好处就是,元空间的大小不再受到 JVM 内存的限制,而是可以像 J9 和 JRockit 那样,只要系统内存足够,就可以一直用。
当我们使用 new 关键字创建一个对象时,JVM 首先会检查 new 指令的参数是否能在常量池中定位到类的符号引用,然后检查这个符号引用代表的类是否已被加载、解析和初始化。如果没有,就先执行类加载。
如果已经加载,JVM 会为对象分配内存完成初始化,比如数值类型的成员变量初始值是 0,布尔类型是 false,对象类型是 null。
接下来会设置对象头,里面包含了对象是哪个类的实例、对象的哈希码、对象的 GC 分代年龄等信息。
最后,JVM 会执行构造方法 <init>
完成赋值操作,将成员变量赋值为预期的值,比如 int age = 18
,这样一个对象就创建完成了。
当对象不再被任何引用指向时,就会变成垃圾。垃圾收集器会通过可达性分析算法判断对象是否存活,如果对象不可达,就会被回收。
垃圾收集器通过标记清除、标记复制、标记整理等算法来回收内存,将对象占用的内存空间释放出来。
可以通过 java -XX:+PrintCommandLineFlags -version
和 java -XX:+PrintGCDetails -version
命令查看 JVM 的 GC 收集器。
可以看到,我本机安装的 JDK 8 默认使用的是 Parallel Scavenge + Parallel Old
。
不同参数代表对应的垃圾收集器表单:
新生代 | 老年代 | JVM参数 |
---|---|---|
Serial | Serial | -XX:+UseSerialGC |
Parallel Scavenge | Serial | -XX:+UseParallelGC -XX:-UseParallelOldGC |
Parallel Scavenge | Parallel Old | -XX:+UseParallelGC -XX:+UseParallelOldGC |
Parallel New | CMS | -XX:+UseParNewGC -XX:+UseConcMarkSweepGC |
G1 | -XX:+UseG1GC |
- Java 面试指南(付费)收录的比亚迪面经同学 3 Java 技术一面面试原题:对象创建到销毁的流程
- Java 面试指南(付费)收录的美团面经同学 2 Java 后端技术一面面试原题:说说创建对象的流程?
- Java 面试指南(付费)收录的携程面经同学 1 Java 后端技术一面面试原题:对象创建到销毁,内存如何分配的,(类加载和对象创建过程,CMS,G1 内存清理和分配)
在堆中为对象分配内存时,主要使用两种策略:指针碰撞和空闲列表。
指针碰撞适用于管理简单、碎片化较少的内存区域,如年轻代;而空闲列表适用于内存碎片化较严重或对象大小差异较大的场景如老年代。
假设堆内存是一个连续的空间,分为两个部分,一部分是已经被使用的内存,另一部分是未被使用的内存。
在分配内存时,Java 虚拟机会维护一个指针,指向下一个可用的内存地址,每次分配内存时,只需要将指针向后移动一段距离,如果没有发生碰撞,就将这段内存分配给对象实例。
JVM 维护一个列表,记录堆中所有未占用的内存块,每个内存块都记录有大小和地址信息。
当有新的对象请求内存时,JVM 会遍历空闲列表,寻找足够大的空间来存放新对象。
分配后,如果选中的内存块未被完全利用,剩余的部分会作为一个新的内存块加入到空闲列表中。
- Java 面试指南(付费)收录的携程面经同学 1 Java 后端技术一面面试原题:对象创建到销毁,内存如何分配的,(类加载和对象创建过程,CMS,G1 内存清理和分配)
memo:2025 年 1 月 10 日修改到此
会。
new 对象时,指针会向右移动一个对象大小的距离,假如一个线程 A 正在给字符串对象 s 分配内存,另外一个线程 B 同时为 ArrayList 对象 l 分配内存,两个线程就发生了抢占。
为了解决堆内存分配的竞争问题,JVM 为每个线程保留了一小块内存空间,被称为 TLAB,也就是线程本地分配缓冲区,用于存放该线程分配的对象。
当线程需要分配对象时,直接从 TLAB 中分配。只有当 TLAB 用尽或对象太大需要直接在堆中分配时,才会使用全局分配指针。
这里简单测试一下 TLAB。
可以通过 java -XX:+PrintFlagsFinal -version | grep TLAB
命令查看当前 JVM 是否开启了 TLAB。
如果开启了 TLAB,会看到类似以下的输出,其中 bool UseTLAB 的值为 true。
我们编写一个简单的测试类,创建大量对象并强制触发垃圾回收,查看 TLAB 的使用情况。
class TLABDemo {
public static void main(String[] args) {
for (int i = 0; i < 10_000_000; i++) {
allocate(); // 创建大量对象
}
System.gc(); // 强制触发垃圾回收
}
private static void allocate() {
// 小对象分配,通常会使用 TLAB
byte[] bytes = new byte[64];
}
}
在 VM 参数中添加 -XX:+UseTLAB -XX:+PrintTLAB -XX:+PrintGCDetails -XX:+PrintGCDateStamps
,运行后可以看到这样的内容:
- waste:未使用的 TLAB 空间。
- alloc:分配到 TLAB 的空间。
- refills:TLAB 被重新填充的次数。
可以看到,当前线程的 TLAB 目标大小为 10,496 KB(desired_size: 10496KB
);未发生慢分配(slow allocs: 0
);分配效率直接拉满(alloc: 1.00000 52494KB
)。
当使用 -XX:-UseTLAB -XX:+PrintGCDetails
关闭 TLAB 时,会看到类似以下的输出:
直接出现了两次 GC,因为没有 TLAB,Eden 区更快被填满,导致年轻代 GC。年轻代 GC 频繁触发,一部分长生命周期对象被晋升到老年代,间接导致老年代 GC 触发。
好的。
对象的内存布局是由 Java 虚拟机规范定义的,但具体的实现细节各有不同,如 HotSpot 和 OpenJ9 就不一样。
就拿我们常用的 HotSpot 来说吧。
对象在内存中包括三部分:对象头、实例数据和对齐填充。
对象头是对象存储在内存中的元信息,包含了Mark Word、类型指针等信息。
Mark Word 存储了对象的运行时状态信息,包括锁、哈希值、GC 标记等。在 64 位操作系统下占 8 个字节,32 位操作系统下占 4 个字节。
类型指针指向对象所属类的元数据,也就是 Class 对象,用来支持多态、方法调用等功能。
除此之外,如果对象是数组类型,还会有一个额外的数组长度字段。占 4 个字节。
类型指针可能会被压缩,以节省内存空间。比如说在开启压缩指针的情况下占 4 个字节,否则占 8 个字节。在 JDK 8 中,压缩指针默认是开启的。
可以通过 java -XX:+PrintFlagsFinal -version | grep UseCompressedOops
命令来查看 JVM 是否开启了压缩指针。
如果压缩指针开启,输出结果中的 bool UseCompressedOops 值为 true。
了解一些。
实例数据是对象实际的字段值,也就是成员变量的值,按照字段在类中声明的顺序存储。
class ObjectDemo {
int age;
String name;
}
JVM 会对这些数据进行对齐/重排,以提高内存访问速度。
由于 JVM 的内存模型要求对象的起始地址是 8 字节对齐(64 位 JVM 中),因此对象的总大小必须是 8 字节的倍数。
如果对象头和实例数据的总长度不是 8 的倍数,JVM 会通过填充额外的字节来对齐。
比如说,如果对象头 + 实例数据 = 14 字节,则需要填充 2 个字节,使总长度变为 16 字节。
因为 CPU 进行内存访问时,一次寻址的指针大小是 8 字节,正好是 L1 缓存行的大小。如果不进行内存对齐,则可能出现跨缓存行访问,导致额外的缓存行加载,CPU 的访问效率就会降低。
比如说上图中 obj1 占 6 个字节,由于没有对齐,导致这一行缓存中多了 2 个字节 obj2 的数据,当 CPU 访问 obj2 的时候,就会导致缓存行刷新。
也就说,8 字节对齐,是为了效率的提高,以空间换时间的一种方案。
一般来说,目前的操作系统都是 64 位的,并且 JDK 8 中的压缩指针是默认开启的,因此在 64 位的 JVM 上,new Object()
的大小是 16 字节(12 字节的对象头 + 4 字节的对齐填充)。
对象头的大小是固定的,在 32 位 JVM 上是 8 字节,在 64 位 JVM 上是 16 字节;如果开启了压缩指针,就是 12 字节。
实例数据的大小取决于对象的成员变量和它们的类型。对于new Object()
来说,由于默认没有成员变量,因此我们可以认为此时的实例数据大小是 0。
假如 MyObject 对象有三个成员变量,分别是 int、long 和 byte 类型,那么它们占用的内存大小分别是 4 字节、8 字节和 1 字节。
class MyObject {
int a; // 4 字节
long b; // 8 字节
byte c; // 1 字节
}
考虑到对齐填充,MyObject 对象的总大小为 12(对象头) + 4(a) + 8(b) + 1(c) + 7(填充) = 32 字节。
用过。
JOL 是一款分析 JVM 对象布局的工具。
第一步,在 pom.xml 中引入 JOL 依赖:
<dependency>
<groupId>org.openjdk.jol</groupId>
<artifactId>jol-core</artifactId>
<version>0.9</version>
</dependency>
第二步,使用 JOL 编写代码示例:
public class JOLSample {
public static void main(String[] args) {
// 打印JVM详细信息(可选)
System.out.println(VM.current().details());
// 创建Object实例
Object obj = new Object();
// 打印Object实例的内存布局
String layout = ClassLayout.parseInstance(obj).toPrintable();
System.out.println(layout);
}
}
第三步,运行代码,查看输出结果:
可以看到有 OFFSET、SIZE、TYPE DESCRIPTION、VALUE 这几个信息。
- OFFSET:偏移地址,单位字节;
- SIZE:占用的内存大小,单位字节;
- TYPE DESCRIPTION:类型描述,其中 object header 为对象头;
- VALUE:对应内存中当前存储的值,二进制 32 位;
从上面的结果能看到,对象头是 12 个字节,还有 4 个字节的 padding,new Object()
一共 16 个字节。
推荐阅读:Object o = new Object()占多少个字节?
在 64 位 JVM 上,未开启压缩指针时,对象引用占用 8 字节;开启压缩指针时,对象引用会被压缩到 4 字节。HotSpot 虚拟机默认是开启压缩指针的。
我们来验证一下:
class ReferenceSizeExample {
private static class ReferenceHolder {
Object reference;
}
public static void main(String[] args) {
System.out.println(VM.current().details());
System.out.println(ClassLayout.parseClass(ReferenceHolder.class).toPrintable());
}
}
运行代码,查看输出结果:
ReferenceHolder.reference 的大小为 4 字节。
- Java 面试指南(付费)收录的帆软同学 3 Java 后端一面的原题:Object a = new object()的大小,对象引用占多少大小?
- Java 面试指南(付费)收录的去哪儿面经同学 1 技术二面面试原题:Object 底层的数据结构(蒙了)
memo:2025 年 1 月 11 日修改到此
主流的方式有两种:句柄和直接指针。
两种方式的区别在于,句柄是通过一个中间的句柄表来定位对象的,而直接指针则是通过引用直接指向对象的内存地址。
优点是,对象被移动时只需要修改句柄表中的指针,而不需要修改对象引用本身。
在直接指针访问中,引用直接存储对象的内存地址;对象的实例数据和类型信息都存储在堆中固定的内存区域。
优点是访问速度更快,因为少了一次句柄的寻址操作。缺点是如果对象在内存中移动,引用需要更新为新的地址。
HotSpot 虚拟机主要使用直接指针来进行对象访问。
四种,分别是强引用、软引用、弱引用和虚引用。
强引用是 Java 中最常见的引用类型。使用 new 关键字赋值的引用就是强引用,只要强引用关联着对象,垃圾收集器就不会回收这部分对象,即使内存不足。
// str 就是一个强引用
String str = new String("沉默王二");
软引用于描述一些非必须对象,通过 SoftReference 类实现。软引用的对象在内存不足时会被回收。
// softRef 就是一个软引用
SoftReference<String> softRef = new SoftReference<>(new String("沉默王二"));
弱引用用于描述一些短生命周期的非必须对象,如 ThreadLocal 中的 Entry,就是通过 WeakReference 类实现的。弱引用的对象会在下一次垃圾回收时会被回收,不论内存是否充足。
static class Entry extends WeakReference<ThreadLocal<?>> {
/** The value associated with this ThreadLocal. */
Object value;
//节点类
Entry(ThreadLocal<?> k, Object v) {
//key赋值
super(k);
//value赋值
value = v;
}
}
虚引用主要用来跟踪对象被垃圾回收的过程,通过 PhantomReference 类实现。虚引用的对象在任何时候都可能被回收。
// phantomRef 就是一个虚引用
PhantomReference<String> phantomRef = new PhantomReference<>(new String("沉默王二"), new ReferenceQueue<>());
- Java 面试指南(付费)收录的京东同学 4 云实习面试原题:四个引用(强软弱虚)
了解。Java 堆被划分为新生代和老年代两个区域。
新生代又被划分为 Eden 空间和两个 Survivor 空间(From 和 To)。
新创建的对象会被分配到 Eden 空间。当 Eden 区填满时,会触发一次 Minor GC,清除不再使用的对象。存活下来的对象会从 Eden 区移动到 Survivor 区。
对象在新生代中经历多次 GC 后,如果仍然存活,会被移动到老年代。当老年代内存不足时,会触发 Major GC,对整个堆进行垃圾回收。
- Java 面试指南(付费)收录的得物面经同学 8 一面面试原题:Java 中堆内存怎么组织的
- Java 面试指南(付费)收录的腾讯面经同学 27 云后台技术一面面试原题:怎么来区分对象是属于哪个代的?
新生代的垃圾收集主要采用标记-复制算法,因为新生代的存活对象比较少,每次复制少量的存活对象效率比较高。
基于这种算法,虚拟机将内存分为一块较大的 Eden 空间和两块较小的 Survivor 空间,每次分配内存只使用 Eden 和其中一块 Survivor。发生垃圾收集时,将 Eden 和 Survivor 中仍然存活的对象一次性复制到另外一块 Survivor 空间上,然后直接清理掉 Eden 和已用过的那块 Survivor 空间。默认 Eden 和 Survivor 的大小比例是 8∶1。
对象通常会在年轻代中分配,随着时间的推移和垃圾收集的进程,某些满足条件的对象会进入到老年代中,如长期存活的对象。
JVM 会为对象维护一个“年龄”计数器,记录对象在新生代中经历 Minor GC 的次数。每次 GC 未被回收的对象,其年龄会加 1。
当超过一个特定阈值,默认值是 15,就会被认为老对象了,需要重点关照。这个年龄阈值可以通过 JVM 参数-XX:MaxTenuringThreshold
来设置。
可以通过 jinfo -flag MaxTenuringThreshold $(jps | grep -i nacos | awk '{print $1}')
来查看当前 JVM 的年龄阈值。
- 如果应用中的对象存活时间较短,可以适当调大这个值,让对象在新生代多待一会儿
- 如果对象存活时间较长,可以适当调小这个值,让对象更快进入老年代,减少在新生代的复制次数
大对象是指占用内存较大的对象,如大数组、长字符串等。
int[] array = new int[1000000];
String str = new String(new char[1000000]);
其大小由 JVM 参数 -XX:PretenureSizeThreshold
控制,但在 JDK 8 中,默认值为 0,也就是说默认情况下,对象仅根据 GC 存活的次数来判断是否进入老年代。
G1 垃圾收集器中,大对象会直接分配到 HUMONGOUS 区域。当对象大小超过一个 Region 容量的 50% 时,会被认为是大对象。
Region 的大小可以通过 JVM 参数 -XX:G1HeapRegionSize
来设置,默认情况下从 1MB 到 32MB 不等,会根据堆内存大小动态调整。
可以通过 java -XX:+UseG1GC -XX:+PrintGCDetails -version
查看 G1 垃圾收集器的相关信息。
从结果上来看,我本机上 G1 的堆大小为 2GB,Region 的大小为 4MB。
如果 Survivor 区中所有对象的总大小超过了一定比例,通常是 Survivor 区的一半,那么年龄较小的对象也可能会被提前晋升到老年代。
这是因为如果年龄较小的对象在 Survivor 区中占用了较大的空间,会导致 Survivor 区中的对象复制次数增多,影响垃圾回收的效率。
- Java 面试指南(付费)收录的阿里面经同学 5 阿里妈妈 Java 后端技术一面面试原题:哪些情况下对象会进入老年代?
- Java 面试指南(付费)收录的京东面经同学 7 Java 后端技术一面面试原题:新生代对象转移到老年代的条件
- Java 面试指南(付费)收录的拼多多面经同学 4 技术一面面试原题:对象什么时候进入老年代
memo:2025 年 1 月 13 日修改到此
了解。
JVM 进行垃圾回收的过程中,会涉及到对象的移动,为了保证对象引用在移动过程中不被修改,必须暂停所有的用户线程,像这样的停顿,我们称之为Stop The World
。简称 STW。
JVM 会使用一个名为安全点(Safe Point)的机制来确保线程能够被安全地暂停,其过程包括四个步骤:
- JVM 发出暂停信号;
- 线程执行到安全点后,挂起自身并等待垃圾收集完成;
- 垃圾回收器完成 GC 操作;
- 线程恢复执行。
安全点是 JVM 的一种机制,常用于垃圾回收的 STW 操作,用于让线程在执行到某些特定位置时,可以被安全地暂停。
通常位于方法调用、循环跳转、异常处理等位置,以保证线程暂停时数据的一致性。
用个通俗的比喻,老王去拉车,车上的东西很重,老王累的汗流浃背,但是老王不能在上坡或者下坡时休息,只能在平地上停下来擦擦汗,喝口水。
推荐大家看看这个HotSpot JVM Deep Dive - Safepoint,对 safe point 有一个比较深入地解释。
不一定。
默认情况下,Java 对象是在堆中分配的,但 JVM 会进行逃逸分析,来判断对象的生命周期是否只在方法内部,如果是的话,这个对象可以在栈上分配。
举例来说,下面的代码中,对象 new Person()
的生命周期只在 testStackAllocation
方法内部,因此 JVM 会将这个对象分配在栈上。
public void testStackAllocation() {
Person p = new Person(); // 对象可能分配在栈上
p.name = "沉默王二是只狗";
p.age = 18;
System.out.println(p.name);
}
逃逸分析是一种 JVM 优化技术,用来分析对象的作用域和生命周期,判断对象是否逃逸出方法或线程。
可以通过分析对象的引用流向,判断对象是否被方法返回、赋值到全局变量、传递到其他线程等,来确定对象是否逃逸。
如果对象没有逃逸,就可以进行栈上分配、同步消除、标量替换等优化,以提高程序的性能。
可以通过 java -XX:+PrintFlagsFinal -version | grep DoEscapeAnalysis
来确认 JVM 是否开启了逃逸分析。
根据对象逃逸的范围,可以分为方法逃逸和线程逃逸。
当对象被方法外部的代码引用,生命周期超出了方法的范围,那么对象就必须分配在堆中,由垃圾收集器管理。
public Person createPerson() {
return new Person(); // 对象逃逸出方法
}
比如说 new Person()
创建的对象被返回,那么这个对象就逃逸出当前方法了。
再比如说,对象被另外一个线程引用,生命周期超出了当前线程,那么对象就必须分配在堆中,并且线程之间需要同步。
public void threadEscapeExample() {
Person p = new Person(); // 对象逃逸到另一个线程
new Thread(() -> {
System.out.println(p);
}).start();
}
对象 new Person()
被另外一个线程引用了,发生了线程逃逸。
主要有三个。
第一,如果确定一个对象不会逃逸,那么就可以考虑栈上分配,对象占用的内存随着栈帧出栈后销毁,这样一来,垃圾收集的压力就降低很多。
第二,线程同步需要加锁,加锁就要占用系统资源,如果逃逸分析能够确定一个对象不会逃逸出线程,那么这个对象就不用加锁,从而减少线程同步的开销。
第三,如果对象的字段在方法中独立使用,JVM 可以将对象分解为标量变量,避免对象分配。
public void scalarReplacementExample() {
Point p = new Point(1, 2);
System.out.println(p.getX() + p.getY());
}
如果 Point 对象未逃逸,JVM 可以优化为:
int x = 1;
int y = 2;
System.out.println(x + y);
- Java 面试指南(付费)收录的收钱吧面经同学 1 Java 后端一面面试原题:所有对象都在堆上对不对?
内存溢出,俗称 OOM,是指当程序请求分配内存时,由于没有足够的内存空间,从而抛出 OutOfMemoryError。
List<String> list = new ArrayList<>();
while (true) {
list.add("OutOfMemory".repeat(1000)); // 无限增加内存
}
可能是因为堆、元空间、栈或直接内存不足导致的。可以通过优化内存配置、减少对象分配来解决。
内存泄漏是指程序在使用完内存后,未能及时释放,导致占用的内存无法再被使用。随着时间的推移,内存泄漏会导致可用内存逐渐减少,最终导致内存溢出。
内存泄漏通常是因为长期存活的对象持有短期存活对象的引用,又没有及时释放,从而导致短期存活对象无法被回收而导致的。
class MemoryLeakExample {
private static List<Object> staticList = new ArrayList<>();
public void addObject() {
staticList.add(new Object()); // 对象不会被回收
}
}
用一个比较有味道的比喻来形容就是,内存溢出是排队去蹲坑,发现没坑了;内存泄漏,就是有人占着茅坑不拉屎,导致坑位不够用。
- Java 面试指南(付费)收录的京东面经同学 1 Java 技术一面面试原题:说说 OOM 的原因
- Java 面试指南(付费)收录的快手面经同学 1 部门主站技术部面试原题:了解 OOM 吗?
可以。
我就拿最常见的堆内存溢出来完成吧,堆内存溢出通常是因为创建了大量的对象,且长时间无法被垃圾收集器回收,导致的。
class HeapSpaceErrorGenerator {
public static void main(String[] args) {
// 第一步,创建一个大的容器
List<byte[]> bigObjects = new ArrayList<>();
try {
// 第二步,循环写入数据
while (true) {
// 第三步,创建一个大对象,一个大约 10M 的数组
byte[] bigObject = new byte[10 * 1024 * 1024];
// 第四步,将大对象添加到容器中
bigObjects.add(bigObject);
}
} catch (OutOfMemoryError e) {
System.out.println("OutOfMemoryError 发生在 " + bigObjects.size() + " 对象后");
throw e;
}
}
}
很快就会发生内存溢出。
这就相当于一个房子里,不断堆积不能被回收的杂物,那么房子很快就会被堆满了。
也可以通过 VM 参数设置堆内存大小为 -Xmx128M
,然后运行程序,出现的内存溢出的时间会更快。
可以看到,堆内存溢出发生在 11 个对象后。
- Java 面试指南(付费)收录的京东面经同学 1 Java 技术一面面试原题:说说 OOM 的原因
- Java 面试指南(付费)收录的快手面经同学 1 部门主站技术部面试原题:Java 哪些内存区域会发生 OOM?为什么?
memo:2025 年 1 月 14 日修改到此
比如说:
①、静态的集合中添加的对象越来越多,但却没有及时清理;
public class OOM {
static List list = new ArrayList();
public void oomTests(){
Object obj = new Object();
list.add(obj);
}
}
②、单例模式下对象持有的外部引用无法及时释放;
③、数据库、IO、Socket 等连接资源没有及时关闭;
try {
Connection conn = null;
Class.forName("com.mysql.jdbc.Driver");
conn = DriverManager.getConnection("url", "", "");
Statement stmt = conn.createStatement();
ResultSet rs = stmt.executeQuery("....");
} catch (Exception e) {
}finally {
//不关闭连接
}
④、变量的作用域不合理;
class Simple {
Object object;
public void method1(){
object = new Object();
//...其他代码
//由于作用域原因,method1执行完成之后,object 对象所分配的内存不会马上释放
}
}
⑤、hash 值发生变化但对象却没有改变,这也是为什么 String 被设计成不可变对象的原因之一,就是因为假如 String 的哈希值发生了改变,但对应的值没变,就导致 HashMap 中的对象无法被及时清理;
⑥、使用完 ThreadLocal 没有使用 remove 方法来进行清除。
推荐阅读:
有,内存泄漏是指程序在运行过程中由于未能正确释放已分配的内存,导致内存无法被重用,从而引发内存耗尽等问题。
当时在做技术派项目的时候,由于 ThreadLocal 没有及时清理导致出现了内存泄漏问题。
常用的可视化监控工具有 JConsole、VisualVM、JProfiler、Eclipse Memory Analyzer (MAT)等。
也可以使用 JDK 自带的 jmap、jstack、jstat 等命令行工具来配合内存泄露问题的排查。
严重的内存泄漏往往伴随频繁的 Full GC,所以排查内存泄漏问题时,可以从 Full GC 入手。
第一步,使用 jps -l
查看运行的 Java 进程 ID。
第二步,使用top -p [pid]
查看进程使用 CPU 和内存占用情况。
第三步,使用 top -Hp [pid]
查看进程下的所有线程占用 CPU 和内存情况。
第四步,抓取线程栈:jstack -F 29452 > 29452.txt
,可以多抓几次做个对比。
29452 为 pid,顺带作为文件名。
看看有没有线程死锁、死循环或长时间等待这些问题。
第五步,可以使用jstat -gcutil [pid] 5000 10
每隔 5 秒输出 GC 信息,输出 10 次,查看 YGC 和 Full GC 次数。
通常会出现 YGC 不增加或增加缓慢,而 Full GC 增加很快。
或使用 jstat -gccause [pid] 5000
输出 GC 摘要信息。
或使用 jmap -heap [pid]
查看堆的摘要信息,关注老年代内存使用是否达到阀值,若达到阀值就会执行 Full GC。
如果发现 Full GC
次数太多,就很大概率存在内存泄漏了。
第六步,生成 dump
文件,然后借助可视化工具分析哪个对象非常多,基本就能定位到问题根源了。
执行命令 jmap -dump:format=b,file=heap.hprof 10025
会输出进程 10025 的堆快照信息,保存到文件 heap.hprof 中。
第七步,可以使用图形化工具分析,如 JDK 自带的 VisualVM,从菜单 > 文件 > 装入 dump 文件。
然后在结果观察内存占用最多的对象,找到内存泄漏的源头。
- Java 面试指南(付费)收录的京东同学 10 后端实习一面的原题:什么是内存泄露
- Java 面试指南(付费)收录的快手面经同学 1 部门主站技术部面试原题:Java 哪些内存区域会发生 OOM?为什么?
- Java 面试指南(付费)收录的美团面经同学 4 一面面试原题:内存泄漏怎么排查
有,内存溢出,也就是 Out of Memory,是指当程序请求分配内存时,由于没有足够的内存空间满足其需求,从而触发的错误。
当时在做技术派的时候,由于上传的文件过大,没有正确处理,导致一下子撑爆了内存,程序直接崩溃了。
当发生 OOM 时,可以导出堆转储(Heap Dump)文件进行分析。如果 JVM 还在运行,可以使用 jmap 命令手动生成 Heap Dump 文件:
jmap -dump:format=b,file=heap.hprof <pid>
生成 Heap Dump 文件后,可以使用 MAT、JProfiler 等工具进行分析,查看内存中的对象占用情况,找到内存泄漏的原因。
如果生产环境的内存还有很多空余,可以适当增大堆内存大小,例如 -Xmx4g
参数。
或者检查代码中是否存在内存泄漏,如未关闭的资源、长生命周期的对象等。
之后,我会在本地进行压力测试,模拟高负载情况下的内存表现,确保修改有效,且没有引入新的问题。
- Java 面试指南(付费)收录的华为面经同学 9 Java 通用软件开发一面面试原题:如何排查 OOM?
- Java 面试指南(付费)收录的荣耀面经同学 4 面试原题:有没遇到内存泄露,溢出的情况,怎么发生和处理的?
2024 年 10 月 16 日增补
栈溢出(StackOverflowError)发生在程序调用栈的深度超过 JVM 允许的最大深度时。栈溢出的本质是因为线程的栈空间不足,导致无法再为新的栈帧分配内存。
当一个方法被调用时,JVM 会在栈中分配一个栈帧,用于存储该方法的执行信息。如果方法调用嵌套太深,栈帧不断压入栈中,最终会导致栈空间耗尽,抛出 StackOverflowError。
最常见的栈溢出场景是递归调用,尤其是没有正确的终止条件,导致递归无限进行。
class StackOverflowExample {
public static void recursiveMethod() {
// 没有终止条件的递归调用
recursiveMethod();
}
public static void main(String[] args) {
recursiveMethod(); // 导致栈溢出
}
}
另外,如果方法中定义了特别大的局部变量,栈帧会变得很大,导致栈空间更容易耗尽。
public class LargeLocalVariables {
public static void method() {
int[] largeArray = new int[1000000]; // 大量局部变量
method(); // 递归调用
}
public static void main(String[] args) {
method(); // 导致栈溢出
}
}
- Java 面试指南(付费)收录的 OPPO 面经同学 1 面试原题:什么情况下会发生栈溢出?
GitHub 上标星 10000+ 的开源知识库《二哥的 Java 进阶之路》第一版 PDF 终于来了!包括 Java 基础语法、数组&字符串、OOP、集合框架、Java IO、异常处理、Java 新特性、网络编程、NIO、并发编程、JVM 等等,共计 32 万余字,500+张手绘图,可以说是通俗易懂、风趣幽默……详情戳:太赞了,GitHub 上标星 10000+ 的 Java 教程
微信搜 沉默王二 或扫描下方二维码关注二哥的原创公众号沉默王二,回复 222 即可免费领取。
本题是增补的内容,by 2024 年 03 月 09 日;参照:深入理解 JVM 的垃圾回收机制
垃圾回收就是对内存堆中已经死亡的或者长时间没有使用的对象进行清除或回收。
JVM 在做 GC 之前,会先搞清楚什么是垃圾,什么不是垃圾,通常会通过可达性分析算法来判断对象是否存活。
在确定了哪些垃圾可以被回收后,垃圾收集器(如 CMS、G1、ZGC)要做的事情就是进行垃圾回收,可以采用标记清除算法、复制算法、标记整理算法、分代收集算法等。
技术派项目使用的 JDK 8,所以默认采用的是 CMS 垃圾收集器。
Java 的垃圾回收过程主要分为标记存活对象、清除无用对象、以及内存压缩/整理三个阶段。不同的垃圾回收器在执行这些步骤时会采用不同的策略和算法。
- Java 面试指南(付费)收录的华为 OD 技术一面遇到的一道原题。
- Java 面试指南(付费)收录的美团面经同学 2 Java 后端技术一面面试原题:了解 GC 吗?不可达判断知道吗?
- Java 面试指南(付费)收录的腾讯面经同学 26 暑期实习微信支付面试原题:JVM 垃圾删除
- Java 面试指南(付费)收录的得物面经同学 8 一面面试原题:Java 中垃圾回收的原理
- Java 面试指南(付费)收录的快手同学 2 一面面试原题:JVM了解吗?内存回收机制说一下?
- Java 面试指南(付费)收录的 OPPO 面经同学 1 面试原题:垃圾回收的过程是什么?
- Java 面试指南(付费)收录的vivo 面经同学 10 技术一面面试原题:说一下GC,有哪些方法
- Java 面试指南(付费)收录的荣耀面经同学 4 面试原题:对垃圾回收的理解?
- Java 面试指南(付费)收录的字节跳动同学 17 后端技术面试原题:垃圾回收机制 为什么要学jvm 内存泄漏场景
- Java 面试指南(付费)收录的腾讯面经同学 27 云后台技术一面面试原题:GC?怎么样去识别垃圾?
- Java 面试指南(付费)收录的理想汽车面经同学 2 一面面试原题:说说你对GC的了解?
- Java 面试指南(付费)收录的腾讯面经同学 29 Java 后端一面原题:JVM垃圾回收机制?
Java 通过可达性分析算法来判断一个对象是否还存活。
通过一组名为 “GC Roots” 的根对象,进行递归扫描,无法从根对象到达的对象就是“垃圾”,可以被回收。
这也是 G1、CMS 等主流垃圾收集器使用的主要算法。
每个对象有一个引用计数器,记录引用它的次数。当计数器为零时,对象可以被回收。
引用计数法无法解决循环引用的问题。例如,两个对象互相引用,但不再被其他对象引用,它们的引用计数都不为零,因此不会被回收。
在进行垃圾回收之前,JVM 会暂停所有正在执行的应用线程(称为 Stop-the-World)。
这是因为可达性分析过程必须确保在执行分析时,内存中的对象关系不会被应用线程修改。如果不暂停应用线程,可能会出现对象引用的改变,导致垃圾回收过程中判断对象是否可达的结果不一致,从而引发严重的内存错误或数据丢失。
- Java 面试指南(付费)收录的京东面经同学 7 京东到家面试原题:如何判断一个对象是否可以回收
- Java 面试指南(付费)收录的快手同学 2 一面面试原题:做可达性分析的时候,应该有哪些前置性的操作?
- Java 面试指南(付费)收录的京东面经同学 9 面试原题:什么样的对象算作垃圾对象
- Java 面试指南(付费)收录的同学 D 小米一面原题:gc中判断对象可回收的方式有哪些
- 推荐阅读:深入理解垃圾回收机制
- 推荐阅读:R 大的所谓“GC roots”
所谓的 GC Roots,就是一组必须活跃的引用,它们是程序运行时的起点,是一切引用链的源头。在 Java 中,GC Roots 包括以下几种:
- 虚拟机栈中的引用(方法的参数、局部变量等)
- 本地方法栈中 JNI 的引用
- 类静态变量
- 运行时常量池中的常量(String 或 Class 类型)
1、虚拟机栈中的引用(方法的参数、局部变量等)
来看下面这段代码:
public class StackReference {
public void greet() {
Object localVar = new Object(); // 这里的 localVar 是一个局部变量,存在于虚拟机栈中
System.out.println(localVar.toString());
}
public static void main(String[] args) {
new StackReference().greet();
}
}
在 greet 方法中,localVar 是一个局部变量,存在于虚拟机栈中,可以被认为是 GC Roots。
在 greet 方法执行期间,localVar 引用的对象是活跃的,因为它是从 GC Roots 可达的。
当 greet 方法执行完毕后,localVar 的作用域结束,localVar 引用的 Object 对象不再由任何 GC Roots 引用(假设没有其他引用指向这个对象),因此它将有资格作为垃圾被回收掉 😁。
2、本地方法栈中 JNI 的引用
Java 通过 JNI(Java Native Interface)提供了一种机制,允许 Java 代码调用本地代码(通常是 C 或 C++ 编写的代码)。
当调用 Java 方法时,虚拟机会创建一个栈帧并压入虚拟机栈,而当它调用本地方法时,虚拟机会通过动态链接直接调用指定的本地方法。
JNI 引用是在 Java 本地接口(JNI)代码中创建的引用,这些引用可以指向 Java 堆中的对象。
// 假设的JNI方法
public native void nativeMethod();
// 假设在C/C++中实现的本地方法
/*
* Class: NativeExample
* Method: nativeMethod
* Signature: ()V
*/
JNIEXPORT void JNICALL Java_NativeExample_nativeMethod(JNIEnv *env, jobject thisObj) {
jobject localRef = (*env)->NewObject(env, ...); // 在本地方法栈中创建JNI引用
// localRef 引用的Java对象在本地方法执行期间是活跃的
}
在本地(C/C++)代码中,localRef 是对 Java 对象的一个 JNI 引用,它在本地方法执行期间保持 Java 对象活跃,可以被认为是 GC Roots。
一旦 JNI 方法执行完毕,除非这个引用是全局的(Global Reference),否则它指向的对象将会被作为垃圾回收掉(假设没有其他地方再引用这个对象)。
3、类静态变量
来看下面这段代码:
public class StaticFieldReference {
private static Object staticVar = new Object(); // 类静态变量
public static void main(String[] args) {
System.out.println(staticVar.toString());
}
}
StaticFieldReference 类中的 staticVar 引用了一个 Object 对象,这个引用存储在元空间,可以被认为是 GC Roots。
只要 StaticFieldReference 类未被卸载,staticVar 引用的对象都不会被垃圾回收。如果 StaticFieldReference 类被卸载(这通常发生在其类加载器被垃圾回收时),那么 staticVar 引用的对象也将有资格被垃圾回收(如果没有其他引用指向这个对象)。
4、运行时常量池中的常量
来看这段代码:
public class ConstantPoolReference {
public static final String CONSTANT_STRING = "Hello, World"; // 常量,存在于运行时常量池中
public static final Class<?> CONSTANT_CLASS = Object.class; // 类类型常量
public static void main(String[] args) {
System.out.println(CONSTANT_STRING);
System.out.println(CONSTANT_CLASS.getName());
}
}
在 ConstantPoolReference 中,CONSTANT_STRING 和 CONSTANT_CLASS 作为常量存储在运行时常量池。它们可以用来作为 GC Roots。
这些常量引用的对象(字符串"Hello, World"和 Object.class 类对象)在常量池中,只要包含这些常量的 ConstantPoolReference 类未被卸载,这些对象就不会被垃圾回收。
- Java 面试指南(付费)收录的帆软同学 3 Java 后端一面的原题:哪些对象可以作为 GC Roots
- Java 面试指南(付费)收录的腾讯面经同学 27 云后台技术一面面试原题:GC Root?
- Java 面试指南(付费)收录的同学 D 小米一面原题:那些对象可以作为gc root
用一个不太贴切的比喻,垃圾回收就是古代的秋后问斩,finalize()就是刀下留人,在人犯被处决之前,还要做最后一次审计,青天大老爷看看有没有什么冤情,需不需要刀下留人。
如果对象在进行可达性分析后发现没有与 GC Roots 相连接的引用链,那它将会被第一次标记,随后进行一次筛选,筛选的条件是此对象是否有必要执行 finalize()方法。如果对象在在 finalize()中成功拯救自己——只要重新与引用链上的任何一个对象建立关联即可,譬如把自己 (this 关键字)赋值给某个类变量或者对象的成员变量,那在第二次标记时它就”逃过一劫“;但是如果没有抓住这个机会,那么对象就真的要被回收了。
垃圾收集算法主要有三种,分别是标记-清除算法、标记-复制算法和标记-整理算法。
标记-清除
算法分为两个阶段:
- 标记:标记所有需要回收的对象
- 清除:回收所有被标记的对象
优点是实现简单,缺点是回收过程中会产生内存碎片。
标记-复制
算法可以解决标记-清除算法的内存碎片问题,因为它将内存空间划分为两块,每次只使用其中一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后清理掉这一块。
缺点是浪费了一半的内存空间。
标记-整理
算法是标记-清除复制算法的升级版,它不再划分内存空间,而是将存活的对象向内存的一端移动,然后清理边界以外的内存。
缺点是移动对象的成本比较高。
分代收集
算法是目前主流的垃圾收集算法,它根据对象存活周期的不同将内存划分为几块,一般分为新生代和老年代。
新生代用复制算法,因为大部分对象生命周期短。老年代用标记-整理算法,因为对象存活率较高。
分代收集算法的核心思想是根据对象的生命周期优化垃圾回收。
新生代的对象生命周期短,使用复制算法可以快速回收。老年代的对象生命周期长,使用标记-整理算法可以减少移动对象的成本。
在标记-复制算法 中,标记阶段和复制阶段都会触发STW。
- 标记阶段停顿是为了保证对象的引用关系不被修改。
- 复制阶段停顿是防止对象在复制过程中被修改。
- Java 面试指南(付费)收录的字节跳动面经同学 1 Java 后端技术一面面试原题:垃圾回收算法了解多少?
- Java 面试指南(付费)收录的小米面经同学 F 面试原题:垃圾回收的算法及详细介绍
- Java 面试指南(付费)收录的腾讯面经同学 27 云后台技术一面面试原题:回收的方法?分代收集算法里面具体是怎么回收的?为什么要用分代收集呢?
- Java 面试指南(付费)收录的百度同学 4 面试原题:Gc 算法有哪些?
- Java 面试指南(付费)收录的京东面经同学 9 面试原题:问了垃圾回收算法,针对问了每个算法的优缺点
- Java 面试指南(付费)收录的同学 D 小米一面原题:gc垃圾回收算法有哪些
Minor GC 也称为 Young GC,是指发生在年轻代(Young Generation)的垃圾收集。年轻代包含 Eden 区以及两个 Survivor 区。
Major GC 也称为 Old GC,主要指的是发生在老年代的垃圾收集。CMS 收集器的特有行为。
Mixed GC 是 G1 垃圾收集器特有的一种 GC 类型,它在一次 GC 中同时清理年轻代和部分老年代。
Full GC 是最彻底的垃圾收集,涉及整个 Java 堆和方法区(元空间)。它是最耗时的 GC,通常在 JVM 压力很大时发生。
Full GC 会从 GC Root 出发,标记所有可达对象。新生代使用复制算法,清空 Eden 区。老年代使用标记-整理算法,回收对象并消除碎片。
停顿时间较长(STW),会影响系统响应性能。
- Java 面试指南(付费)收录的阿里面经同学 5 阿里妈妈 Java 后端技术一面面试原题:full gc 和 young gc 的区别
- Java 面试指南(付费)收录的腾讯面经同学 27 云后台技术一面面试原题:FULL gc怎么去清理的?
如果 Eden 区没有足够的空间时,就会触发 Young GC 来清理新生代。
- Java 面试指南(付费)收录的百度同学 4 面试原题:什么时候会触发 GC?
- 在进行 Young GC 的时候,如果发现
老年代可用的连续内存空间
<新生代历次 Young GC 后升入老年代的对象总和的平均大小
,说明本次 Young GC 后升入老年代的对象大小,可能超过了老年代当前可用的内存空间,就会触发 Full GC。 - 执行 Young GC 后老年代没有足够的内存空间存放转入的对象,会立即触发一次 Full GC。
System.gc()
、jmap -dump
等命令会触发 full gc。
空间分配担保是指在进行 Minor GC(新生代垃圾回收)前,JVM 会确保老年代有足够的空间存放从新生代晋升的对象。如果老年代空间不足,可能会触发 Full GC。
- Java 面试指南(付费)收录的快手同学 4 一面原题:如何判断死亡对象?GC Roots有哪些?空间分配担保是什么?
推荐阅读:深入理解 JVM 的垃圾收集器:CMS、G1、ZGC
JVM 的垃圾收集器主要分为两大类:分代收集器和分区收集器,分代收集器的代表是 CMS,分区收集器的代表是 G1 和 ZGC。
CMS 是第一个关注 GC 停顿时间(STW 的时间)的垃圾收集器,JDK 1.5 时引入,JDK9 被标记弃用,JDK14 被移除。
G1(Garbage-First Garbage Collector)在 JDK 1.7 时引入,在 JDK 9 时取代 CMS 成为了默认的垃圾收集器。
ZGC 是 JDK11 推出的一款低延迟垃圾收集器,适用于大内存低延迟服务的内存管理和回收,在 128G 的大堆下,最大停顿时间才 1.68 ms,性能远胜于 G1 和 CMS。
Serial 收集器是最基础、历史最悠久的收集器。
如同它的名字(串行),它是一个单线程工作的收集器,使用一个处理器或一条收集线程去完成垃圾收集工作。并且进行垃圾收集时,必须暂停其他所有工作线程,直到垃圾收集结束——这就是所谓的“Stop The World”。
Serial/Serial Old 收集器的运行过程如图:
ParNew 收集器实质上是 Serial 收集器的多线程并行版本,使用多条线程进行垃圾收集。
ParNew/Serial Old 收集器运行示意图如下:
Parallel Scavenge 收集器是一款新生代收集器,基于标记-复制算法实现,也能够并行收集。和 ParNew 有些类似,但 Parallel Scavenge 主要关注的是垃圾收集的吞吐量——所谓吞吐量,就是 CPU 用于运行用户代码的时间和总消耗时间的比值,比值越大,说明垃圾收集的占比越小。
根据对象存活周期的不同会将内存划分为几块,一般是把 Java 堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。
Serial Old 是 Serial 收集器的老年代版本,它同样是一个单线程收集器,使用标记-整理算法。
Parallel Old 是 Parallel Scavenge 收集器的老年代版本,基于标记-整理算法实现,使用多条 GC 线程在 STW 期间同时进行垃圾回收。
CMS 在 JDK 1.5 时引入,JDK 9 时被标记弃用,JDK 14 时被移除。
CMS 是一种低延迟的垃圾收集器,采用标记-清除算法,分为初始标记、并发标记、重新标记和并发清除四个阶段,优点是垃圾回收线程和应用线程同时运行,停顿时间短,适合延迟敏感的应用,但容易产生内存碎片,可能触发 Full GC。
G1 在 JDK 1.7 时引入,在 JDK 9 时取代 CMS 成为默认的垃圾收集器。
G1 是一种面向大内存、高吞吐场景的垃圾收集器,它将堆划分为多个小的 Region,通过标记-整理算法,避免了内存碎片问题。优点是停顿时间可控,适合大堆场景,但调优较复杂。
ZGC 是 JDK 11 时引入的一款低延迟的垃圾收集器,最大特点是将垃圾收集的停顿时间控制在 10ms 以内,即使在 TB 级别的堆内存下也能保持较低的停顿时间。
它通过并发标记和重定位来避免大部分 Stop-The-World 停顿,主要依赖指针染色来管理对象状态。
- 标记对象的可达性:通过在指针上增加标记位,不需要额外的标记位即可判断对象的存活状态。
- 重定位状态:在对象被移动时,可以通过指针染色来更新对象的引用,而不需要等待全局同步。
适用于需要超低延迟的场景,比如金融交易系统、电商平台。
垃圾回收器的核心作用是自动管理 Java 应用程序的运行时内存。它负责识别哪些内存是不再被应用程序使用的(即“垃圾”),并释放这些内存以便重新使用。
这一过程减少了程序员手动管理内存的负担,降低了内存泄漏和溢出错误的风险。
- Java 面试指南(付费)收录的滴滴同学 2 技术二面的原题:了解哪些垃圾回收器,只能回收一个代(新生代、老年代)吗,使用的 jdk 版本
- Java 面试指南(付费)收录的京东同学 10 后端实习一面的原题:垃圾回收器的作用是什么
- Java 面试指南(付费)收录的携程面经同学 10 Java 暑期实习一面面试原题:有哪些垃圾回收器,选一个讲一下垃圾回收的流程
- Java 面试指南(付费)收录的京东同学 4 云实习面试原题:常见的 7 个 GC 回收器
- Java 面试指南(付费)收录的美团面经同学 15 点评后端技术面试原题:讲一下知道的垃圾回收器,问知不知道ZGC回收器(不知道)
- Java 面试指南(付费)收录的阿里云面经同学 22 面经:cms和g1的区别
- Java 面试指南(付费)收录的京东面经同学 9 面试原题:怎么理解并发和并行,Parallel Old和CMS有什么区别?
CMS 使用标记-清除算法进行垃圾收集,分 4 大步:
- 初始标记:标记所有从 GC Roots 直接可达的对象,这个阶段需要 STW,但速度很快。
- 并发标记:从初始标记的对象出发,遍历所有对象,标记所有可达的对象。这个阶段是并发进行的。
- 重新标记:完成剩余的标记工作,包括处理并发阶段遗留下来的少量变动,这个阶段通常需要短暂的 STW 停顿。
- 并发清除:清除未被标记的对象,回收它们占用的内存空间。
是的,remark 阶段通常会结合三色标记法来执行,确保在并发标记期间所有存活对象都被正确标记。目的是修正并发标记阶段中可能遗漏的对象引用变化。
在 remark 阶段,垃圾收集器会停止应用线程(STW),以确保在这个阶段不会有引用关系的进一步变化。这种暂停通常很短暂。remark 阶段主要包括以下操作:
- 处理写屏障记录的引用变化:在并发标记阶段,应用程序可能会更新对象的引用(比如一个黑色对象新增了对一个白色对象的引用),这些变化通过写屏障记录下来。在 remark 阶段,GC 会处理这些记录,确保所有可达对象都正确地标记为灰色或黑色。
- 扫描灰色对象:再次遍历灰色对象,处理它们的所有引用,确保引用的对象正确标记为灰色或黑色。
- 清理:确保所有引用关系正确处理后,灰色对象标记为黑色,白色对象保持不变。这一步完成后,所有存活对象都应当是黑色的。
三色标记法用于标记对象的存活状态,它将对象分为三类:
- 白色(White):尚未访问的对象。垃圾回收结束后,仍然为白色的对象会被认为是不可达的对象,可以回收。
- 灰色(Gray):已经访问到但未标记完其引用的对象。灰色对象是需要进一步处理的。
- 黑色(Black):已经访问到并且其所有引用对象都已经标记过。黑色对象是完全处理过的,不需要再处理。
三色标记法的工作流程:
①、初始标记(Initial Marking):从 GC Roots 开始,标记所有直接可达的对象为灰色。
②、并发标记(Concurrent Marking):在此阶段,标记所有灰色对象引用的对象为灰色,然后将灰色对象自身标记为黑色。这个过程是并发的,和应用线程同时进行。
此阶段的一个问题是,应用线程可能在并发标记期间修改对象的引用关系,导致一些对象的标记状态不准确。
③、重新标记(Remarking):重新标记阶段的目标是处理并发标记阶段遗漏的引用变化。为了确保所有存活对象都被正确标记,remark 需要在 STW 暂停期间执行。
④、使用写屏障(Write Barrier)来捕捉并发标记阶段应用线程对对象引用的更新。通过遍历这些更新的引用来修正标记状态,确保遗漏的对象不会被错误地回收。
推荐阅读:小道哥的三色标记
- Java 面试指南(付费)收录的携程面经同学 10 Java 暑期实习一面面试原题:有哪些垃圾回收器,选一个讲一下垃圾回收的流程
- Java 面试指南(付费)收录的携程面经同学 1 Java 后端技术一面面试原题:对象创建到销毁,内存如何分配的,(类加载和对象创建过程,CMS,G1 内存清理和分配)
- Java 面试指南(付费)收录的收钱吧面经同学 1 Java 后端一面面试原题:CMS用了什么垃圾回收算法?你提到了remark,那它remark具体是怎么执行的?三色标记法?
- Java 面试指南(付费)收录的京东面经同学 9 面试原题:问了CMS垃圾回收器
G1 在 JDK 1.7 时引入,在 JDK 9 时取代 CMS 成为默认的垃圾收集器。
G1 把 Java 堆划分为多个大小相等的独立区域Region,每个区域都可以扮演新生代(Eden 和 Survivor)或老年代的角色。
同时,G1 还有一个专门为大对象设计的 Region,叫 Humongous 区。
大对象的判定规则是,如果一个大对象超过了一个 Region 大小的 50%,比如每个 Region 是 2M,只要一个对象超过了 1M,就会被放入 Humongous 中。
这种区域化管理使得 G1 可以更灵活地进行垃圾收集,只回收部分区域而不是整个新生代或老年代。
G1 收集器的运行过程大致可划分为这几个步骤:
①、并发标记,G1 通过并发标记的方式找出堆中的垃圾对象。并发标记阶段与应用线程同时执行,不会导致应用线程暂停。
②、混合收集,在并发标记完成后,G1 会计算出哪些区域的回收价值最高(也就是包含最多垃圾的区域),然后优先回收这些区域。这种回收方式包括了部分新生代区域和老年代区域。
选择回收成本低而收益高的区域进行回收,可以提高回收效率和减少停顿时间。
③、可预测的停顿,G1 在垃圾回收期间仍然需要「Stop the World」。不过,G1 在停顿时间上添加了预测机制,用户可以 JVM 启动时指定期望停顿时间,G1 会尽可能地在这个时间内完成垃圾回收。
- Java 面试指南(付费)收录的京东面经同学 1 Java 技术一面面试原题:说说 G1 垃圾回收器的原理
- Java 面试指南(付费)收录的携程面经同学 1 Java 后端技术一面面试原题:对象创建到销毁,内存如何分配的,(类加载和对象创建过程,CMS,G1 内存清理和分配)
- Java 面试指南(付费)收录的百度同学 4 面试原题:G1 垃圾回收器了解吗?
- Java 面试指南(付费)收录的理想汽车面经同学 2 一面面试原题:了解过G1垃圾回收器吗?
特性 | CMS | G1 |
---|---|---|
设计目标 | 低停顿时间 | 可预测的停顿时间 |
并发性 | 是 | 是 |
内存碎片 | 是,容易产生碎片 | 否,通过区域划分和压缩减少碎片 |
收集代数 | 年轻代和老年代 | 整个堆,但区分年轻代和老年代 |
并发阶段 | 并发标记、并发清理 | 并发标记、并发清理、并发回收 |
停顿时间预测 | 较难预测 | 可配置停顿时间目标 |
容易出现的问题 | 内存碎片、Concurrent Mode Failure | 较少出现长时间停顿 |
CMS 适用于对延迟敏感的应用场景,主要目标是减少停顿时间,但容易产生内存碎片。G1 则提供了更好的停顿时间预测和内存压缩能力,适用于大内存和多核处理器环境。
- Java 面试指南(付费)收录的快手面经同学 5 面试原题:CMS 垃圾收集器和 G1 垃圾收集器什么区别
我们生产环境中采用了设计比较优秀的 G1 垃圾收集器,因为它不仅能满足低停顿的要求,而且解决了 CMS 的浮动垃圾问题、内存碎片问题。
G1 非常适合大内存、多核处理器的环境。
以上是比较符合面试官预期的回答,但实际上,大多数情况下我们可能还是使用的 JDK 8 默认垃圾收集器。
可以通过以下命令查看当前 JVM 的垃圾收集器:
java -XX:+PrintCommandLineFlags -version
UseParallelGC
= Parallel Scavenge + Parallel Old
,表示新生代用Parallel Scavenge
收集器,老年代使用Parallel Old
收集器。
因此你也可以这样回答:我们系统的业务相对复杂,但并发量并不是特别高,所以我们选择了适用于多核处理器、能够并行处理垃圾回收任务,且能提供高吞吐量的Parallel GC
。
但这个说法不讨喜,你也可以回答:
我们系统采用的是 CMS 收集器,能够最大限度减少应用暂停时间。
我们生产环境中采用了设计比较优秀的 G1 垃圾收集器,G1 采用的是分区式标记-整理算法,将堆划分为多个区域,按需回收,适用于大内存和多核环境,能够同时考虑吞吐量和暂停时间。
或者:
我们系统采用的是 CMS 收集器,CMS 采用的是标记-清除算法,能够并发标记和清除垃圾,减少暂停时间,适用于对延迟敏感的应用。
再或者:
我们系统采用的是 Parallel 收集器,Parallel 采用的是年轻代使用复制算法,老年代使用标记-整理算法,适用于高吞吐量要求的应用。
- Java 面试指南(付费)收录的华为 OD 面经同学 3 技术二面面试原题:工作中项目使用的什么垃圾回收算法
垃圾收集器的选择需要权衡的点还是比较多的——例如运行应用的基础设施如何?使用 JDK 的发行商是什么?等等……
这里简单地列一下上面提到的一些收集器的适用场景:
- Serial :如果应用程序有一个很小的内存空间(大约 100 MB)亦或它在没有停顿时间要求的单线程处理器上运行。
- Parallel:如果优先考虑应用程序的峰值性能,并且没有时间要求要求,或者可以接受 1 秒或更长的停顿时间。
- CMS/G1:如果响应时间比吞吐量优先级高,或者垃圾收集暂停必须保持在大约 1 秒以内。
- ZGC:如果响应时间是高优先级的,或者堆空间比较大。
GitHub 上标星 10000+ 的开源知识库《二哥的 Java 进阶之路》第一版 PDF 终于来了!包括 Java 基础语法、数组&字符串、OOP、集合框架、Java IO、异常处理、Java 新特性、网络编程、NIO、并发编程、JVM 等等,共计 32 万余字,500+张手绘图,可以说是通俗易懂、风趣幽默……详情戳:太赞了,GitHub 上标星 10000+ 的 Java 教程
微信搜 沉默王二 或扫描下方二维码关注二哥的原创公众号沉默王二,回复 222 即可免费领取。
-
操作系统工具
- top:显示系统整体资源使用情况
- vmstat:监控内存和 CPU
- iostat:监控 IO 使用
- netstat:监控网络使用
-
JDK 性能监控工具
- jps:虚拟机进程查看
- jstat:虚拟机运行时信息查看
- jinfo:虚拟机配置查看
- jmap:内存映像(导出)
- jhat:堆转储快照分析
- jstack:Java 堆栈跟踪
- jcmd:实现上面除了 jstat 外所有命令的功能
①、我一般会使用 jmap -heap <pid>
查看堆内存摘要,包括新生代、老年代、元空间等。
②、或者使用 jmap -histo <pid>
查看对象分布。
③、还有生成堆转储文件:jmap -dump:format=b,file=<path> <pid>
。
- Java 面试指南(付费)收录的哔哩哔哩同学 1 二面面试原题:你是如何使用jmap,你用过哪些命令?
我自己用过的可视化工具主要有:
①、JConsole:JDK 自带的监控工具,可以用来监视 Java 应用程序的运行状态,包括内存使用、线程状态、类加载、GC 等,还可以进行一些基本的性能分析。
②、VisualVM:VisualVM 是一个基于 NetBeans 平台的可视化工具,在很长一段时间内,VisualVM 都是 Oracle 官方主推的故障处理工具。集成了多个 JDK 命令行工具的功能,提供了一个友好的图形界面,非常适用于开发和生产环境。
③、Java Mission Control:JMC 最初是 JRockit VM 中的诊断工具,但在 Oracle JDK7 Update 40 以后,就绑定到了 HotSpot VM 中。不过后来又被 Oracle 开源出来作为一个单独的产品。
还有一些第三方的工具:
①、MAT:
- Java 堆内存分析工具,主要用于分析和查找 Java 堆中的内存泄漏和内存消耗问题。
- 可以从 Java 堆转储文件中分析内存使用情况,并提供丰富的报告,如内存泄漏疑点、最大对象和 GC 根信息。
- 支持通过图形界面查询对象,以及检查对象间的引用关系。
②、GChisto:GC 日志分析工具,帮助开发者优化垃圾收集行为和调整 GC 性能。
③、GCViewer:类似于 GChisto,也是用来分析 GC 日志,帮助开发者优化 Java 应用的垃圾回收过程。
④、JProfiler:一个全功能的商业 Java 性能分析工具,提供 CPU、 内存和线程的实时分析。
⑤、arthas:
- 阿里巴巴开源的 Java 诊断工具,主要用于线上的应用诊断。
- 支持在不停机的情况下进行 Java 应用的诊断。
- 包括 JVM 信息查看、监控、Trace 命令、反编译等。
⑥、async-profiler:一个低开销的性能分析工具,支持生成火焰图,适用于复杂性能问题的分析。
- Java 面试指南(付费)收录的华为面经同学 9 Java 通用软件开发一面面试原题:如何查看当前 Java 程序里哪些对象正在使用,哪些对象已经被释放
一些常见的参数配置:
堆配置:
- -Xms:初始堆大小
- -Xmx:最大堆大小
- -XX:NewSize=n:设置年轻代大小
- -XX:NewRatio=n:设置年轻代和年老代的比值。如:为 3 表示年轻代和年老代比值为 1:3,年轻代占整个年轻代年老代和的 1/4
- -XX:SurvivorRatio=n:年轻代中 Eden 区与两个 Survivor 区的比值。注意 Survivor 区有两个。如 3 表示 Eden: 3 Survivor:2,一个 Survivor 区占整个年轻代的 1/5
- -XX:MaxPermSize=n:设置持久代大小
收集器设置:
- -XX:+UseSerialGC:设置串行收集器
- -XX:+UseParallelGC:设置并行收集器
- -XX:+UseParalledlOldGC:设置并行年老代收集器
- -XX:+UseConcMarkSweepGC:设置并发收集器
并行收集器设置
- -XX:ParallelGCThreads=n:设置并行收集器收集时使用的 CPU 数。并行收集线程数
- -XX:MaxGCPauseMillis=n:设置并行收集最大的暂停时间(如果到这个时间了,垃圾回收器依然没有回收完,也会停止回收)
- -XX:GCTimeRatio=n:设置垃圾回收时间占程序运行时间的百分比。公式为:1/(1+n)
- -XX:+CMSIncrementalMode:设置为增量模式。适用于单 CPU 情况
- -XX:ParallelGCThreads=n:设置并发收集器年轻代手机方式为并行收集时,使用的 CPU 数。并行收集线程数
打印 GC 回收的过程日志信息
- -XX:+PrintGC
- -XX:+PrintGCDetails
- -XX:+PrintGCTimeStamps
- -Xloggc:filename
JVM 调优是一个复杂的过程,主要包括对堆内存、垃圾收集器、JVM 参数等进行调整和优化。
①、JVM 的堆内存主要用于存储对象实例,如果堆内存设置过小,可能会导致频繁的垃圾回收。所以,技术派实战项目是在启动 JVM 的时候就调整了一下 -Xms 和-Xmx 参数,让堆内存最大可用内存为 2G。
②、在项目运行期间,我会使用 JVisualVM 定期观察和分析 GC 日志,如果发现频繁的 Full GC,就需要特别关注老年代的使用情况。
接着,通过分析 Heap dump 寻找内存泄漏的源头,看看是否有未关闭的资源,长生命周期的大对象等。
之后,就要进行代码优化了,比如说减少大对象的创建、优化数据结构的使用方式、减少不必要的对象持有等。
- Java 面试指南(付费)收录的华为面经同学 6 Java 通用软件开发一面面试原题:说说你对 JVM 调优的了解
首先,使用 top 命令查看 CPU 占用情况,找到占用 CPU 较高的进程 ID。
top
接着,使用 jstack 命令查看对应进程的线程堆栈信息。
jstack -l <pid> > thread-dump.txt
上面 👆🏻 这个命令会将所有线程的堆栈信息输出到 thread-dump.txt 文件中。
然后再使用 top 命令查看进程中线程的占用情况,找到占用 CPU 较高的线程 ID。
top -H -p <pid>
注意,top 命令显示的线程 ID 是十进制的,而 jstack 输出的是十六进制的,所以需要将线程 ID 转换为十六进制。
printf "%x\n" PID
在 jstack 的输出中搜索这个十六进制的线程 ID,找到对应的堆栈信息。
"Thread-5" #21 prio=5 os_prio=0 tid=0x00007f812c018800 nid=0x1a85 runnable [0x00007f811c000000]
java.lang.Thread.State: RUNNABLE
at com.example.MyClass.myMethod(MyClass.java:123)
at ...
最后,根据堆栈信息定位到具体的业务方法,查看是否有死循环、频繁的垃圾回收(GC)、资源竞争(如锁竞争)导致的上下文频繁切换等问题。
- Java 面试指南(付费)收录的阿里面经同学 1 闲鱼后端一面的原题:上线的业务出了问题怎么调试,比如某个线程 cpu 占用率高,怎么看堆栈信息
- Java 面试指南(付费)收录的快手同学 4 一面原题:服务器的CPU占用持续升高,有哪些排查问题的手段?排查后发现是项目产生了内存泄露,如何确定问题出在哪里?
内存飚高一般是因为创建了大量的 Java 对象所导致的,如果持续飙高则说明垃圾回收跟不上对象创建的速度,或者内存泄漏导致对象无法回收。
排查的方法主要分为以下几步:
第一,先观察垃圾回收的情况,可以通过 jstat -gc PID 1000
查看 GC 次数和时间。
或者 jmap -histo PID | head -20
查看堆内存占用空间最大的前 20 个对象类型。
第二步,通过 jmap 命令 dump 出堆内存信息。
第三步,使用可视化工具分析 dump 文件,比如说 VisualVM,找到占用内存高的对象,再找到创建该对象的业务代码位置,从代码和业务场景中定位具体问题。
- Java 面试指南(付费)收录的联想面经同学 7 面试原题:怎么定位线上的内存问题。
频繁的 Minor GC(也称为 Young GC)通常表示新生代中的对象频繁地被垃圾回收,可能是因为新生代空间设置过小,或者是因为程序中存在大量的短生命周期对象(如临时变量、方法调用中创建的对象等)。
可以使用 GC 日志进行分析,查看 GC 的频率和耗时,找到频繁 GC 的原因。
-XX:+PrintGCDetails -Xloggc:gc.log
或者使用监控工具(如 VisualVM、jstat、jconsole 等)查看堆内存的使用情况,特别是新生代(Eden 和 Survivor 区)的使用情况。
如果是因为新生代空间不足,可以通过 -Xmn
增加新生代的大小,减少新生代的填满速度。
java -Xmn256m your-app.jar
如果对象未能在 Survivor 区足够长时间存活,就会被晋升到老年代,可以通过 -XX:SurvivorRatio
参数调整 Eden 和 Survivor 的比例。默认比例是 8:1,表示 8 个空间用于 Eden,1 个空间用于 Survivor 区。
-XX:SurvivorRatio=6
这将减少 Eden 区的大小,增加 Survivor 区的大小,以确保对象在 Survivor 区中存活的时间足够长,避免过早晋升到老年代。
- Java 面试指南(付费)收录的京东面经同学 8 面试原题:young GC频繁如何排查?修改哪些参数?
Full GC 是指对整个堆内存(包括新生代和老年代)进行垃圾回收操作。Full GC 频繁会导致应用程序的暂停时间增加,从而影响性能。
常见的原因有:
- 大对象(如大数组、大集合)直接分配到老年代,导致老年代空间快速被占用。
- 程序中存在内存泄漏,导致老年代的内存不断增加,无法被回收。比如 IO 资源未关闭。
- 一些长生命周期的对象进入到了老年代,导致老年代空间不足。
- 不合理的 GC 参数配置也导致 GC 频率过高。比如说新生代的空间设置过小。
大厂一般都会有专门的性能监控系统,可以通过监控系统查看 GC 的频率和堆内存的使用情况。
否则可以使用 JDK 的一些自带工具,包括 jmap、jstat 等。
# 查看堆内存各区域的使用率以及GC情况
jstat -gcutil -h20 pid 1000
# 查看堆内存中的存活对象,并按空间排序
jmap -histo pid | head -n20
# dump堆内存文件
jmap -dump:format=b,file=heap pid
或者使用一些可视化的工具,比如 VisualVM、JConsole 等。
假如是因为大对象直接分配到老年代导致的 Full GC 频繁,可以通过 -XX:PretenureSizeThreshold
参数设置大对象直接进入老年代的阈值。
或者能不能将大对象拆分成小对象,减少大对象的创建。比如说分页。
假如是因为内存泄漏导致的 Full GC 频繁,可以通过分析堆内存 dump 文件找到内存泄漏的对象,再找到内存泄漏的代码位置。
假如是因为长生命周期的对象进入到了老年代,要及时释放资源,比如说 ThreadLocal、数据库连接、IO 资源等。
假如是因为 GC 参数配置不合理导致的 Full GC 频繁,可以通过调整 GC 参数来优化 GC 行为。或者直接更换更适合的 GC 收集器,如 G1、ZGC 等。
- Java 面试指南(付费)收录的得物面经同学 8 一面面试原题:Java 中 full gc 频繁,有哪些原因
GitHub 上标星 10000+ 的开源知识库《二哥的 Java 进阶之路》第一版 PDF 终于来了!包括 Java 基础语法、数组&字符串、OOP、集合框架、Java IO、异常处理、Java 新特性、网络编程、NIO、并发编程、JVM 等等,共计 32 万余字,500+张手绘图,可以说是通俗易懂、风趣幽默……详情戳:太赞了,GitHub 上标星 10000+ 的 Java 教程
微信搜 沉默王二 或扫描下方二维码关注二哥的原创公众号沉默王二,回复 222 即可免费领取。
2024 年 03 月 29 日增补
JVM 的操作对象是 Class 文件,JVM 把 Class 文件中描述类的数据结构加载到内存中,并对数据进行校验、解析和初始化,最终形成可以被 JVM 直接使用的类型,这个过程被称为类加载机制。
其中最重要的三个概念就是:类加载器、类加载过程和类加载器的双亲委派模型。
- 类加载器:负责加载类文件,将类文件加载到内存中,生成 Class 对象。
- 类加载过程:加载、验证、准备、解析和初始化。
- 双亲委派模型:当一个类加载器收到类加载请求时,它首先不会自己去尝试加载这个类,而是把请求委派给父类加载器去完成,依次递归,直到最顶层的类加载器,如果父类加载器无法完成加载请求,子类加载器才会尝试自己去加载。
- Java 面试指南(付费)收录的小米暑期实习同学 E 一面面试原题:你了解类的加载机制吗?
- Java 面试指南(付费)收录的美团面经同学 3 Java 后端技术一面面试原题:java 的类加载机制 双亲委派机制 这样设计的原因是什么
类加载器(ClassLoader)用于动态加载 Java 类到 Java 虚拟机中。主要有四种类加载器:
①、启动类加载器(Bootstrap ClassLoader)负责加载 JVM 的核心类库,如 rt.jar 和其他核心库位于JAVA_HOME/jre/lib
目录下的类。
②、扩展类加载器(Extension ClassLoader):由sun.misc.Launcher$ExtClassLoader
(或其它类似实现)实现。负责加载JAVA_HOME/jre/lib/ext
目录下,或者由系统属性java.ext.dirs
指定位置的类库。
③、应用程序类加载器(Application ClassLoader):由sun.misc.Launcher$AppClassLoader
(或其它类似实现)实现。
负责加载系统类路径(classpath)上的类库,通常是我们在开发 Java 应用程序时的主要类加载器。
我们编写的任何类都是由应用程序类加载器加载的,除非显式使用自定义类加载器。
④、用户自定义类加载器 (User-Defined ClassLoader),我们可以通过继承java.lang.ClassLoader
类来创建自己的类加载器。
这种类加载器通常用于加载网络上的类、执行热部署(动态加载和替换应用程序的组件)或为了安全目的自定义类的加载方式。
一个类从被加载到虚拟机内存中开始,到从内存中卸载,整个生命周期需要经过七个阶段:加载 (Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化 (Initialization)、使用(Using)和卸载(Unloading)。
推荐阅读:一文彻底搞懂 Java 类加载机制
类装载过程包括三个阶段:载入、链接(包括验证、准备、解析)、初始化。
①、载入:将类的二进制字节码加载到内存中。
②、链接可以细分为三个小的阶段:
- 验证:检查类文件格式是否符合 JVM 规范
- 准备:为类的静态变量分配内存并设置默认值。
- 解析:将符号引用替换为直接引用。
③、初始化:执行静态代码块和静态变量初始化。
在准备阶段,静态变量已经被赋过默认初始值了,在初始化阶段,静态变量将被赋值为代码期望赋的值。
换句话说,初始化阶段是执行类的构造方法(javap 中看到的 <clinit>()
方法)的过程。
- 1)通过一个类的全限定名来获取定义此类的二进制字节流。
- 2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
- 3)在内存中生成一个代表这个类的
java.lang.Class
对象,作为方法区这个类的各种数据的访问入口。
- Java 面试指南(付费)收录的小米暑期实习同学 E 一面面试原题:你了解类的加载机制吗?
- Java 面试指南(付费)收录的美团面经同学 16 暑期实习一面面试原题:讲一下类加载过程,双亲委派模型,双亲委派的好处
- Java 面试指南(付费)收录的美团面经同学 18 成都到家面试原题:类加载过程
- Java 面试指南(付费)收录的快手同学 4 一面原题:类装载的执行过程?双亲委派模式是什么?为什么使用这种模式?
双亲委派模型要求类加载器在加载类时,先委托父加载器尝试加载,只有父加载器无法加载时,子加载器才会加载。
- 当一个类加载器需要加载某个类时,它首先会请求其父类加载器加载这个类。
- 这个过程会一直向上递归,也就是说,从子加载器到父加载器,再到更上层的加载器,一直到最顶层的启动类加载器。
- 启动类加载器会尝试加载这个类。如果它能够加载这个类,就直接返回;如果它不能加载这个类(因为这个类不在它的搜索范围内),就会将加载任务返回给委托它的子加载器。
- 子加载器接着尝试加载这个类。如果子加载器也无法加载这个类,它就会继续向下传递这个加载任务,依此类推。
- 这个过程会继续,直到某个加载器能够加载这个类,或者所有加载器都无法加载这个类,最终抛出 ClassNotFoundException。
- Java 面试指南(付费)收录的小米暑期实习同学 E 一面面试原题:你了解类的加载机制吗?
- Java 面试指南(付费)收录的阿里云面经同学 22 面经:双亲委派机制
①、避免类的重复加载:父加载器加载的类,子加载器无需重复加载。
②、保证核心类库的安全性:如 java.lang.*
只能由 Bootstrap ClassLoader 加载,防止被篡改。
- Java 面试指南(付费)收录的美团面经同学 16 暑期实习一面面试原题:讲一下类加载过程,双亲委派模型,双亲委派的好处
如果不想打破双亲委派模型,就重写 ClassLoader 类中的 fifindClass()方法即可,无法被父类加载器加载的类最终会通过这个方法被加载。而如果想打破双亲委派模型则需要重写 loadClass()方法。
双亲委派机制在历史上主要有三次破坏:
双亲委派模型的第一次“被破坏”其实发生在双亲委派模型出现之前——即 JDK 1.2 面世以前的“远古”时代。
由于双亲委派模型在 JDK 1.2 之后才被引入,但是类加载器的概念和抽象类 java.lang.ClassLoader 则在 Java 的第一个版本中就已经存在,为了向下兼容旧代码,所以无法以技术手段避免 loadClass()被子类覆盖的可能性,只能在 JDK 1.2 之后的 java.lang.ClassLoader 中添加一个新的 protected 方法 findClass(),并引导用户编写的类加载逻辑时尽可能去重写这个方法,而不是在 loadClass()中编写代码。
双亲委派模型的第二次“被破坏”是由这个模型自身的缺陷导致的,如果有基础类型又要调用回用户的代码,那该怎么办呢?
例如我们比较熟悉的 JDBC:
各个厂商各有不同的 JDBC 的实现,Java 在核心包\lib
里定义了对应的 SPI,那么这个就毫无疑问由启动类加载器
加载器加载。
但是各个厂商的实现,是没办法放在核心包里的,只能放在classpath
里,只能被应用类加载器
加载。那么,问题来了,启动类加载器它就加载不到厂商提供的 SPI 服务代码。
为了解决这个问题,引入了一个不太优雅的设计:线程上下文类加载器 (Thread Context ClassLoader)。这个类加载器可以通过 java.lang.Thread 类的 setContext-ClassLoader()方法进行设置,如果创建线程时还未设置,它将会从父线程中继承一个,如果在应用程序的全局范围内都没有设置过的话,那这个类加载器默认就是应用程序类加载器。
JNDI 服务使用这个线程上下文类加载器去加载所需的 SPI 服务代码,这是一种父类加载器去请求子类加载器完成类加载的行为。
双亲委派模型的第三次“被破坏”是由于用户对程序动态性的追求而导致的,例如代码热替换(Hot Swap)、模块热部署(Hot Deployment)等。
OSGi 实现模块化热部署的关键是它自定义的类加载器机制的实现,每一个程序模块(OSGi 中称为 Bundle)都有一个自己的类加载器,当需要更换一个 Bundle 时,就把 Bundle 连同类加载器一起换掉以实现代码的热替换。在 OSGi 环境下,类加载器不再双亲委派模型推荐的树状结构,而是进一步发展为更加复杂的网状结构。
Tomcat 是主流的 Java Web 服务器之一,为了实现一些特殊的功能需求,自定义了一些类加载器。
Tomcat 类加载器如下:
Tomcat 实际上也是破坏了双亲委派模型的。
Tomact 是 web 容器,可能需要部署多个应用程序。不同的应用程序可能会依赖同一个第三方类库的不同版本,但是不同版本的类库中某一个类的全路径名可能是一样的。如多个应用都要依赖 hollis.jar,但是 A 应用需要依赖 1.0.0 版本,但是 B 应用需要依赖 1.0.1 版本。这两个版本中都有一个类是 com.hollis.Test.class。如果采用默认的双亲委派类加载机制,那么无法加载多个相同的类。
所以,Tomcat 破坏了双亲委派原则,提供隔离的机制,为每个 web 容器单独提供一个 WebAppClassLoader 加载器。每一个 WebAppClassLoader 负责加载本身的目录下的 class 文件,加载不到时再交 CommonClassLoader 加载,这和双亲委派刚好相反。
实现一个热部署(Hot Deployment)功能通常涉及到类的加载和卸载机制,使得在不重启应用程序的情况下,能够动态替换或更新应用程序的组件。
第一步,使用文件监控机制(如 Java NIO 的 WatchService)来监控类文件或配置文件的变更。当监控到文件变更时,触发热部署流程。
class FileWatcher {
public static void watchDirectoryPath(Path path) {
// 检查路径是否是文件夹
try {
Boolean isFolder = (Boolean) Files.getAttribute(path, "basic:isDirectory", LinkOption.NOFOLLOW_LINKS);
if (!isFolder) {
throw new IllegalArgumentException("Path: " + path + " is not a folder");
}
} catch (IOException ioe) {
// 文件 I/O 错误
ioe.printStackTrace();
}
System.out.println("Watching path: " + path);
// 我们获得文件系统的WatchService对象
FileSystem fs = path.getFileSystem();
try (WatchService service = fs.newWatchService()) {
// 注册路径到监听服务
// 监听目录内文件的创建、修改、删除事件
path.register(service, ENTRY_CREATE, ENTRY_MODIFY, ENTRY_DELETE);
// 开始无限循环,等待事件发生
WatchKey key = null;
while (true) {
key = service.take(); // 会阻塞直到有事件发生
// 对于每个发生的事件
for (WatchEvent<?> watchEvent : key.pollEvents()) {
WatchEvent.Kind<?> kind = watchEvent.kind();
// 获取文件路径
@SuppressWarnings("unchecked")
WatchEvent<Path> ev = (WatchEvent<Path>) watchEvent;
Path fileName = ev.context();
System.out.println(kind.name() + ": " + fileName);
}
// 重置watchKey
boolean valid = key.reset();
// 退出循环如果watchKey无效
if (!valid) {
break;
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
public static void main(String[] args) {
// 监控当前目录
Path pathToWatch = Paths.get(".");
watchDirectoryPath(pathToWatch);
}
}
第二步,创建一个自定义类加载器,继承自java.lang.ClassLoader
,重写findClass()
方法,实现类的加载。
public class HotSwapClassLoader extends ClassLoader {
public HotSwapClassLoader() {
super(ClassLoader.getSystemClassLoader());
}
@Override
protected Class<?> findClass(String name) throws ClassNotFoundException {
// 加载指定路径下的类文件字节码
byte[] classBytes = loadClassData(name);
if (classBytes == null) {
throw new ClassNotFoundException(name);
}
// 调用defineClass将字节码转换为Class对象
return defineClass(name, classBytes, 0, classBytes.length);
}
private byte[] loadClassData(String name) {
// 实现从文件系统或其他来源加载类文件的字节码
// ...
return null;
}
}
像 Intellij IDEA 就提供了热部署功能,当我们修改了代码后,IDEA 会自动编译,如果是 Web 项目,在 Chrome 浏览器中装一个 LiveReload 插件,一旦编译完成,页面就会自动刷新。对于测试或者调试来说,就非常方便。
- Java 面试指南(付费)收录的小米暑期实习同学 E 一面面试原题:那你知道类的热更新的?
2024 年 03 月 08 日增补
先说解释和编译的区别:
- 解释:将源代码逐行转换为机器码。
- 编译:将源代码一次性转换为机器码。
一个是逐行,一个是一次性,再来说说解释执行和编译执行的区别:
- 解释执行:程序运行时,将源代码逐行转换为机器码,然后执行。
- 编译执行:程序运行前,将源代码一次性转换为机器码,然后执行。
Java 一般被称为“解释型语言”,因为 Java 代码在执行前,需要先将源代码编译成字节码,然后在运行时,再由 JVM 的解释器“逐行”将字节码转换为机器码,然后执行。
这也是 Java 被诟病“慢”的主要原因。
但 JIT 的出现打破了这种刻板印象,JVM 会将热点代码(即运行频率高的代码)编译后放入 CodeCache,当下次执行再遇到这段代码时,会从 CodeCache 中直接读取机器码,然后执行。这大大提升了 Java 的执行效率。
- Java 面试指南(付费)收录的腾讯 Java 后端实习一面原题:说说 Java 解释执行的流程。
图文详解 54 道 Java 虚拟机高频面试题,这次面试,一定吊打面试官,整理:沉默王二,戳转载链接,作者:三分恶,戳原文链接。
没有什么使我停留——除了目的,纵然岸旁有玫瑰、有绿荫、有宁静的港湾,我是不系之舟。
系列内容:
- 面渣逆袭 Java SE 篇 👍
- 面渣逆袭 Java 集合框架篇 👍
- 面渣逆袭 Java 并发编程篇 👍
- 面渣逆袭 JVM 篇 👍
- 面渣逆袭 Spring 篇 👍
- 面渣逆袭 Redis 篇 👍
- 面渣逆袭 MyBatis 篇 👍
- 面渣逆袭 MySQL 篇 👍
- 面渣逆袭操作系统篇 👍
- 面渣逆袭计算机网络篇 👍
- 面渣逆袭 RocketMQ 篇 👍
- 面渣逆袭分布式篇 👍
- 面渣逆袭微服务篇 👍
- 面渣逆袭设计模式篇 👍
- 面渣逆袭 Linux 篇 👍
GitHub 上标星 10000+ 的开源知识库《二哥的 Java 进阶之路》第一版 PDF 终于来了!包括 Java 基础语法、数组&字符串、OOP、集合框架、Java IO、异常处理、Java 新特性、网络编程、NIO、并发编程、JVM 等等,共计 32 万余字,500+张手绘图,可以说是通俗易懂、风趣幽默……详情戳:太赞了,GitHub 上标星 10000+ 的 Java 教程
微信搜 沉默王二 或扫描下方二维码关注二哥的原创公众号沉默王二,回复 222 即可免费领取。