【JAVA】强引用、软引用、弱引用、幻象引用有什么区别?

前言

在 Java 语言中,除了原始数据类型的变量,其他所有都是所谓的引用类型,指向各种不同的对象,理解引用对于掌握 Java 对象生命周期和 JVM 内部相关机制非常有帮助。

本篇博文的重点是,强引用、软引用、弱引用、幻象引用有什么区别?具体使用场景是什么?

概述

不同的引用类型,主要体现的是对象不同的可达性(reachable)状态和对垃圾收集的影响

强引用(“Strong” Reference),就是我们最常见的普通对象引用,只要还有强引用指向一个对象,就能表明对象还“活着”,垃圾收集器不会碰这种对象。对于一个普通的对象,如果没有其他的引用关系,只要超过了引用的作用域或者显式地将相应(强)引用赋值为 null,就是可以被垃圾收集的了,当然具体回收时机还是要看垃圾收集策略。

软引用(SoftReference),是一种相对强引用弱化一些的引用,可以让对象豁免一些垃圾收集,只有当 JVM 认为内存不足时,才会去试图回收软引用指向的对象。JVM 会确保在抛出 OutOfMemoryError 之前,清理软引用指向的对象。软引用通常用来实现内存敏感的缓存,如果还有空闲内存,就可以暂时保留缓存,当内存不足时清理掉,这样就保证了使用缓存的同时,不会耗尽内存。

弱引用(WeakReference)并不能使对象豁免垃圾收集,仅仅是提供一种访问在弱引用状态下对象的途径。这就可以用来构建一种没有特定约束的关系,比如,维护一种非强制性的映射关系,如果试图获取时对象还在,就使用它,否则重现实例化。它同样是很多缓存实现的选择。

幻象引用,有时候也翻译成虚引用,你不能通过它访问对象。幻象引用仅仅是提供了一种确保对象被 finalize 以后,做某些事情的机制,比如,通常用来做所谓的 Post-Mortem 清理机制,也有人利用幻象引用监控对象的创建和销毁。

正文

1、对象可达性状态流转分析


  • 强可达(Strongly Reachable),就是当一个对象可以有一个或多个线程可以不通过各种引用访问到的情况。比如,我们新创建一个对象,那么创建它的线程对它就是强可达。
  • 软可达(Softly Reachable),就是当我们只能通过软引用才能访问到对象的状态。
  • 弱可达(Weakly Reachable),类似前面提到的,就是无法通过强引用或者软引用访问,只能通过弱引用访问时的状态。这是十分临近 finalize 状态的时机,当弱引用被清除的时候,就符合 finalize 的条件了。
  • 幻象可达(Phantom Reachable),上面流程图已经很直观了,就是没有强、软、弱引用关联,并且 finalize 过了,只有幻象引用指向这个对象的时候。
  • 当然,还有一个最后的状态,就是不可达(unreachable),意味着对象可以被清除了。

判断对象可达性,是 JVM 垃圾收集器决定如何处理对象的一部分考虑。

所有引用类型,都是抽象类 java.lang.ref.Reference 的子类,你可能注意到它提供了 get() 方法:



除了幻象引用(因为 get 永远返回 null),如果对象还没有被销毁,都可以通过 get 方法获取原有对象。这意味着,利用软引用和弱引用,我们可以将访问到的对象,重新指向强引用,也就是人为的改变了对象的可达性状态!

所以,对于软引用、弱引用之类,垃圾收集器可能会存在二次确认的问题,以保证处于弱引用状态的对象,没有改变为强引用。

但是,你觉得这里有没有可能出现什么问题呢?

不错,如果我们错误的保持了强引用(比如,赋值给了 static 变量),那么对象可能就没有机会变回类似弱引用的可达性状态了,就会产生内存泄漏。所以,检查弱引用指向对象是否被垃圾收集,也是诊断是否有特定内存泄漏的一个思路,如果我们的框架使用到弱引用又怀疑有内存泄漏,就可以从这个角度检查。

2、引用队列(ReferenceQueue)使用

谈到各种引用的编程,就必然要提到引用队列。我们在创建各种引用并关联到相应对象时,可以选择是否需要关联引用队列,JVM 会在特定时机将引用 enqueue 到队列里,我们可以从队列里获取引用(remove 方法在这里实际是有获取的意思)进行相关后续逻辑。尤其是幻象引用,get 方法只返回 null,如果再不指定引用队列,基本就没有意义了。看看下面的示例代码。利用引用队列,我们可以在对象处于相应状态时(对于幻象引用,就是前面说的被 finalize 了,处于幻象可达状态),执行后期处理逻辑。

Object counter = new Object();
ReferenceQueue refQueue = new ReferenceQueue<>();
PhantomReference<Object> p = new PhantomReference<>(counter, refQueue);
counter = null;
System.gc(); try { // Remove是一个阻塞方法,可以指定timeout,或者选择一直阻塞 Reference<Object> ref = refQueue.remove(1000L); if (ref != null) { // do something }
} catch (InterruptedException e) { // Handle it }

3、显式地影响软引用垃圾收集

前面泛泛提到了引用对垃圾收集的影响,尤其是软引用,到底 JVM 内部是怎么处理它的,其实并不是非常明确。那么我们能不能使用什么方法来影响软引用的垃圾收集呢?

答案是有的。软引用通常会在最后一次引用后,还能保持一段时间,默认值是根据堆剩余空间计算的(以 M bytes 为单位)。从 Java 1.3.1 开始,提供了 -XX:SoftRefLRUPolicyMSPerMB 参数,我们可以以毫秒(milliseconds)为单位设置。比如,下面这个示例就是设置为 3 秒(3000 毫秒)。

-XX:SoftRefLRUPolicyMSPerMB=3000

这个剩余空间,其实会受不同 JVM 模式影响,对于 Client 模式,比如通常的 Windows 32 bit JDK,剩余空间是计算当前堆里空闲的大小,所以更加倾向于回收;而对于 server 模式 JVM,则是根据 -Xmx 指定的最大值来计算。

本质上,这个行为还是个黑盒,取决于 JVM 实现,即使是上面提到的参数,在新版的 JDK 上也未必有效,另外 Client 模式的 JDK 已经逐步退出历史舞台。所以在我们应用时,可以参考类似设置,但不要过于依赖它。

4、诊断 JVM 引用情况

如果你怀疑应用存在引用(或 finalize)导致的回收问题,可以有很多工具或者选项可供选择,比如 HotSpot JVM 自身便提供了明确的选项(PrintReferenceGC)去获取相关信息,我指定了下面选项去使用 JDK 8 运行一个样例应用:

-XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintReferenceGC 

这是 JDK 8 使用 ParrallelGC 收集的垃圾收集日志,各种引用数量非常清晰。

0.403: [GC (Allocation Failure) 0.871: [SoftReference, 0 refs, 0.0000393 secs]0.871: [WeakReference, 8 refs, 0.0000138 secs]0.871: [FinalReference, 4 refs, 0.0000094 secs]0.871: [PhantomReference, 0 refs, 0 refs, 0.0000085 secs]0.871: [JNI Weak Reference, 0.0000071 secs][PSYoungGen: 76272K->10720K(141824K)] 128286K->128422K(316928K), 0.4683919 secs] [Times: user=1.17 sys=0.03, real=0.47 secs] 

注意:JDK 9 对 JVM 和垃圾收集日志进行了广泛的重构,类似 PrintGCTimeStamps 和 PrintReferenceGC 已经不再存在,我在专栏后面的垃圾收集主题里会更加系统的阐述。

5、Reachability Fence

除了我前面介绍的几种基本引用类型,我们也可以通过底层 API 来达到强引用的效果,这就是所谓的设置 reachability fence

为什么需要这种机制呢?考虑一下这样的场景,按照 Java 语言规范,如果一个对象没有指向强引用,就符合垃圾收集的标准,有些时候,对象本身并没有强引用,但是也许它的部分属性还在被使用,这样就导致诡异的问题,所以我们需要一个方法,在没有强引用情况下,通知 JVM 对象是在被使用的。说起来有点绕,我们来看看 Java 9 中提供的案例。

class Resource { private static ExternalResource[] externalResourceArray = ... int myIndex; Resource(...) {
     myIndex = ...
     externalResourceArray[myIndex] = ...;
     ...
 } protected void finalize() {
     externalResourceArray[myIndex] = null;
     ...
 } public void action() { try { // 需要被保护的代码 int i = myIndex;
     Resource.update(externalResourceArray[i]);
 } finally { // 调用reachbilityFence,明确保障对象strongly reachable Reference.reachabilityFence(this);
 }
 } private static void update(ExternalResource ext) {
    ext.status = ...;
 }
}

方法 action 的执行,依赖于对象的部分属性,所以被特定保护了起来。否则,如果我们在代码中像下面这样调用,那么就可能会出现困扰,因为没有强引用指向我们创建出来的 Resource 对象,JVM 对它进行 finalize 操作是完全合法的。

new Resource().action()

类似的书写结构,在异步编程中似乎是很普遍的,因为异步编程中往往不会用传统的“执行 -> 返回 -> 使用”的结构。

在 Java 9 之前,实现类似功能相对比较繁琐,有的时候需要采取一些比较隐晦的小技巧。幸好,java.lang.ref.Reference 给我们提供了新方法,它是 JEP 193: Variable Handles 的一部分,将 Java 平台底层的一些能力暴露出来:

static void reachabilityFence(Object ref)

在 JDK 源码中,reachabilityFence 大多使用在 Executors 或者类似新的 HTTP/2 客户端代码中,大部分都是异步调用的情况。编程中,可以按照上面这个例子,将需要 reachability 保障的代码段利用 try-finally 包围起来,在 finally 里明确声明对象强可达。

后记

以上就是 【JAVA】# 强引用、软引用、弱引用、幻象引用有什么区别? 的所有内容了;

总结了 Java 语言提供的几种引用类型、相应可达状态以及对于 JVM 工作的意义,并分析了引用队列使用的一些实际情况,最后介绍了在新的编程模式下,如何利用 API 去保障对象不被意外回收,希望对你有所帮助。

#Java##程序员#
全部评论
没看虚拟机的依旧是不会懂的,看懂虚拟机的,再看一遍文章就是加强
点赞 回复 分享
发布于 2022-11-28 12:31 上海

相关推荐

##&nbsp;一面&nbsp;1.&nbsp;自我介绍2.&nbsp;Java包装类,默认值3.&nbsp;Java中的值传递4.&nbsp;反射的定义等5.&nbsp;策略模式,有哪些角色6.&nbsp;策略与spring中容器结合:我说了ioc根据名字获取7.&nbsp;spring可以注入list结构吗1.&nbsp;是可以的,注入父接口8.&nbsp;怎么干预bean的生命周期9.&nbsp;bean后置处理和工厂后置处理的区别10.&nbsp;spring事务及失效场景11.&nbsp;CAS,公平锁,非公平锁12.&nbsp;ThreadLocal13.&nbsp;springboot&nbsp;start怎么定义14.&nbsp;接口比较慢的原因:15.&nbsp;数据库,锁&nbsp;for&nbsp;update16.&nbsp;可重复读及实现17.&nbsp;设计索引18.&nbsp;分布式锁的场景##&nbsp;二面1.&nbsp;AI在公司的应用2.&nbsp;AI中最大的挑战3.&nbsp;项目:排行榜的设计4.&nbsp;数据量大之后有什么挑战1.&nbsp;合并写5.&nbsp;redis使用场景和数据结构6.&nbsp;分布式锁原理,什么场景使用分布式锁7.&nbsp;除了redis,zookeeper之外的实现方式8.&nbsp;mysql和redis实现分布式锁的区别1.&nbsp;应该是没区别,性能区别呗9.&nbsp;项目兑换码设计10.&nbsp;优惠卷怎么推荐的11.&nbsp;并发性能的优化1.&nbsp;我说了一整个链路的12.&nbsp;缓存的原则(什么时候使用,读多写少)13.&nbsp;设计模式:策略&amp;观察者14.&nbsp;spring是事件机制,应该是想问*ApplicationEvent*15.&nbsp;mysql索引16.&nbsp;联合索引,最左匹配17.&nbsp;explain18.&nbsp;算法:最长递增子数组1.&nbsp;问我优化,忘了19.&nbsp;优缺点20.&nbsp;反问1.&nbsp;上班时间##&nbsp;三面1.&nbsp;快排2.&nbsp;做一个框架,什么设计模式被用到3.&nbsp;问了模板方法4.&nbsp;装饰器5.&nbsp;观察者6.&nbsp;jvm内存区域7.&nbsp;类定义是共享的吗8.&nbsp;索引,B+树,b树9.&nbsp;事务的定义10.&nbsp;隔离级别,mvcc11.&nbsp;串行化-&nbsp;**读操作**会加共享锁(S锁),阻止其他事务写入相同数据。-&nbsp;**写操作**会加排他锁(X锁),阻止其他事务读取或写入相同数据。-&nbsp;范围查询会加**间隙锁(Gap&nbsp;Lock)**,防止其他事务在范围内插入新记录,从而彻底消除幻读。在执行过程中,事务必须等待前一个事务释放锁才能继续,这种方式牺牲了并发性能,但换来了最强的数据一致性保障。12.&nbsp;操作系统1.&nbsp;信号量13.&nbsp;蛋糕切三刀,有多少块1.&nbsp;没答出来,我没招了14.&nbsp;幂等,http哪些请求是幂等,get,post这些吧15.&nbsp;ES(项目相关)16.&nbsp;数据一致性(最终一致)17.&nbsp;分布式事务18.&nbsp;反问1.&nbsp;应届生培养计划
点赞 评论 收藏
分享
03-09 23:19
已编辑
东莞理工学院 Java
四场中厂面试复盘:没有套路的技术拷问,才是真的“熬人”最近面了四家公司,每轮面试都卡在1-1.5小时,快把精力耗干了。没有统一的套路,每家都有自己的“刁钻角度”,面完只觉得心力憔悴,也终于真切感受到现在中场面试的难度——比秋招真的难了一个档次,不是背八股、刷几道算法就能应付的。这次四场面试,最直观的感受就是没有两场是一样的,每一家的考察重点都戳在不同的能力维度上,稍微准备不充分就容易卡壳。第一家最考技术广度,不是单一问某个知识点,而是追着你要“方案+选型+底层逻辑”。比如聊分布式事务,我刚讲完Seata的TCC解决方案,面试官立刻追问:“还有什么替代方案?比如XA、SAGA,它们的核心区别是什么?解决的业务痛点一样吗?你为什么选TCC而不是其他?”&nbsp;还问了一个场景题:“有一张表,现有字段不确定是否能满足后续业务,要求在不修改原有字段的前提下做扩容,有哪些方案?每种方案的底层实现是什么?选这个方案的优势和风险是什么?”&nbsp;这类问题问了三四个,只要有一个知识点没覆盖到,或者说不出替代方案的对比,就会被一直追问,直到你把逻辑理透。有的面试官则死抠技术深度,不考你会不会用,考你懂不懂底层。比如聊线程池原理,我讲完核心参数、工作流程后,面试官直接追问:“线程池的底层实现用了哪些数据结构?任务队列的底层是怎么组织的?线程池的复用机制底层是怎么实现的?”&nbsp;甚至连&nbsp;ping&nbsp;命令都要挖到底:“&nbsp;ping&nbsp;命令发送的报文结构是什么样的?为什么要这么设计?每一个字段的作用是什么?”&nbsp;不是简单背概念,而是要你把具体细节讲出来,哪怕是一个小的设计点,都要解释清楚背后的原因。还有一家的问题偏得很意外,看似和核心技术无关,却在考你的基础认知和排查能力。比如问:“&nbsp;Ctrl+C&nbsp;为什么能停止一个程序?它的底层原理是什么?Ctrl+C一点可以停止吗”&nbsp;还有“你做过网络请求的优化吗?具体优化了哪些点?原理是什么?”&nbsp;甚至问通配符的类型有哪些、底层是怎么匹配的。这些问题不是高频考点,但能直接看出你对技术底层的理解,不是只停留在“能用”的层面。算法题和场景题也都是穿插在技术问答中间,不是单独抽出来考,而是结合业务场景问。比如聊RAG项目时,突然问:“如果向量库的查询性能瓶颈,你有什么优化方案?用到什么数据结构?索引怎么设计?”&nbsp;算法题也不是简单的LeetCode简单题,而是中等。而且面试全程没有“放水”环节,不管是技术问答、项目讲解,还是算法、场景题,都要实打实的回答。反问环节本来是放松的机会,但面完这么多场,反而没什么心情问,只觉得“终于结束了这一轮”,然后立刻要准备下一场的复盘和补漏。现在剩下还有两三轮这样的面试,说不焦虑是假的。但回头想想,这几场面试虽然难、熬人,却也把自己的知识漏洞和能力短板暴露得很彻底——原来不是自己“会了”,而是“懂的不够透”;不是没有方案,而是不会从多维度对比选型。中厂面试确实卷,HC也少,但每一场都是一次成长。接下来还是要好好复盘,把没答上来的问题逐个攻克,把底层逻辑再吃透一点,希望后面的面试能更从容一点后续更新面经
查看8道真题和解析
点赞 评论 收藏
分享
评论
1
15
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务