通过String.intern()方法浅谈堆中常量池

作者：宸小朔时间：2022-07-06 05:14:01　

简介

String是我们最常用的一个类，和普通java类一样其对象会存在java堆中。但是String类有其特殊之处，可以通过new方法生成，也可以通过带引号的字符串常量直接赋值。在JDK7之前，字符串常量是存在永久带Perm 区的，JDK7开始在将常量池迁移到堆中，这个变化也导致了String的新特性，下面我们慢慢进行介绍。

String.intern()方法

简单的说，String.intern()方法的作用就是返回常量池中字符串对象，在对该方法进行详解之前，我们看几个创建字符串对象的例子。以下说明及运行结果都是以JDK8为java环境。

（1）直接赋值字符串常量

这种方式会判断常量池中是否存在字符串常量，如果存在返回该常量对象，否则在常量池中创建常量对象并返回。

//在常量池中创建常量“abc”，s1,s2指向常量池中对象地址
String s1 = "abc";
String s2 = "abc";
System.out.println(s1 == s2);//true

（2）通过new关键字创建

这种方式会在堆上创建String对象，如果常量池中没有该常量，将常量加入常量池中。

//在堆上创建对象S3,S4,常量池中创建对象“abc”
String s3 = new String("abc");
String s4 = new String("abc");
System.out.println(s3 == s4);//false

（3）字符串常量相加

这种方式如s5，会在常量池中创建"cd","ef","cdef"三个对象，s5指向常量池中的"cdef"对象。

String s5 = "cd" + "ef";
String s6 = "cdef";
System.out.println(s5==s6);//true

（4）两个new的String对象相加

这种方式如s7，会在堆中创建三个对象"gh"对象，"lm"对象，以及"ghlm"对象，在常量池中创建对象"gh","lm"。

String s7 = new String("gh") + new String("lm");
String s8 = "ghlm";
System.out.println(s7==s8);//false

（5）字符串常量与new的String对象相加

这种方式如s9，会在堆中创建两个对象“op”，“mnop”，并将字符串常量“op”, "mn"加到常量池中。

String s9 = "mn" + new String("op");
String s10 = "mnop";
System.out.println(s9==s10);//false

了解字符串常量的创建及其在内存中的存储，我们看native方法intern()的作用：判断String对象的常量值是否存在于常量池中，如果存在并且是常量池对象，返回该常量池对象；如果存在并且是指向堆中的对象，返回堆中对象地址；如果不存在，则将对象的引用复制到常量池，并返回该对象的引用。下面我们看几条语句的运行结果，第一个输出之所以为true，

String s11 = new String("a") + new String("a");
s11.intern();//由于常量池中无“aa”,因此在常量池中建“aa”的引用,指向堆中的s11
String s12 = "aa";//s12指向常量池中的对象（该对象指向S11）
System.out.println(s11 == s12.intern());//true
String s13 = new String("b");
s13.intern();//常量池中已经有“b”了，不做任何操作
String s14 = "b";
System.out.println(s13==s14.intern());//false

如果理解了以上运行的结果，对intern()方法的左右就掌握的差不多了。那么久可以开始我们的主题，string pool，字符串常量池。

字符串常量池

字符串常量池是jvm为了减小内存开销而在创建字符串对象时的一个优化，类似缓冲区。在hotspot中，字符串常量池是一个叫做StringTable的HashTable，默认长度是1009，在JDK7开始可以通过"-XX:StringTableSize=1009" 参数来设置，字符串常量池数据可以被gc回收（在JDK6及其以前，字符串常量存在永久带无法被gc回收，如果添加太多字符串常量到该区域，容易发生OOM）。由于字符串常量池是利用HashTable实现，因此一定会发生hash碰撞。

jvm在这方面做了一定优化，会根据hashTable的碰撞情况来决定是否做rehash，当从这个StringTable里查找某个字符串是否存在，如果对其对应的桶链表进行遍历，遍历超过了100个节点还是没有找到，那就会设置一个flag，让下次进入到safepoint的时候做一次rehash动作，尽量减少碰撞的发生。当然，在数据量比较大的情况下，这也无法从根本上解决问题，只能设置StringTableSize的值来缓解。

由于JDK7开始字符串常量池在堆中分布，所以young gc过程会扫描该区域，以保证处于新生代的String对象不会被回收掉，因此如果字符串常量区非常庞大会导致young gc过程扫描的时间也会变长。但是，young gc阶段并不会对字符串常量区进行回收，具体回收阶段是在Full gc或者CMS gc阶段（题外话：我觉得full gc这个名字并不是很好，容易理解为对所有区域进行回收，其实full GC是对老年代的STW的gc，full gc的次数是老年代gc的STW次数，时间是老年代STW的总时间）。

来源：https://www.jianshu.com/p/e6ee9a1c7d93

标签：String,intern,方法,堆,常量池

投稿

通过String.intern()方法浅谈堆中常量池

猜你喜欢

Java spring的三种注入方式详解流程

java动态代理(jdk与cglib)详细解析

阿里开源Java诊断工具神器使用及场景详解

Java调用wsdl接口的两种方法(axis和wsimport)

Java实现颜色渐变效果

Java关于JDK1.8新特性的Stream流

Android按钮单击事件的四种常用写法总结

Spring Security中用JWT退出登录时遇到的坑

Flutter Navigator路由传参的实现

Mybatis一对多关联关系映射实现过程解析

Springboot+Mybatis-plus不使用SQL语句进行多表添加操作及问题小结

C#数据结构之队列(Quene)实例详解

Android获取点击屏幕的位置坐标

基于sharding-jdbc的使用限制

Android框架组件Lifecycle的使用详解

springboot集成mybatisPlus+多数据源的实现示例

详解Android中AsyncTask的使用方法

java 实现线程同步的方式有哪些

SpringBean依赖和三级缓存的案例讲解

教你怎么用Idea打包jar包