一次Jvm old过高的排查过程实战记录

作者:小草莓子桑 时间:2023-05-07 23:33:49 

前言

最近遇到一个Jvm old过高的案例,现象是一个站点的jvm old区过高,分析原因是,原来的设计方案有问题,给前端返回的数据里面包含了大量的html代码,从存储中拿数据的过程、拼接数据的过程过于漫长了,造成了大量对象的生命周期过长,对象被 标记到了old中,造成了old区过高,监控系统进行了报警,详细原因就不做详细分析了,主要分享一下问题排查的过程。

收到了监控系统的报警,在服务器上查询jvm内存情况

jstat -gcutil pid 时间间隔,可以按时间间隔打印jvm的内存情况,例如:


jstat -gcutil 30922 1000

一次Jvm old过高的排查过程实战记录

jvm进程30922的内存情况

大致说一下,S0,S1这些的含义:

S0:年轻代中第一个survivor(幸存区)已使用的占当前容量百分比
S1:年轻代中第二个survivor(幸存区)已使用的占当前容量百分比
E: 年轻代中Eden(伊甸园)已使用的占当前容量百分比
O: old代已使用的占当前容量百分比
P: perm代已使用的占当前容量百分比
YGC: 从应用程序启动到采样时年轻代中gc次数
YGCT:从应用程序启动到采样时年轻代中gc所用时间(s)
FGC: 从应用程序启动到采样时old代(全gc)gc次数
FGCT:从应用程序启动到采样时old代(全gc)gc所用时间(s)
GCT: 从应用程序启动到采样时gc用的总时间(s)

从内存情况,来看,S0、伊甸园已经被打满,old已经被打满,排除了是大对象实例过多直接把old打满的情况,继续分析

查看应用启动的jvm参数

-Xms2g -Xmx2g -Xmn1g -Xss1024K -XX:PermSize=256m -XX:MaxPermSize=512m -XX:ParallelGCThreads=8 -XX:+UseConcMarkSweepGC -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:+UseCMSCompactAtFullCollection -XX:SurvivorRatio=4 -XX:MaxTenuringThreshold=10 -XX:CMSInitiatingOccupancyFraction=80

说两个参数的含义吧

XX:SurvivorRatio=4,这个参数的意思是Survivor两个区与新生代的比例,设置为4的意思是两个区与新生代的比例为2:4,MaxTenuringThreshold=10, 这个参数的意思是对象标记多少次后记为old对象,放入到老年代中,设置为10就是新生代对象被标记10次还没有释放,就放到老年代中,从参数上看,造成old区过高报警的原因是有的对象在新生代中,被标记了10次都没有被释放,被放入到了老年代中,造成了老年代过大,FGC频率过高

经朋友指点,这一块的分析有问题,有问题的分析留着,再贴一下朋友的分析,对比一下

动态对象年龄判定:为了能更好地适应不同程度的内存状况,虚拟机并不是永远地要求对象的年龄必须达到了MaxTenuringThreshold才能晋升到老年代,如果在Survivor空间中相同年龄的所有对象大小的总和大于Survivor空间的一半,年龄大于或等于年龄的对象就可以直接进入老年代,无须等到MaxTenuringThreshold中要求的年龄

一次Jvm old过高的排查过程实战记录
朋友的指导

导出dump文件,使用jvisualvm.exe查看

导出dump文件的过程就不赘述了,简单贴一下命令


jmap -dump:format=b,file=serviceDump.dat pid

jvisualvm是一个jdk自带的内存分析工具,一般位置在jdk安装目录下:


C:\Program Files\Java\jdk1.8.0_141\bin\jvisualvm.exe

一次Jvm old过高的排查过程实战记录

jvisualvm工具界面

在这选择已经导出的dump文件,查看内存中类的实例数、实例大小

一次Jvm old过高的排查过程实战记录
查看类的实例数

发现是Char[],String,HashMap这三个的实例是jvm中最多的,实例数分别占31%、30.9%、30.2%,总共占了92.1%,实例的大小分别占35.8%、14.6%、22.4%,总共占了72.8%,主要是这三个类的实例占用过大的内存

查看Char[]的实例信息

点击去,查看Char[]的实例信息,从大到小的排列

一次Jvm old过高的排查过程实战记录
有一些实例比别的实例大很多

查看最大的这些实例,发现这些实例里面的内容是


<graph lineThickness='3' showValues='0' formatNumberScale='1' anchorRadius='3' divLineAlpha='20' divLineColor='CC3300' divLineIsDashed='1' showAlternateHGridColor='1' alternateHGridAlpha='5' alternateHGridColor='CC3300' shaowAlpha='40d' chartRightMargin='3..

目测这些都是前端使用的图表所用到的数据,设计不合理,这些图表的html代码由后台代码给前端返回了

一次Jvm old过高的排查过程实战记录
实例里面的内容

查看这些实例的堆栈信息

查看这些实例的垃圾回收根节点

一次Jvm old过高的排查过程实战记录
查看这些实例的垃圾回收根节点

发现是根节点是 StringBuilder对象,查看堆栈信息

一次Jvm old过高的排查过程实战记录
查看堆栈信息

一次Jvm old过高的排查过程实战记录

堆栈信息

通过堆栈信息,就定位到了代码中,分析代码,原因基本是,原来的设计方案有问题,给前端返回的数据里面包含了大量的html代码,从存储中拿数据的过程、拼接数据的过程过于漫长了,造成了大量对象的生命周期过长,对象被 标记到了old中,造成了old区过高,这里就是是分享下,排查的过程,不对原因过于详细的表述了

来源:https://www.jianshu.com/p/f04c04ed462f

标签:jvm,old,排查
0
投稿

猜你喜欢

  • Java Mybatis框架增删查改与核心配置详解流程与用法

    2022-07-08 10:47:20
  • 详解Java的Hibernat框架中的Map映射与SortedMap映射

    2021-08-21 20:31:59
  • Android 自定义标题栏的实例详解

    2021-11-06 00:53:04
  • C#开发WinForm之DataGridView开发详解

    2023-06-25 06:31:35
  • springboot项目中使用Swagger的简单示例

    2023-01-14 05:18:24
  • 实战分布式医疗挂号通用模块统一返回结果异常日志处理

    2022-01-28 16:31:32
  • 如何调用chatGPT实现代码机器人

    2023-06-05 02:09:33
  • Android高德地图marker自定义弹框窗口

    2023-06-22 13:07:05
  • 当Mybatis遇上目录树超全完美解决方案

    2021-09-28 16:21:13
  • Java 自定义动态数组方式

    2022-08-26 01:38:37
  • IDEA中打jar包的2种方式(Maven打jar包)

    2023-05-03 22:31:41
  • Spring Boot Reactor 整合 Resilience4j详析

    2021-08-08 10:30:02
  • C#判断当前程序是否通过管理员运行的方法

    2023-09-27 15:48:24
  • 聊聊Controller中RequestMapping的作用

    2021-12-08 20:48:45
  • springboot自定义Starter的具体流程

    2022-01-26 05:08:06
  • C# dynamic关键字的使用方法

    2023-02-26 08:40:01
  • Android table布局开发实现简单计算器

    2021-07-15 13:05:28
  • spring-cloud-gateway动态路由的实现方法

    2021-07-25 15:24:37
  • 教你怎么用Java开发扫雷游戏

    2023-07-22 09:49:26
  • C#使用InstallerProjects打包桌面应用程序的完整步骤

    2023-12-08 14:38:04
  • asp之家 软件编程 m.aspxhome.com