java实战CPU占用过高问题的排查及解决
作者:江湖前辈黄药师 时间:2023-01-14 21:46:49
最近一段时间 某台服务器上的一个应用总是隔一段时间就自己挂掉 用top看了看 从重新部署应用开始没有多长时间CPU占用上升得很快
排查步骤
1.使用top 定位到占用CPU高的进程PID
top
2.通过ps aux | grep PID命令
获取线程信息,并找到占用CPU高的线程
ps -mp pid -o THREAD,tid,time | sort -rn
3.将需要的线程ID转换为16进制格式
printf "%x\n" tid
4.打印线程的堆栈信息 到了这一步具体看堆栈的日志来定位问题了
jstack pid |grep tid -A 30
top 可以看出PID 733进程 的占用CPU 172%
查找进程733下的线程 可以看到TID 线程775占用了96%且持有了很长时间 其实到这一步基本上能猜测到应该是 肯定是那段代码发生了死循环
ps -mp 733 -o THREAD,tid,time | sort -rn
线程ID转换为16进制格式
printf "%x\n" 775
查看java 的堆栈信息
jstack 733 |grep 307 -A 30
显然是 SmsQueueServiceImpl 中的produceMissSms 和 consumeMissSms 方法有问题
一下为精简的部分代码
/** * Created by dongxc on 2015/7/7. 通知消息队列 */
@Service("smsQueueService")
public class SmsQueueServiceImpl {
// 生产异常队列方法
public void produceMissSms(SmsLogDo smsLogDo) {
/*
* try{ String key = EnumRedisPrefix.SMS_QUEUE_MISS_DEAL.getValue(); boolean result = redisService.lpush(key,
* smsLogDo, 0); if(result==false){ logger.error("通知消息异常队列生产消息返回失败!"+smsLogDo.getId()); } }catch(Exception e){
* logger.error("通知消息异常队列生产消息失败!", e); }
*/
}
// 消费异常队列方法
public SmsLogDo consumeMissSms() {
try {
String destKey = EnumRedisPrefix.SMS_QUEUE_MISS_DEAL.getValue();
SmsLogDo smsLogDo = new SmsLogDo();
Object obj = null;
if (obj == null) {
return null;
} else {
smsLogDo = (SmsLogDo) obj;
}
return smsLogDo;
} catch (Exception e) {
logger.error("通知消息队列消费方法失败!", e);
return null;
}
}
}
从很有年代感的垃圾代码来看 这两个方法并没有什么问题 继续往调用这两个方法的上层排查
/**
* Created by dongxc on 2015/7/7.
* 消息通知监控线程
*/
@Service("smsMonitorComsumer")
public class SmsMonitorComsumerImpl {
@Autowired
private SmsQueueServiceImpl smsQueueService;
//取队列里的任务消费
@Transactional(propagation= Propagation.NOT_SUPPORTED)
public void run() {
while (true) {
try {
SmsLogDo smsLogDo = smsQueueService.consumeMissSms();
Boolean result = false;
if(smsLogDo!=null){
long diff = (new Date()).getTime() - smsLogDo.getSendtime().getTime() ;
long min = diff%(1000*24*60*60)%(1000*60*60)/(1000*60);//计算差多少分钟
if(min>5){
result = true;
}
}
if(result){
smsQueueService.produceSms(smsLogDo);
}else{
smsQueueService.produceMissSms(smsLogDo);
}
} catch (Exception ex) {
try{
Thread.sleep(3000);
}catch(Exception e){
//logger.error("发送站内信息短信时线程执行失败2!", e);
}
}
}
}
}
很显然 这里有一个while(true) 基本定位到问题了 while里面完全是没有用的代码
继续往上层看谁来调用
/**
* Created by dongxc on 2015/7/7.
* 通知消息队列
*/
@Service("smsLogRunThread")
public class SmsLogRunThreadImpl {
public int flag;
@Autowired
private SmsLogConsumerImpl smsLogConsumer;
@Autowired
private SmsMonitorComsumerImpl smsMonitorComsumer;
@PostConstruct
public void init() {
if(ip!=""&&host!=""&&ip.equals(host)){
Thread thread = new Thread(){
public void run() {
smsLogConsumer.run();
}
};
thread.start();
Thread thread1 = new Thread(){
public void run() {
smsMonitorComsumer.run();
}
};
thread1.start();
}
}
}
在应用一启动的时候 spring初始化的就会执行这一段处理丢失消息的代码 然后这段死循环代码 没有任何作用
解决方法 即 注释掉whlie(true)这一段代码
案例一下,其实之前也遇到过CPU占用很高的问题, 但是那次是 频繁的GC导致的
其实排查问题 的过程中也是在不断的学习的过程
来源:https://www.cnblogs.com/xxj0316/p/9448987.html
![](/images/zang.png)
![](/images/jiucuo.png)
猜你喜欢
Java 如何优雅的抛出业务异常
Java 动态代理的多种实现方式
![](https://img.aspxhome.com/file/2023/6/91126_0s.png)
C#中静态方法和实例化方法的区别、使用
聊聊Unity 自定义日志保存的问题
![](https://img.aspxhome.com/file/2023/9/69199_0s.png)
springboot自定义starter方法及注解实例
![](https://img.aspxhome.com/file/2023/7/71607_0s.jpg)
Java中String、StringBuffer、StringBuilder的区别详解
Java MyBatis可视化代码生成工具使用教程
![](https://img.aspxhome.com/file/2023/6/77116_0s.png)
Android通过LIstView显示文件列表的两种方法介绍
![](https://img.aspxhome.com/file/2023/4/138684_0s.gif)
从Cocos2d-x2迁移到Cocos2d-x3的过程分享
Java基于HttpClient实现RPC的示例
新手了解java 数组基础知识
![](https://img.aspxhome.com/file/2023/4/88744_0s.png)
一文教会你使用jmap和MAT进行堆内存溢出分析
![](https://img.aspxhome.com/file/2023/3/58763_0s.png)
Java删除二叉搜索树最大元素和最小元素的方法详解
![](https://img.aspxhome.com/file/2023/2/61022_0s.png)
Kotlin基础通关之字符串与数字类型
Android仿微信activity滑动关闭效果
Android 调用系统联系人界面(添加联系人,添加已有联系人,编辑和修改)
Android如何让APP无法在指定的系统版本上运行(实现方法)
![](https://img.aspxhome.com/file/2023/2/89532_0s.png)
Android开发笔记之:返回键的复写onBackPressed()介绍
Spring boot配置 swagger的示例代码
![](https://img.aspxhome.com/file/2023/7/110627_0s.png)