解决python线程卡死的问题

作者:田野上的希望 时间:2023-08-03 05:58:27 

1. top命令和日志方式判定卡死的位置

python代码忽然卡死,日志不输出,通过如下方式可以确定线程确实已经死掉了:

# top 命令

top命令可以看到机器上所有线程的执行情况,%CPU和%MEM可以看出线程消耗的资源情况

由于机器上线程数量太多,可能要查看的线程的信息在top命令当前屏幕上显示不出来可以通过如下方式查看

在top命令下输入:u

接下来会提示输入用户名,就可以查看该用户所执行的所有线程

Which user (blank for all): denglinjie

这样就可以看到degnlinjie用户的所有线程

可以看到那几个卡死线程的%CPU和%MEM都为0,说明线程根本没有消耗资源,那么可以看出线程已经卡死了

接下来通过打日志的方式来确定线程究竟是卡死在哪里了,线程卡死的地方大多数都是在io或者http请求那,所以以后遇到线程卡死的情况,就通过打日志的方式来确定卡死的位置,最终定位到问题确实是一个http服务挂掉了,而且此时requests.get()我虽然设置了超时,但是竟然无效

2 . 服务进程数量不足导致的客户端进程卡死

服务端代码:


handler = SimilarityService()
transport = TSocket.TServerSocket('10.134.113.75', 1234)
factory = TBinaryProtocol.TBinaryProtocolFactory()
processor = Processor(handler)
server = TProcessPoolServer.TProcessPoolServer(processor, transport)
server.setNumWorkers(10)
server.serve()

客户端代码


docQue = queues.Queue(maxsize=1000)
pCount = 15

class ParseSaveEsProcess(multiprocessing.Process):

def __init__(self, threadId):
   self.threadId = threadId
   multiprocessing.Process.__init__(self)

def run(self):
   global docQue
   f = open('recall_match_file_all_simi.lst.%s' % self.threadId, 'w')
   try:
     transport = TSocket.TSocket('10.134.113.75', 1234)
     transport = TTransport.TBufferedTransport(transport)
     protocol = TBinaryProtocol.TBinaryProtocol(transport)
     client = Client(protocol)
     transport.open()

while True:
       line = docQue.get(block=True)
       if not line:
         print 'thread%d run over' % self.threadId  
         break

p = line.split('\t')
       if len(p) >= 6 and p[5] == 'simi_high':
         simi_str = client.calculate_similarity_by_itemurl(p[0])
         f.write(line + '\t' + simi_str + '\n')
       else:
         f.write(line + '\n')  
     transport.close()
   except Thrift.TException as e:
     print str(e)
     pass  

class PutUrlProcess(multiprocessing.Process):

def __init__(self):
   multiprocessing.Process.__init__(self)

def run(self):
   global docQue
   for line in open('recall_match_file.lst', 'r'):
     baikeid = line.strip()
     docQue.put(baikeid, block=True)

for i in range(pCount):
     docQue.put(None, block=True)

if __name__ == '__main__':
 putProcess = PutUrlProcess()
 putProcess.start()

for i in range(pCount):
   parseProcess = ParseSaveEsProcess(i)
   parseProcess.start()

可以看到,进程ParseSaveEsProcess进程总共开启了15个,每个进程会打开一个thrift连接,打开后一直发送请求,并将处理的结果写文件,全部执行完成后才关闭thrift连接。

可是,发现从启动到执行了很长时间后,只有10个文件里面有内容写入,其中5个一直没有写入:


111965 recall_match_file_all_simi.lst.0
 111878 recall_match_file_all_simi.lst.1
   0 recall_match_file_all_simi.lst.10
   0 recall_match_file_all_simi.lst.11
   0 recall_match_file_all_simi.lst.12
   0 recall_match_file_all_simi.lst.13
   0 recall_match_file_all_simi.lst.14
 113429 recall_match_file_all_simi.lst.2
 110720 recall_match_file_all_simi.lst.3
 111993 recall_match_file_all_simi.lst.4
 113691 recall_match_file_all_simi.lst.5
 113360 recall_match_file_all_simi.lst.6
 113953 recall_match_file_all_simi.lst.7
 112007 recall_match_file_all_simi.lst.8
 113818 recall_match_file_all_simi.lst.9

原因是因为thrift服务端只启动了10个服务进程,所以只能同时处理10个请求,而我客户端打开的thrift连接一直没有关闭,所以10个服务进程被10个客户端连接霸占了,另外5个进程获取不到连接,自然就一直卡住了。

来源:https://blog.csdn.net/u011734144/article/details/73287446

标签:python,线程,卡死
0
投稿

猜你喜欢

  • python实现得到一个给定类的虚函数

    2022-03-27 19:31:11
  • 捕捉并保存ASP运行错误的函数代码

    2012-11-30 20:24:43
  • Python实现采集网站ip代理并检测是否可用

    2021-01-10 09:10:53
  • ASP环境下邮件列表功能的实现

    2007-10-03 14:25:00
  • 官方是这样定义 DOCTYPE HTML PUBLIC 的

    2007-05-31 09:43:00
  • 详解Go语言Slice作为函数参数的使用

    2023-07-16 11:30:20
  • python实现自动下载sftp文件

    2022-01-25 12:55:36
  • python3实现带多张图片、附件的邮件发送

    2023-05-11 06:51:10
  • 提升Python程序性能的7个习惯

    2021-09-11 04:05:07
  • 使用Python、TensorFlow和Keras来进行垃圾分类的操作方法

    2021-08-31 23:45:13
  • Python常见数据结构详解

    2021-10-28 22:07:33
  • 使用XML库的方式,实现RPC通信的方法(推荐)

    2021-11-15 14:00:42
  • CentOS6.5设置Django开发环境

    2022-09-29 22:55:30
  • Python中fnmatch模块的使用详情

    2021-06-14 20:50:18
  • UI自动化定位常用实现方法代码示例

    2022-09-22 09:47:13
  • python 将字符串中的数字相加求和的实现

    2022-11-03 22:31:08
  • pytorch: tensor类型的构建与相互转换实例

    2023-06-14 09:22:57
  • 一文详解go mod依赖管理详情

    2023-07-13 04:35:06
  • JavaScript中创建原子的方法总结

    2023-06-29 12:22:14
  • Python人工智能深度学习模型训练经验总结

    2022-01-05 18:10:50
  • asp之家 网络编程 m.aspxhome.com