解决TensorFlow训练内存不断增长,进程被杀死问题

作者:诗人的情人 时间:2021-02-09 17:14:34 

TensorFlow训练时,遇到内存不断增长,最终导致内存不足,进程被杀死。

在这里我不准备对造成这一现象的所有原因进行探讨,只是记录一下我在项目中遇到的这一问题,下面将对我遇到的内存不断增长的原因进行分析。

在TensorFlow中构造图,是将一些op作为节点加入图中,在run之前,是需要构造好一个图的,所以在run的时候,如果run图中不存在的节点,TensorFlow就会将节点加入图中,随着不断的迭代,造成内存不断的增长,从而导致内存不足。

下面举一个很容易发现这个问题的例子:


import tensorflow as tf
x = tf.Variable(tf.constant(1))
y = tf.constant(2)
sess = tf.Session()
sess.run(tf.global_variables_initializer())
while True:
print(sess.run(x+y))

在上面的例子中,x,y是图中的两个节点,在while循环中run(x)或者run(y)都是不存在问题的,但是上例中我们使用的时run(x+y),而在TensorFlow的图中是不存在x+y这个节点的,所以在run的时候,图中会不断的创建该节点,最终导致了内存不足。这个例子很容易理解,这样的问题也很容易发现。

下面,将举一个不是那么容易发现的问题:


import tensorflow as tf
test = tf.get_variable('test', shape=[4, 1], initializer=tf.random_normal_initializer(stddev=0.1))
init_op = tf.global_variables_initializer()
with tf.Session() as sess:
sess.run(init_op)
print(sess.run(test[0]))

这个例子是创建一个shape为[4,1]的变量对象,test为图中的一个节点,但是在我们实际使用时,我们可能并不需要test里的所有数据,加入只需要一个数据test[0],当我们使用run(test[0])时,test[0]并不是图中的节点,该节点就会在图中创建。上面的例子并没有使用循环,所以增加了节点,但是也不会造成内存的不足,当使用了循环时,就需要注意了。

解决办法:run图中存在的节点,对返回的结果进行处理,得到想要的结果,不要在run里面对节点处理(处理后的节点可能不是图中的节点)。

来源:https://blog.csdn.net/xiaobiyin9140/article/details/93303283

标签:TensorFlow,训练,内存,进程
0
投稿

猜你喜欢

  • Python 绘图和可视化详细介绍

    2021-02-16 18:17:31
  • pandas修改DataFrame列名的方法

    2021-07-18 16:41:24
  • 简单介绍Python的Django框架的dj-scaffold项目

    2021-11-01 07:18:05
  • Python二维码生成识别实例详解

    2021-06-10 19:59:22
  • 使用Cython中prange函数实现for循环的并行

    2023-04-13 05:31:55
  • Flask框架模板渲染操作简单示例

    2023-06-07 00:02:45
  • 图片放大镜,多图片放大(已更新)[可调整倍数、区域大小、展示区域位置]

    2011-06-16 20:43:07
  • Python利用watchdog模块监控文件变化

    2023-10-23 22:27:22
  • python离散建模之感知器学习算法

    2022-06-10 04:49:47
  • Python构建简单线性回归模型

    2021-03-22 19:58:42
  • pycharm 配置svn的图文教程(手把手教你)

    2022-10-21 18:47:47
  • python 调试器pdb的简单使用

    2023-08-03 19:13:20
  • 三层级联动的日期选择下拉框javascript源码

    2013-08-15 16:50:40
  • XML+ JS创建树形菜单

    2013-08-22 08:30:17
  • 在Python程序和Flask框架中使用SQLAlchemy的教程

    2021-10-28 06:14:21
  • Python中使用kitti数据集实现自动驾驶(绘制出所有物体的行驶轨迹)

    2023-06-27 17:02:54
  • matplotlib grid()设置网格线外观的实现

    2021-08-26 08:39:13
  • python中Scrapy shell的使用

    2021-03-23 08:23:24
  • 以PHP代码为实例详解RabbitMQ消息队列中间件的6种模式

    2023-06-08 12:15:53
  • pytorch通过训练结果的复现设置随机种子

    2021-04-19 07:58:53
  • asp之家 网络编程 m.aspxhome.com