这篇文章主要介绍“怎么解决TensorFlowGPU版出现OOM错误的问题”,在日常操作中,相信很多人在怎么解决TensorFlowGPU版出现OOM错误的问题问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么解决TensorFlowGPU版出现OOM错误的问题”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
创新互联,专注为中小企业提供官网建设、营销型网站制作、成都响应式网站建设公司、展示型网站设计、成都网站设计等服务,帮助中小企业通过网站体现价值、有效益。帮助企业快速建站、解决网站建设与网站营销推广问题。
问题:
在使用mask_rcnn预测自己的数据集时,会出现下面错误:
ResourceExhaustedError: OOM when allocating tensor with shape[1,512,1120,1120] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc [[{{node rpn_model/rpn_conv_shared/convolution}} = Conv2D[T=DT_FLOAT, data_format="NCHW", dilations=[1, 1, 1, 1], padding="SAME", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](fpn_p2/BiasAdd, rpn_conv_shared/kernel/read)]]Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info. [[{{node roi_align_mask/strided_slice_17/_4277}} = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_3068_roi_align_mask/strided_slice_17", tensor_type=DT_INT32, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.
原因:
一是、因为图片尺寸为3200*4480,图片的尺寸太大。
二是、我使用的是TensorFlow GPU版,而我GPU的显存只有8G,导致显存不够。
解决:
一是、将图片尺寸改小,小到占用的内存比显存。
二是、不使用GPU进行预测,只使用CPU预测,因为一般CPU内存要大于显存的。但装的又是GPU版的TensorFlow,所以需要在预测程序进行更改。
程序在前两行加入下面代码:
import osos.environ["CUDA_VISIBLE_DEVICES"] = ""
引号里填的是GPU的序号,不填的时候代表不使用GPU。
到此,关于“怎么解决TensorFlowGPU版出现OOM错误的问题”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注创新互联网站,小编会继续努力为大家带来更多实用的文章!