Caffe | Check fehlgeschlagen: Fehler == cudaSuccess (2 vs. 0) out of memory
Ich versuche zu trainieren, ein Netzwerk auf Caffe. Ich habe die Größe des Bildes, 512x640. Batch-Größe ist 1. Ich bin versucht zu implementieren FCN-8s.
Ich bin derzeit mit diesem auf einer Amazon EC2-Instanz (g2.2xlarge) mit 4 GB GPU-Speicher. Aber wenn ich den solver, der es sofort wirft einen Fehler raus
Check failed: error == cudaSuccess (2 vs. 0) out of memory *** Check failure stack trace: *** Aborted (core dumped)
Kann mir jemand helfen, gehen Sie von hier aus?
- Verwandte: stackoverflow.com/q/36526959/1714410
- zwei Lösung:ein, können Sie versuchen, verringern Sie Ihre batch-Größe, aber Ihre batch-Größe=1, und nutzlos, dann können Sie die Größe ändern auf dein Bild, verringern Sie Ihre Größe kann nützlich sein;zwei, die Sie kaufen können, eine bessere GPU.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Die Fehlermeldung, die Sie erhalten, ist in der Tat aus der Erinnerung, aber es ist nicht der RAM, sondern die GPU-Speicher (beachten Sie, dass der Fehler kommt, CUDA).
In der Regel, wenn caffe ist aus der Erinnerung - das erste, was zu tun ist, reduzieren Sie die batch-Größe (auf Kosten der gradientengenauigkeit), aber da Sie schon auf batch-Größe = 1...
Sind Sie sicher, dass die batch-Größe ist 1 für beide ZUG-und TEST-Phasen?
The total number of bytes read was 537399810
die viel kleiner sind als 4 GB.nvidia-smi
um zu sehen, was Los ist auf Ihrer GPU.iter_size
. siehe diesen thread.Caffe verwenden Sie mehrere GPU ' s. Dies wird nur unterstützt in die C++ - Schnittstelle, nicht in die python ein. Sie könnte auch ermöglichen, cuDNN für einen geringeren memory-footprint.
https://github.com/BVLC/caffe/blob/master/docs/multigpu.md