Häufige Ursachen von nans während der Ausbildung

Habe ich bemerkt, dass ein häufiges auftreten während der Ausbildung NANs eingeführt.

Oft scheint es eingeführt werden durch GEWICHTE im inneren-Produkt - /voll-angeschlossen oder convolution-Schichten Sprengung.

Ist, dass dies geschieht, weil die Gradienten-Berechnung ist die Sprengung? Oder ist es wegen des Gewichts der Initialisierung (wenn ja, warum wird das Gewicht der Initialisierung haben diese Wirkung)? Oder ist es wahrscheinlich verursacht durch die Art der input-Daten?

Die übergeordnete Frage ist hier einfach: Was ist der häufigste Grund für NANs zu, die während der Ausbildung? Und zweitens, was sind einige der Methoden für die Bekämpfung dieser (und warum Sie funktionieren)?

Rufen Sie an speziellen MATLAB-Funktionen? Ist es die alle Ihren eigenen code?
Ich glaube nicht, dass diese Frage matlab-spezifisch, sondern eher caffeim Zusammenhang.

InformationsquelleAutor Aidan Gomez | 2015-11-27

Schreibe einen Kommentar