Caffe sigmoid-Kreuz-Entropie-Verlust
Ich bin mit dem Sigma-Kreuz-Entropie-Verlust-Funktion für multilabel-Klassifizierung problem wie dargelegt dieses tutorial. Jedoch, in der beide Ihre Ergebnisse auf die Anleitung und meine Ergebnisse, die Ausgabe, die Vorhersagen sind im Bereich (-Inf, Inf)
, während der Bereich der sigmoid ist [0, 1]
. Ist das Sigma nur verarbeitet, in der backprop? Das ist, sollte nicht nach vorne gehen, squash-Ausgang?
Du musst angemeldet sein, um einen Kommentar abzugeben.
In diesem Beispiel die Eingabe der
"SigmoidCrossEntropyLoss"
Schicht ist die Ausgabe eines voll-connect-layer. In der Tat gibt es keine Einschränkungen auf die Werte der Ausgänge ein"InnerProduct"
layer und Sie können in Reihe[-inf, inf]
.Wenn Sie jedoch sorgfältig prüfen, die
"SigmoidCrossEntropyLoss"
werden Sie feststellen, dass es eine"Sigmoid"
layer innen -- zur Sicherstellung einer stabilen Gradienten Schätzung.Daher bei der Prüfung Zeit, ersetzen Sie die
"SigmoidCrossEntropyLoss"
mit einem einfachen"Sigmoid"
layer zur output-pro-Klasse Vorhersagen.