Wie zu entscheiden, die Aktivierung der Funktion im neuronalen Netzwerk

Ich bin mit feedforward, RÜCKFÜHRUNG, mehrschichtiges neuronales Netz, und ich bin mit sigmoid-Funktion als Aktivierungsfunktion, die mit Bereich von -1 bis 1. Aber der minimale Fehler ist nicht unter 5.8 und ich will so weniger, können Sie die Ausgabe nach 100000 Iterationen.

Ich denke, das ist, weil mein Leistungsbereich ist über 1 und sigmoid-Funktionen Bereich ist nur -1 und + 1. Kann jemand mir empfehlen, wie kann ich dieses problem überwinden, wie der von mir gewünschten Ausgangsbereich 0 bis 2.5. Mir empfehlen die Aktivierung der Funktion wird am besten für diesen Bereich.

InformationsquelleAutor lkkkk | 2014-03-06

2

Wenn Sie versuchen, die Reduzierung Ausgabe Fehler, es gibt ein paar Dinge zu sehen vor tweaking einen Knoten Aktivierung der Funktion.

Erste, Sie haben einen bias-Knoten? Bias-Knoten haben mehrere Auswirkungen, sondern - am wichtigsten für diese Diskussion - Sie ermöglichen die Netzwerk-Ausgabe übersetzt werden, um die gewünschte Ausgabe-Bereich. Als diese Referenz Staaten:

Den Einsatz von Verzerrungen in einem neuronalen Netzwerk erhöht die Kapazität des Netzes, um Probleme zu lösen, indem Sie die hyperplanes, dass die Abgrenzung einzelner Klassen versetzt werden, die für überlegene Positionierung.

Dieser Beitrag bietet eine sehr gute Diskussion:
Rolle von Bias in Neuronalen Netzen.
Dieser ist auch gut: Warum die Verschiebung ist notwendig, ANN? Sollten wir getrennte BIAS für jede Schicht?

Zweite Methode: es hilft oft, zu normalisieren Ihre ein-und Ausgänge. Wie Sie anmerken, Ihr Sigma bietet einen Bereich von +/- 1. Dieser kleine Bereich kann problematisch sein, wenn Sie versuchen zu lernen-Funktionen, die eine Reihe von 0 bis 1000 (z.B.). Zu Hilfe lernen, ist es üblich, zu skalieren und zu übersetzen Eingänge, um Platz für den Knoten Aktivierung von Funktionen. In diesem Beispiel könnte man unterteilen den Bereich von 500, was einen Bereich von 0 bis 2 reichen, und dann subtrahieren Sie 1 aus diesem Bereich. Auf diese Weise werden die Eingänge wurden normiert auf einen Bereich von -1 bis 1, die besser passt die Aktivierung der Funktion. Beachten Sie, dass Netzwerk-Ausgabe sollte denormalisierten: zunächst fügen Sie +1 auf den Ausgang, dann multiplizieren Sie mit 500.

In Ihrem Fall, sollten Sie überlegen, Skalierung der Eingänge von 0,8, dann 1 subtrahieren aus dem Ergebnis. Sie würden dann fügen Sie 1 an das Netzwerk ausgegeben, und dann multipliziert mit 1.25 zum wiederherstellen des gewünschten Bereichs. Beachten Sie, dass diese Methode am einfachsten zu erreichen, da es nicht direkt ändern Sie Ihre Netzwerk-Topologie, wie die Zugabe von bias würde.

Schließlich haben Sie experimentiert mit der änderung der Anzahl der versteckten Knoten? Obwohl ich glaube, dass die ersten beiden Optionen sind bessere Kandidaten für die Verbesserung der Leistung, die Sie vielleicht geben diesem eine Chance. (Nur als ein Bezugspunkt, ich kann mich nicht erinnern, eine Instanz, in denen die änderung der Aktivierung der Funktion die Form verbessert Netzwerk-Antwort mehr als option 1 und 2.)

Hier sind einige gute Diskussion der hidden-layer-Knoten-Konfiguration:
multi-layer-perceptron (MLP) Architektur: Kriterien für die Auswahl der Anzahl der verborgenen Schichten und die Größe der hidden-layer?
Wie wählen Sie die Anzahl der versteckten Schichten und Knoten im neuronalen Netzwerk?

24 Eingänge stellen Sie Ihr problem einem high-dimensional man. Sicherstellen, dass Ihre Trainings-dataset wird adäquat behandelt die input-staatlichen Raum, und sicherzustellen, dass Sie Ihre Testdaten und Trainingsdaten sind gezeichnet von ähnlich repräsentativen Populationen. (Werfen Sie einen Blick auf die "cross-validation" - Diskussionen, wenn die Ausbildung neuronaler Netzwerke).
- eigentlich meinen gewünschten Ausgangsspannungsbereich von 0 bis 5000, und ich habe versucht, durch Aufteilung dieses Bereichs von 5000 und nachdem Sie die Ergebnisse, die ich multipliziert mit 5000 wieder, hier Fehler korrigiert. Aber ich werde versuchen, Ihren Vorschlag, weil beim testen der NN, erhalte ich die korrekte Ausgabe für nur input-Kombination, während der Ausbildung und für andere Eingänge: es gibt keine korrekte Ausgabe. Hier bin ich mit einer bias-Knoten als meine Eingänge Anzahl 24 (Knoten : 24+1), und in der versteckten Schicht bin ich mit der Allgemeinen Regel, d.h. (#Eingänge + #Ausgänge)*(2/3).
- bitte schlagen, wenn es irgendeine Regel zunächst auf die zufällige GEWICHTE, ich habe die Nummer des Eingangs:24(der Binär 0 & 1 ) + 1 bias, und durch versteckte Knoten:18, - Ausgänge:1(Bereich: 0 bis 5000).Und was sollte der genaue Verlauf der Fehler.
- Verwenden Sie zufällige Initiale GEWICHTE. Werfen Sie einen Blick auf diesen link: stackoverflow.com/questions/20027598/...
- Ich habe für den Bereich von 0 bis 5000 direkt durch Division der ersten durch die 5000 und nachdem das Ergebnis durch Multiplikation mit 5000. Mein Fehler minimiert werden, aber während des Trainings das Ergebnis kommt für nur Eingänge während der Ausbildung nicht die erforderliche Leistung für die in-zwischen den Eingängen. Bitte empfehlen...
- Ich ging durch einen link en.wikipedia.org/wiki/Activation_function,
- Haben Sie versucht, die Skalierung der Eingabe einen Bereich von -1 bis +1, wie oben vorgeschlagen? Wie sind Sie mit der Umsetzung Ihres Netzwerkes? MATLAB oder einem anderen tool? Oder schreiben Sie Ihren eigenen code? Aktivierung Funktionen sind relativ trivial zu implementieren - so lange, wie Sie implementiert haben es richtig, wird Ihr problem wahrscheinlich an anderer Stelle befindet.
- Implementiert habe ich meinen eigenen code in python, ich habe versucht, durch Skalierung meinem Eingang in den Bereich -1 bis 1, aber es gab große Fehler, dann habe ich reichte es in 0 zu 1 (durch die Aufteilung 5000) nun es gibt bessere, aber die Einnahme von Iterationen etwa 5000000, die ist zu groß und zeitaufwendig zu simulieren.hier hatte ich genommen learning rate als 0.003 und Dynamik-rate als 0.0001.
- Vielleicht haben Sie ein problem in Ihrer Implementierung. Ich schlage vor, buchen Sie Ihren code in einer anderen Frage. Ich glaube, dass der Anwendungsbereich dieser wurde abgedeckt.
- bitte siehe meinen geposteten code in Bezug auf die oben aus dem link: stackoverflow.com/questions/22355722/...
InformationsquelleAutor Throwback1986
2

Vanille sigmoid-Funktion:
```
def sigmoid(x):
    return 1/(1+math.e**-x)
```
Könnten Sie transformieren, zu:
```
def mySigmoid(x):
    return 2.5/(1+math.e**-x)
```
um die transformation, die Sie wollen
- Ich habe versucht die option "empfohlen" aber es gibt Fehler wie: OverflowError: (34, 'Numerical result out of range')
- ist so, und ich kann den gewünschten Wert zwischen -1 und + 1 durch Division eine Zahl und nach dem aufstehen kann ich wieder multiplizieren Sie das Ergebnis wieder durch die gleiche Anzahl mit sigmoid-Funktion nur.
- Sie würde wahrscheinlich nicht eine lineare Transformation auf das [-1, 1] Ausgabe, denn das würde Weg von der "sigmoidness" der Aktivierungs-Funktion. Bitte wickeln Sie den Aufruf mySigmoid in einem try/catch und drucken Sie den Wert x auf Ausnahme. Ich Frage mich, was Wert x diesen Fehler verursacht
- ok... ich werde es versuchen.....
InformationsquelleAutor inspectorG4dget

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.