Die gamma-und Kosten-parameter des SVM
alle, hier ist ein sonderbares Phänomen, wenn ich mit libSVM Vorhersagen.
Wenn ich keine Parameter des SVM, bekomme ich ein zu 99,9% auf die Leistung des Tests festgelegt. Während, wenn ich Parameter '-c-10 -g 5 -', ich bekomme etwa 33% Präzision auf der Prüfung.
Durch die Art und Weise, die SVM-toolkit, die ich verwende, ist LibSVM.
Frage ich mich, ob es etwas falsch mit Daten eingestellt. Und ich konnte nicht herausfinden, das Ergebnis ist überzeugender.
Weiter zu Marc ' s Antwort sollte man eine eigene Validierungs-set zu wählen, gute Werte für C und g. Oder nutzen grid.py (geliefert mit libsvm), um diese Parameter über cross-Validierung.
Und dies wird dringend empfohlen, zu Lesen: csie können.ntu.edu.tw/~cjlin/Papiere/Anleitung/Anleitung.pdf
Die LIBSVM-guide ist in der Tat eine sehr gute erste Referenz.
Und dies wird dringend empfohlen, zu Lesen: csie können.ntu.edu.tw/~cjlin/Papiere/Anleitung/Anleitung.pdf
Die LIBSVM-guide ist in der Tat eine sehr gute erste Referenz.
InformationsquelleAutor Peiyun | 2013-05-20
Du musst angemeldet sein, um einen Kommentar abzugeben.
Du zufällig gerade ein problem zu haben, für die die default-Werte für
C
undgamma
gut funktioniert (1 und 1/num_features, beziehungsweise).gamma=5
ist deutlich größer als der Standardwert. Es ist vollkommen nachvollziehbar fürgamma=5
zu induzieren, um sehr schlechte Ergebnisse, wenn der default-Wert ist nahe zu optimal. Die Kombination von großengamma
und großeC
ist ein perfektes Rezept für overfitting (z.B. hohe Trainings-set performance und eine geringe test-set Leistung).C
undgamma
passieren, um gut zu arbeiten? Ich dachte, die zu hoher Genauigkeit der Ort in die Betrachtung zu einem echten problem. So bin ich denn überprüfen, ob es irgendwelche features nicht?Ja, die Standard -
C
undgamma
zufällig gute Werte. Sie können sehr hohe Genauigkeit in der viele Probleme der realen Welt. Nur stellen Sie sicher nicht beurteilen, der Sichter auf dem Trainings-set. Was meinst du mit der überprüfung, ob irgendwelche Funktionen nicht?Die Auswertung der Klassifikatoren auf Trainingssatz ist eigentlich eine gute Idee (so lange, wie Sie es auch tun, auf einem validation set und test-set!) wie kann es Ihnen dabei helfen zu beurteilen, ob mehr training Daten oder bessere Funktionen könnten helfen, ein besseres Modell, aber das ist nicht Gegenstand der Frage.
Tatsächlich, ich bezweifle, ob es Funktionen zu Unrecht gewonnen, das zeigt die Informationen des label direkt.
InformationsquelleAutor Marc Claesen