Die gamma-und Kosten-parameter des SVM

alle, hier ist ein sonderbares Phänomen, wenn ich mit libSVM Vorhersagen.

Wenn ich keine Parameter des SVM, bekomme ich ein zu 99,9% auf die Leistung des Tests festgelegt. Während, wenn ich Parameter '-c-10 -g 5 -', ich bekomme etwa 33% Präzision auf der Prüfung.

Durch die Art und Weise, die SVM-toolkit, die ich verwende, ist LibSVM.

Frage ich mich, ob es etwas falsch mit Daten eingestellt. Und ich konnte nicht herausfinden, das Ergebnis ist überzeugender.

Weiter zu Marc ' s Antwort sollte man eine eigene Validierungs-set zu wählen, gute Werte für C und g. Oder nutzen grid.py (geliefert mit libsvm), um diese Parameter über cross-Validierung.
Und dies wird dringend empfohlen, zu Lesen: csie können.ntu.edu.tw/~cjlin/Papiere/Anleitung/Anleitung.pdf
Die LIBSVM-guide ist in der Tat eine sehr gute erste Referenz.

InformationsquelleAutor Peiyun | 2013-05-20

10

Du zufällig gerade ein problem zu haben, für die die default-Werte für C und gamma gut funktioniert (1 und 1/num_features, beziehungsweise).

gamma=5 ist deutlich größer als der Standardwert. Es ist vollkommen nachvollziehbar für gamma=5 zu induzieren, um sehr schlechte Ergebnisse, wenn der default-Wert ist nahe zu optimal. Die Kombination von großen gamma und große C ist ein perfektes Rezept für overfitting (z.B. hohe Trainings-set performance und eine geringe test-set Leistung).

Meinst du, dass die Standard - C und gamma passieren, um gut zu arbeiten? Ich dachte, die zu hoher Genauigkeit der Ort in die Betrachtung zu einem echten problem. So bin ich denn überprüfen, ob es irgendwelche features nicht?
Ja, die Standard - C und gamma zufällig gute Werte. Sie können sehr hohe Genauigkeit in der viele Probleme der realen Welt. Nur stellen Sie sicher nicht beurteilen, der Sichter auf dem Trainings-set. Was meinst du mit der überprüfung, ob irgendwelche Funktionen nicht?
Die Auswertung der Klassifikatoren auf Trainingssatz ist eigentlich eine gute Idee (so lange, wie Sie es auch tun, auf einem validation set und test-set!) wie kann es Ihnen dabei helfen zu beurteilen, ob mehr training Daten oder bessere Funktionen könnten helfen, ein besseres Modell, aber das ist nicht Gegenstand der Frage.
Tatsächlich, ich bezweifle, ob es Funktionen zu Unrecht gewonnen, das zeigt die Informationen des label direkt.

InformationsquelleAutor Marc Claesen

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.