Was ist die Bedeutung des nu-parameter in Scikit-Learn der SVM Klasse?

Ich bin nach dem Beispiel, dargestellt in http://scikit-learn.org/stable/auto_examples/svm/plot_oneclass.html#example-svm-plot-oneclass-py, wo ein one-class-SVM verwendet wird, für die Anomalie-Erkennung.
Nun, dies kann eine notation eindeutig zu scikit-learn, aber ich konnte nicht finden eine Erklärung, wie der parameter nu gegeben, um die OneClassSVM Konstruktor.

In http://scikit-learn.org/stable/modules/svm.html#nusvc, es wird angegeben, dass der parameter nu ist ein reparametrization der parameter C (das ist die Regularisierung parameter, die ich bin vertraut mit) - aber nicht, wie Sie durchführen, dass die Neuberechnung der Parameter.

Sowohl eine Formel und eine intuition wird sehr geschätzt.

Dank!

ν ist sicherlich nicht scikit-learn-spezifisch; siehe dieses tutorial von Chen, Lin und Schölkopf, ausgehend von p. 13 (Erster Google-Treffer für "nu-svm").

InformationsquelleAutor Guy Adini | 2012-06-27

43

Das problem mit C und die Einführung von nu

Das problem mit dem parameter C:
1. es kann jeden positiven Wert
2. dass es keine direkte interpretation.
Es ist daher schwer richtig zu wählen und man muss zu greifen, um cross-validation-oder direkte Experimente zu finden, die einen geeigneten Wert.

Antwort Schölkopf et al. neu SVM eine neue Regularisierung parameter nu.
Dieser parameter ist:
1. begrenzt zwischen 0 und 1
2. hat eine direkte interpretation
Interpretation von nu

Den parameter nu ist eine Obere Schranke für den Anteil der margin-Fehler und eine untere Schranke der Anteil der support-Vektoren, bezogen auf die gesamte Anzahl von trainingsbeispielen. Zum Beispiel, wenn Sie ihn 0,05 sind Sie garantiert auf höchstens 5% Ihres Trainings Beispiele falsch klassifiziert (auf Kosten einer kleinen Marge, obwohl) und mindestens 5% Ihres Trainings-Beispiele, die als support-Vektoren.

Beziehung zwischen C und nu

Die Beziehung zwischen C und nu ist geregelt durch die folgende Formel:

nu = A+B/C

A und B sind Konstanten, die sind leider nicht so leicht zu berechnen.

Abschluss

Das mitnehmen Botschaft ist, dass C-und nu-SVM gleichwertig sind hinsichtlich Ihrer Klassifikation macht. Die Regulation im Sinne der nu ist einfacher zu interpretieren ist im Vergleich zu C, aber die nu-SVM ist in der Regel schwieriger zu optimieren und die Laufzeit nicht so gut skalieren wie die C-Variante mit der Anzahl der input-Proben.

Weitere Informationen (einschließlich Formeln für A und B) können hier gefunden werden: Chang CC, Lin CJ - "Training nu-support Vektor Klassifikatoren: Theorie und algorithmen"

Es ist nicht unbedingt wahr, dass "Sie garantiert" als nu ist ein gebunden wie du geschrieben hast. In der Tat, diese nur gilt für nu in seinen zulässigen Intervall (siehe S. 123, Appl. Stochastische-Modelle-Bus. Ind., 2005; 21:111-136). Ein weiteres problem ist, dass in Abb. 5 von der gleichen Referenz, die Beziehung zwischen nu und C ist nicht wie die, die Sie zitieren. Diese Antwort qualifiziert werden sollten. PS: ich wäre daran interessiert zu wissen, was dieses Intervall ist in dem Fall von 1-class SVM: in der Referenz von mir zitierten, Aussage 3 p. 126 gibt nur die 2-Klassen SVM zulässige Intervall für nu.
Lieber @Bernhard Kausler, können Sie bitte einen Blick eine Frage, die ich verfasst: stackoverflow.com/questions/24540919/...
ein Buch über den Sinn des Nu?
Konnte Sie erklären Sie mir, mit einigen Grafiken

InformationsquelleAutor Bernhard Kausler
0

nu in der support-Vektoren ist eine hyper-parameter.

In der c-SVM wenn wir wollen, dass die Abfrage eines Punktes x_q dann

∑α_i.y_i.x_i^T.x_q+b für i=1 bis n

, Wie wir wissen, α_i für suport Vektoren größer als null ist und für die nicht-Unterstützung vecotrs α_i=0.

so nur die support-Vektoren ist die Materie für calcuating f(x_q), Aber in regulären C-SVM wir haben keine Kontrolle über die keine.der support-Vektoren so, hier kommt der nu-SVM

nu :
1. Obere Grenze für die keine.der Fehler
2. untere Schranke für keine.der support-Vektoren
  
  nu immer liegt zwischen 0<= nu <= 1.
können sagen nu=0,1 und n=10,000

1.wir wollen maximal 10% Fehler => 1000-Fehler-Punkte

2.bekommen wir support-Vektoren >= 1% =>wir bekommen mehr als 1000 support-Vektoren.

InformationsquelleAutor Ravi Gurnatham

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.

Das problem mit C und die Einführung von nu

Interpretation von nu

Beziehung zwischen C und nu

Abschluss