SKLearn, wie man entscheidungswahrscheinlichkeiten für LinearSVC classifier
Ich bin mit scikit-learn ist linearSVC Klassifizierer für das text mining. Ich habe den y-Wert als Beschriftung 0/1 und der X-Wert als die TfidfVectorizer der text-Dokument.
Ich verwenden Sie eine pipeline, die wie folgt
pipeline = Pipeline([
('count_vectorizer', TfidfVectorizer(ngram_range=(1, 2))),
('classifier', LinearSVC())
])
Für eine Vorhersage, würde ich mag, um das Vertrauen der Partitur oder die Wahrscheinlichkeit, einen Datenpunkt ein, klassifiziert als
1 in dem Bereich (0,1)
Derzeit nutze ich die Entscheidung, die Funktion
pipeline.decision_function(test_X)
Gibt aber positive und negative Werte, die scheinen zu zeigen, Vertrauen. Ich bin auch nicht sicher, was Sie bedeuten.
Jedoch ist es ein Weg, um die Werte im Bereich von 0-1?
Beispiel ist hier die Ausgabe von der Entscheidung, die Funktion für einige der Daten, die Punkte
-0.40671879072078421,
-0.40671879072078421,
-0.64549376401063352,
-0.40610652684648957,
-0.40610652684648957,
-0.64549376401063352,
-0.64549376401063352,
-0.5468745098794594,
-0.33976011539714374,
0.36781572474117097,
-0.094943829974515004,
0.37728641897721765,
0.2856211778200019,
0.11775493140003235,
0.19387473663623439,
-0.062620918785563556,
-0.17080866610522819,
0.61791016307670399,
0.33631340372946961,
0.87081276844501176,
1.026991628346146,
0.092097790098391641,
-0.3266704728249083,
0.050368652422013376,
-0.046834129250376291,
InformationsquelleAutor Sakib | 2016-02-04
Du musst angemeldet sein, um einen Kommentar abzugeben.
Können Sie nicht.
Aber Sie können
sklearn.svm.SVC
mitkernel='linear'
undprobability=True
Kann es länger laufen, aber man kann Wahrscheinlichkeiten von dieser Klassifizierung mit
predict_proba
Methode.Ja. predict_proba gibt Wahrscheinlichkeiten. SVC mit Darstellung theorem für die Ausbildung(krenel trick), so kann es laufen länger, aber das Ergebnis sollte sehr ähnlich sein(es kann sein, ein wenig anders, abhängig von Implementierung). @Sakib
Super!!! Ich werde versuchen dieses heraus, aber es sieht aus wie das, was ich brauchte.
Ich habe doch noch eine Frage. Was ist der Unterschied zwischen einer Entscheidung, die Funktion und die Vorhersage-Wahrscheinlichkeit?
Entscheidung-Funktion ist Ihre Hypothese(Modell). Vorhersage Wahrscheinlichkeit ist nur die Wahrscheinlichkeit, dass Ihre Hypothese gibt. Aber sehr Breite Definitionen. @Sakib
InformationsquelleAutor Farseer
Wenn Sie darauf bestehen, mit der LinearSVC Klasse, Sie können wickeln Sie es in ein sklearn.die Kalibrierung.CalibratedClassifierCV Objekt und passen die kalibrierten Klassifizierer, die Ihnen eine probabilistische Klassifikator.
Hier ist die Ausgabe:
zeigt die Wahrscheinlichkeiten für jede Klasse für jeden Datenpunkt.
CalibratedClassifierCV
bitte?Ich bearbeitet meine Antwort auf die sample-code.
InformationsquelleAutor javad