SKLearn, wie man entscheidungswahrscheinlichkeiten für LinearSVC classifier

Ich bin mit scikit-learn ist linearSVC Klassifizierer für das text mining. Ich habe den y-Wert als Beschriftung 0/1 und der X-Wert als die TfidfVectorizer der text-Dokument.

Ich verwenden Sie eine pipeline, die wie folgt

 pipeline = Pipeline([
    ('count_vectorizer',   TfidfVectorizer(ngram_range=(1, 2))),
    ('classifier',         LinearSVC())
  ])

Für eine Vorhersage, würde ich mag, um das Vertrauen der Partitur oder die Wahrscheinlichkeit, einen Datenpunkt ein, klassifiziert als
1 in dem Bereich (0,1)

Derzeit nutze ich die Entscheidung, die Funktion

pipeline.decision_function(test_X)

Gibt aber positive und negative Werte, die scheinen zu zeigen, Vertrauen. Ich bin auch nicht sicher, was Sie bedeuten.

Jedoch ist es ein Weg, um die Werte im Bereich von 0-1?

Beispiel ist hier die Ausgabe von der Entscheidung, die Funktion für einige der Daten, die Punkte

    -0.40671879072078421, 
    -0.40671879072078421, 
    -0.64549376401063352, 
    -0.40610652684648957, 
    -0.40610652684648957, 
    -0.64549376401063352, 
    -0.64549376401063352, 
    -0.5468745098794594, 
    -0.33976011539714374, 
    0.36781572474117097, 
    -0.094943829974515004, 
    0.37728641897721765, 
    0.2856211778200019, 
    0.11775493140003235, 
    0.19387473663623439, 
    -0.062620918785563556, 
    -0.17080866610522819, 
    0.61791016307670399, 
    0.33631340372946961, 
    0.87081276844501176, 
    1.026991628346146, 
    0.092097790098391641, 
    -0.3266704728249083, 
    0.050368652422013376, 
    -0.046834129250376291, 

InformationsquelleAutor Sakib | 2016-02-04

Schreibe einen Kommentar