SKLearn, wie man entscheidungswahrscheinlichkeiten für LinearSVC classifier

Ich bin mit scikit-learn ist linearSVC Klassifizierer für das text mining. Ich habe den y-Wert als Beschriftung 0/1 und der X-Wert als die TfidfVectorizer der text-Dokument.

Ich verwenden Sie eine pipeline, die wie folgt

 pipeline = Pipeline([
    ('count_vectorizer',   TfidfVectorizer(ngram_range=(1, 2))),
    ('classifier',         LinearSVC())
  ])

Für eine Vorhersage, würde ich mag, um das Vertrauen der Partitur oder die Wahrscheinlichkeit, einen Datenpunkt ein, klassifiziert als
1 in dem Bereich (0,1)

Derzeit nutze ich die Entscheidung, die Funktion

pipeline.decision_function(test_X)

Gibt aber positive und negative Werte, die scheinen zu zeigen, Vertrauen. Ich bin auch nicht sicher, was Sie bedeuten.

Jedoch ist es ein Weg, um die Werte im Bereich von 0-1?

Beispiel ist hier die Ausgabe von der Entscheidung, die Funktion für einige der Daten, die Punkte

    -0.40671879072078421, 
    -0.40671879072078421, 
    -0.64549376401063352, 
    -0.40610652684648957, 
    -0.40610652684648957, 
    -0.64549376401063352, 
    -0.64549376401063352, 
    -0.5468745098794594, 
    -0.33976011539714374, 
    0.36781572474117097, 
    -0.094943829974515004, 
    0.37728641897721765, 
    0.2856211778200019, 
    0.11775493140003235, 
    0.19387473663623439, 
    -0.062620918785563556, 
    -0.17080866610522819, 
    0.61791016307670399, 
    0.33631340372946961, 
    0.87081276844501176, 
    1.026991628346146, 
    0.092097790098391641, 
    -0.3266704728249083, 
    0.050368652422013376, 
    -0.046834129250376291,

InformationsquelleAutor Sakib | 2016-02-04

4

Können Sie nicht.
Aber Sie können sklearn.svm.SVC mit kernel='linear' und probability=True

Kann es länger laufen, aber man kann Wahrscheinlichkeiten von dieser Klassifizierung mit predict_proba Methode.
```
clf=sklearn.svm.SVC(kernel='linear',probability=True)
clf.fit(X,y)
clf.predict_proba(X_test)
```
Ist SVC anders aus LinearSVC? Wird es zu unterschiedlichen Ergebnissen führen? und auch ist die Wahrscheinlichkeit zwischen 0 und 1, die in SVCs Vorhersagen probabilties?
Ja. predict_proba gibt Wahrscheinlichkeiten. SVC mit Darstellung theorem für die Ausbildung(krenel trick), so kann es laufen länger, aber das Ergebnis sollte sehr ähnlich sein(es kann sein, ein wenig anders, abhängig von Implementierung). @Sakib
Super!!! Ich werde versuchen dieses heraus, aber es sieht aus wie das, was ich brauchte.
Ich habe doch noch eine Frage. Was ist der Unterschied zwischen einer Entscheidung, die Funktion und die Vorhersage-Wahrscheinlichkeit?
Entscheidung-Funktion ist Ihre Hypothese(Modell). Vorhersage Wahrscheinlichkeit ist nur die Wahrscheinlichkeit, dass Ihre Hypothese gibt. Aber sehr Breite Definitionen. @Sakib

InformationsquelleAutor Farseer

Wenn Sie darauf bestehen, mit der LinearSVC Klasse, Sie können wickeln Sie es in ein sklearn.die Kalibrierung.CalibratedClassifierCV Objekt und passen die kalibrierten Klassifizierer, die Ihnen eine probabilistische Klassifikator.

from sklearn.svm import LinearSVC
from sklearn.calibration import CalibratedClassifierCV
from sklearn import datasets

#Load iris dataset
iris = datasets.load_iris()
X = iris.data[:, :2] # Using only two features
y = iris.target      #3 classes: 0, 1, 2

linear_svc = LinearSVC()     #The base estimator

# This is the calibrated classifier which can give probabilistic classifier
calibrated_svc = CalibratedClassifierCV(linear_svc,
                                        method='sigmoid',  #sigmoid will use Platt's scaling. Refer to documentation for other methods.
                                        cv=3) 
calibrated_svc.fit(X, y)


# predict
prediction_data = [[2.3, 5],
                   [4, 7]]
predicted_probs = calibrated_svc.predict_proba(prediction_data)  #important to use predict_proba
print predicted_probs

Hier ist die Ausgabe:

[[  9.98626760e-01   1.27594869e-03   9.72912751e-05]
 [  9.99578199e-01   1.79053170e-05   4.03895759e-04]]

zeigt die Wahrscheinlichkeiten für jede Klasse für jeden Datenpunkt.

hey @javad, können Sie bitte ein lauffähiges Beispiel, mit dem die CalibratedClassifierCV bitte?
Ich bearbeitet meine Antwort auf die sample-code.

InformationsquelleAutor javad

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.