scikit-learn return-Wert LogisticRegression.predict_proba
Was genau macht der LogisticRegression.predict_proba
Funktion zurückgeben?
In meinem Beispiel bekomme ich ein Ergebnis wie dieses:
[[ 4.65761066e-03 9.95342389e-01]
[ 9.75851270e-01 2.41487300e-02]
[ 9.99983374e-01 1.66258341e-05]]
Aus anderen Berechnungen, die Verwendung der sigmoid-Funktion, ich weiß, dass in der zweiten Spalte sind die Wahrscheinlichkeiten. Die Dokumentation sagt, dass die erste Spalte sind n_samples
, aber das kann nicht sein, denn meine Proben sind Bewertungen, die Texte und nicht zahlen. Die Dokumentation sagt auch, dass die zweite Spalte n_classes
. Das kann sicherlich nicht sein, da ich nur zwei Klassen (nämlich +1
und -1
), und die Funktion soll zur Berechnung von Wahrscheinlichkeiten von Proben wirklich von einer Klasse, nicht aber die Klassen selbst.
Was ist die erste Spalte wirklich ist und warum es da ist?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Der ersten Spalte ist die Wahrscheinlichkeit, dass der Eintrag im
-1
Bezeichnung und die zweite Spalte ist die Wahrscheinlichkeit, dass der Eintrag im+1
label.Wenn Sie möchten, um die vorhergesagten Wahrscheinlichkeiten für die positive label nur verwenden, können Sie
logistic_model.predict_proba(data)[:,1]
. Diese Ausbeute wird Ihnen die[9.95342389e-01, 2.41487300e-02, 1.66258341e-05]
Ergebnis.