Genauigkeit Punktzahl : ValueError: nicht Verarbeiten Kann mischen binäre und kontinuierliche

Ich bin mit linear_model.LinearRegression von scikit-learn als ein prädiktives Modell aus. Es funktioniert und es ist perfekt. Ich habe ein problem, zu bewerten, die prognostizierten Ergebnisse mit der accuracy_score Metrik.
Dies ist meine wahre Daten :

array([1, 1, 0, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0])

Und das ist mein predictive Data :

array([ 0.07094605,  0.1994941 ,  0.19270157,  0.13379635,  0.04654469,
    0.09212494,  0.19952108,  0.12884365,  0.15685076, -0.01274453,
    0.32167554,  0.32167554, -0.10023553,  0.09819648, -0.06755516,
    0.25390082,  0.17248324])

Mein code :

accuracy_score(y_true, y_pred, normalize=False)

- Und das ist die Fehlermeldung :

"ValueError: nicht verarbeiten Kann mischen von binären und kontinuierlichen"

Helfen ? Danke.

Was sind die dtypes? Kann Sie nur gegossen y_true zu numpy.int8? Vielleicht suchen Sie Logistische regression statt, um vorherzusagen, kategoriale Variablen?
Es ist die überprüfung der type_of_target(y_true) und type_of_target(y_pred) (in utils.multiclass.py). Wenn das array nur 2 eindeutige Werte es ist klassifiziert als binary.

InformationsquelleAutor DataAddicted | 2016-06-24

24
```
accuracy_score(y_true, y_pred.round(), normalize=False)
```
wenn Sie es vorziehen, mehr Kontrolle über die Schwelle verwenden
(y_pred>threshold).astype(int) statt y_pred.round() wo threshold ist Ihr Wert zur Trennung der zwei Klassen.

Sie können die cut-Spitze mit 0,5, oder entscheiden Sie sich für eine weitere Schwelle, zum Beispiel nach der roc-Kurve, und eine andere trade-off Spezifität vs Empfindlichkeit, überprüfen Sie die stats.stackexchange.com/questions/29719/... Formular mehr details über die Statistik.
Ein Hinweis auf das erwartete array. Ich sehe, Sie haben negative Werte. Im Normalfall sollte man Wahrscheinlichkeiten zwischen 0 und 1. Sie könnte konvertieren, um Wahrscheinlichkeiten mithilfe der softmax-Funktion finden Sie unter stackoverflow.com/questions/34968722/softmax-function-python
Hallo, ich bin mit Ihrem Vorschlag für die Verwendung Schwelle, wie auch immer, ich bin nicht sicher, wie Sie Sie zu kommen mit der richtigen Schwelle noch, ich dachte, wenn es möglich ist, verwenden Sie die hyper-parameter-Optimierung Bibliotheken für diesen Zweck. Lassen Sie mich wissen, Ihre Ansichten bitte

InformationsquelleAutor natbusa
5

Den sklearn.Metriken.accuracy_score(y_true, y_pred) - Methode definiert y_pred:

y_pred : 1d-array-like, oder label indicator array /sparse-matrix. Vorhergesagten Etiketten, zurückgegeben durch einen Klassifizierer.

Was bedeutet y_pred hat, um ein array von 1 s oder 0 s (ausgesagt Etiketten). Sollten Sie nicht Wahrscheinlichkeiten.

Die ausgesagt Etiketten (1 und 0) und/oder vorhergesagten Wahrscheinlichkeiten erzeugt werden kann, mit Hilfe der LinearRegression () - Modell die Methoden predict() und predict_proba() bzw..

1. Generieren vorhergesagten labels:
```
LR = linear_model.LinearRegression()
y_preds=LR.predict(X_test)
print(y_preds)
```
Ausgabe:

[1 1 0 1]

'y_preds' kann jetzt verwendet werden, für die accuracy_score () - Methode: accuracy_score(y_true, y_pred)

2. Generieren Wahrscheinlichkeiten für Etiketten:

Einige Metriken wie 'precision_recall_curve(y_true, probas_pred)" erfordern Wahrscheinlichkeiten, die erzeugt werden kann, wie folgt:
```
LR = linear_model.LinearRegression()
y_preds=LR.predict_proba(X_test)
print(y_preds)
```
Ausgabe:

[0.87812372 0.77490434 0.30319547 0.84999743]

InformationsquelleAutor MLKing
2

Das problem ist, dass der wahre y Binär (Nullen und Einsen), während Ihre Vorhersagen nicht. Sie wahrscheinlich generiert Wahrscheinlichkeiten und keine Vorhersagen, daher ist das Ergebnis 🙂
Versuchen Sie stattdessen zu generieren-Klasse-Mitgliedschaft, und es sollte funktionieren!

InformationsquelleAutor JohnnyQ
2

Vielleicht hilft dies ja jemand, der findet diese Frage:

Als JohnnyQ bereits darauf hingewiesen, das problem ist, dass Sie nicht-Binär (nicht 0 noch 1) die Werte in Ihrem y_pred ich. e. beim hinzufügen
```
print(((y_pred != 0.) & (y_pred != 1.)).any())
```
sehen Sie True in der Ausgabe. (Der Befehl findet heraus, ob es irgendeinen Wert, der nicht 0 oder 1).

Können Sie Ihre nicht-binäre Werte mit:
```
non_binary_values = y_pred[(y_pred['score'] != 1) & (y_pred['score'] != 0)]
non_binary_idxs = y_pred[(y_pred['score'] != 1) & (y_pred['score'] != 0)].index
```
Einer print-Anweisung ausgegeben werden können, die oben abgeleitete Variablen.

Schließlich, diese Funktion reinigen können Sie Ihre Daten von allen nicht-binäre Einträge:
```
def remove_unlabelled_data(X, y):
    drop_indexes = X[(y['score'] != 1) & (y['score'] != 0)].index
    return X.drop(drop_indexes), y.drop(drop_indexes)
```
InformationsquelleAutor Manu CJ
1

accuracy_score ist eine Klassifikation, die Metrik, die Sie verwenden können es für eine regression-problem.

Sehen Sie die verfügbaren regression Metriken hier

InformationsquelleAutor Amey Yadav

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.