Unterschiedliches Ergebnis mit roc_auc_score () und auc ()

Ich habe Schwierigkeiten zu verstehen, den Unterschied (wenn es einen gibt) zwischen roc_auc_score() und auc() in scikit-learn.

Im binden voraussagen eine binäre Ausgabe mit unausgewogenen Klassen (rund 1,5% für Y=1).

Classifier

model_logit = LogisticRegression(class_weight='auto')
model_logit.fit(X_train_ridge, Y_train)

Roc-Kurve

false_positive_rate, true_positive_rate, thresholds = roc_curve(Y_test, clf.predict_proba(xtest)[:,1])

AUC s

auc(false_positive_rate, true_positive_rate)
Out[490]: 0.82338034042531527

und

roc_auc_score(Y_test, clf.predict(xtest))
Out[493]: 0.75944737191205602

Jemand kann sich diesen Unterschied zu erklären ? Ich dachte, beide waren nur die Berechnung der Fläche unter der ROC-Kurve. Möglicherweise werden wegen der unausgewogenen Datensatz aber ich konnte nicht herausfinden, warum.

Dank!

InformationsquelleAutor der Frage Florian Gauthier | 2015-07-01

Schreibe einen Kommentar