Wie zu Lesen, die classifier confusion matrix in WEKA
Sorry, ich bin neu WEKA und nur zu lernen.
In meinem Entscheidungsbaum (J48) classifier output, es ist eine Verwirrung-Matrix:
a b <----- classified as
130 8 a = functional
15 150 b = non-functional
- Wie lese ich diese matrix? Was ist der Unterschied zwischen a & b?
- Auch, kann jemand mir erklären, was die domain Wert sind?
InformationsquelleAutor JakeSays | 2013-03-05
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich würde sagen wir es so:
Die confusion matrix ist in Weka berichten, wie gut das J48-Modell ist in Bezug auf das, was er bekommt Recht, und was wird es falsch.
Ihrer Daten, die die Ziel-variable war entweder "funktionsfähig" oder "nicht-funktionale;" der rechten Seite der matrix sagt dir, dass die Spalte "a" funktioniert, und "b" nicht funktioniert.
Den Spalten verraten Ihnen, wie Sie Ihr Modell klassifiziert Ihre Proben - das ist es, was das Modell vorhergesagt hat:
Den Zeilen, auf der anderen Seite, die Realität:
Wissen, die Spalten und Zeilen, können Sie Graben sich in die details:
"ein" <- diese waren korrekt
sind wirklich "b" <- eine Art von Fehler
wirklich "ein" <- eine andere Art von Fehler
wirklich "b"
Also oben-Links und unten-rechts in der matrix zeigen, sind Dinge, die Ihr Modell bekommt Recht.
Unten-Links und oben-rechts in der matrix zeigen, wo dein Modell ist verwirrt.
InformationsquelleAutor Mental Nomad
Haben, Lesen Sie die wikipedia-Seite über Verwirrung Matrizen? Der text um die matrix angeordnet ist etwas anders in Ihrem Beispiel (Zeilenbeschriftungen auf der linken statt auf der rechten), aber Sie Lesen es genau das gleiche.
Die Zeile zeigt die wahre Klasse, die Spalte zeigt die classifier-output. Jeder Eintrag, dann gibt die Anzahl der Instanzen von
<row>
klassifiziert wurden als<column>
. In deinem Beispiel 15 Bs waren (falsch) klassifiziert Als, 150 Bs wurden korrekt klassifiziert als Bs, etc.Als Ergebnis werden alle richtige Klassifikationen sind auf die oben-Links nach unten-rechts, diagonal. Alles dran, die Diagonale ist eine falsche Einstufung einiger Sortieren.
TP | FP
Zeile 2:FN | TN
Ich würde es nicht mögen, dass. Ihre Behauptung über die "True Positives" usw gilt nur für 2-Klassen Probleme, wo gibt es klare positiv-und negativ-Klassen. Vielen Klassifikations-Probleme sind nicht, wie, aber Sie haben immer noch Verwirrung Matrizen.
Und für die 2-Klassen-problem, wenn die positive Klasse hat index 0, bedeutet es, dass die erste Zeile TP, FN und zweiten Zeile ist FP, TN.
InformationsquelleAutor Junuxx