Wie die Berechnung der Fehlerquote von ein Entscheidungsbaum?
Weiß jemand, wie die Berechnung der Fehlerquote für einen Entscheidungsbaum mit R?
Ich bin mit der rpart()
Funktion.
InformationsquelleAutor der Frage teo6389 | 2012-03-12
Du musst angemeldet sein, um einen Kommentar abzugeben.
Vorausgesetzt, du meinst computing-Fehler-rate auf die Probe, die auf das Modell passt, können Sie
printcp()
. Zum Beispiel, indem Sie die on-line Beispiel,Den
Root node error
wird verwendet, um zu berechnen, sind zwei Maßnahmen von predictive performance, wenn man Werte in denrel error
undxerror
Spalte, und abhängig von der Komplexität der parameter (erste Spalte):0.76471 x 0.20988 = 0.1604973 (16.0%) ist die resubstitution error rate (D. H., Fehler-rate berechnet, die auf die Ausbildung-Beispiel) - das ist ungefähr die
0.82353 x 0.20988 = 0.1728425 (17.2%) ist die cross-validierten Fehlerquote (mit 10-fold CV, siehe
xval
imrpart.control()
; siehe aber auchxpred.rpart()
undplotcp()
die sich auf diese Art der Maßnahme). Diese Maßnahme ist ein objektiver Indikator für die prädiktive Genauigkeit.Beachten Sie, dass es mehr oder weniger in übereinstimmung mit der Klassifizierung Richtigkeit von
tree
:wo
Misclassification error rate
berechnet sich aus der Trainings-Stichprobe.InformationsquelleAutor der Antwort chl