Verständnis von minbucket Funktion im CART-Modell mit R
Übernehmen der Trainings-Daten "Frucht", die werde ich verwenden es für Vorhersagen mithilfe von CART-Modell in R
> fruit=data.frame(
color=c("red", "red", "red", "yellow", "red","yellow",
"orange","green","pink", "red", "red"),
isApple=c(TRUE, TRUE, TRUE, FALSE, TRUE, FALSE,
FALSE,FALSE,FALSE,FALSE,TRUE))
> mod = rpart(isApple ~ color, data=fruit, method="class", minbucket=1)
> prp(mod)
Könnte jemand erklären, was genau die Rolle von minbucket
im zeichnen CART-Baum für dieses Beispiel, wenn wir gehen, um zu verwenden minbucket
= 2, 3, 4, 5?
Sehen, habe ich 2 Variablen, Farbe & isApple. Farbe variable grün, gelb, pink, orange und Rot. ist Apple-variable hat den Wert TRUE oder FALSE. Im letzten Beispiel, RED hat drei WAHR und 2 FALSCH zugeordnet wurde. Rot-Wert erscheint fünf mal. wenn ich minbucket = 1,2,3, dann ist es Spaltung. Wenn ich minbucket = 4 oder 5 ist dann keine Spaltung tritt auf, wenn rot erscheint fünf mal.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Aus der Dokumentation für die
rpart
Paket:Einstellung
minbucket
1 ist sinnlos, da jeder Blatt-Knoten (per definition) mindestens eine Beobachtung auf. Wenn du es auf einen höheren Wert, sagen wir 3, dann würde es bedeuten, dass jeder Blatt-Knoten haben mindestens 3 Beobachtungen in diesem Eimer.Je kleiner der Wert von
minbucket
ist, desto genauer ist Ihr WARENKORB Modell sein wird. Durch die Einstellungminbucket
zu ein zu kleiner Wert, z.B. 1, besteht die Gefahr der überanpassung Ihr Modell.