Wie implementieren Sie die Ausgabe der Entscheidungsbaum erstellt, indem die abaum (party Paket)?
Ich gebaut habe, einen Entscheidungsbaum mit den ctree
Funktion über party
Paket. es hat 1700 Knoten.
Erstens, gibt es eine Möglichkeit in ctree
zu geben, die maxdepth
argument? Ich habe versucht control_ctree
option, aber es warf einige Fehler Meldung couldnt find abaum Funktion.
Ebenfalls, wie kann ich verbrauchen die Ausgabe dieses Baumes?. Wie kann es umgesetzt werden, für andere Plattformen wie SAS oder SQL. Ich habe auch noch eine Frage, was bedeutet der Wert "* weights = 4349 "
am Ende die Knoten bedeuten. Wie weiß ich, dass die terminal-Knoten Stimmen der vorhergesagten Wert.
- Bitte vereinfachen Sie Ihre Frage zunächst,indem Sie ein Beispiel, welche Funktion Sie tatsächlich schrieb Sie in Ihrem R-Konsole.
- Bibliothek(party -) Zug.treeM1<-abaum(U_ACTIVITY_FLAG_STATUS_3~ U_ARPU_M1 + U_RCHRG_CNT_M1 + U_LOCAL_TOT_MOU_M1 + U_OG_CALL_CNT_M1 + U_OG_AVG_CALL_DURATION_M1 + U_IC_CALL_CNT_M1 + U_IC_AVG_CALL_DURATION_M1 + U_DED_RECHARGE_RATIO + U_Advanced_Handset_Ratio + U_Retailer_Baby_Care_Ratio + U_Retailer_Born_Dead_Ratio, data=traindata) Tabelle(traindata$U_ACTIVITY_FLAG_STATUS_3,predict(Zug.treeM1)) #plot(Zug.treeM1,type="simple") #plot(Zug.treeM1) #Zusammenfassung(Zug.treeM1)
- Dies ist der code den ich verwendet und es hat erstellt einen Baum. Jetzt möchte ich die oputput dieser Baum Implementierung in SAS/SQL, die in den unten genannten format.
- 1) U_OG_CALL_CNT_M1M2 <= 13; Kriterium = 1, statistic = 53104.0 2) U_DED_RECHARGE_RATIO <= 0; Kriterium = 1, statistic = 11833.82 3) U_OG_CALL_CNT_M1M2 <= 5; Kriterium = 1, statistic = 10453.2 4) U_IC_CALL_CNT_M1M2 <= 3; Kriterium = 1, statistic = 7124.4 5) U_IC_CALL_CNT_M1M2 <= 1; Kriterium = 1, statistic = 3304.2 6) U_Retailer_Born_Dead_Ratio <= 0.14; Kriterium = 1, statistic = 2241.2 7) U_OG_CALL_CNT_M1M2 <= 0; Kriterium = 1, statistic = 665.931 8) U_RCHRG_CNT_M1M2 <= 0; Kriterium = 1, statistic = 1621.802 9) U_IC_CALL_CNT_M1M2 <= 0; Kriterium = 1, statistic = 1680.226 10)*GEWICHTE = 4349
- der Ausgang geht auf einige 1700 Zeilen.... Kann mir jemand sagen wie kann ich entziffern, wie das Ende Knoten ist die Stimmabgabe für die mögliche Leistung.
- Hinzufügen von ein wenig von Beispiel-Daten-so können Spielzeug mit diesem code könnte erhöhen Ihre Chancen auf Erhalt einer Antwort. So erstellen Sie dummy-Daten willkürlich. dput kann sehr nützlich sein, um Ihre Daten in eine textuelle Darstellung, die können leicht wiederhergestellt werden, so dass Ihre gesamte code-snipped ein SSCCE. Bitte Bearbeiten Sie Ihre Frage.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Es ist ein
maxdepth
option in abaum. Es befindet sich inctree_control()
Können Sie es verwenden, wie folgt
Können Sie auch einschränken, die split-Größen und die Eimer-Größen "nicht weniger als"
Können Sie auch zu verringern erhöhen sensetivity und niedriger der P-Wert
Den
weights = 4349
Sie erwähnt haben, ist nur die Anzahl der Beobachtungen, die in diesem spezifischen Knoten.ctree
hat einen Standard geben, ein Gewicht von 1 zu, jede Beobachtung, aber wenn Sie fühlen, dass Sie Beobachtungen, die verdienen größere GEWICHTE können Sie ein GEWICHTE-Vektor in denctree()
welche die gleiche Länge wie die Daten gesetzt werden und sind nicht negative Ganzzahlen. Nachdem Sie das tun, dieweights = 4349
müssen mit Vorsicht interpretiert werden.Einen Weg, mit
weights
ist zu sehen, welche Beobachtungen fiel in einen bestimmten Knoten. Die Verwendung der Daten im obigen Beispiel führen wir die folgendendamit wir prüfen können, was fiel in Knoten Nummer 5 zum Beispiel
Mit dieser Methode können Sie erstellen, die Datensätze enthalten die Informationen für Sie terminal-Knoten und dann importieren Sie Sie in SAS-oder SQL -
Können Sie sich auch die Liste der splitting-Bedingungen über die Funktion von unten meine Antwort
abaum() - Wie bekomme ich die Liste der splitting-Bedingungen für die einzelnen terminal-Knoten?