building classification tree mit kategorischen Variablen mittels rpart
Habe ich ein Daten-set mit 14 Funktionen, und einige von Ihnen sind als unten, wo Geschlecht und Familienstand sind kategoriale Variablen.
height,sex,maritalStatus,age,edu,homeType
SEX
1. Male
2. Female
MARITAL STATUS
1. Married
2. Living together, not married
3. Divorced or separated
4. Widowed
5. Single, never married
Jetzt bin ich mit rpart library von R zu bauen, eine Klassifikation Baum mit den folgenden
rfit = rpart(homeType ~., data = trainingData, method = "class", cp = 0.0001)
Gibt mir ein Entscheidungsbaum, der nicht der Auffassung, Geschlecht und Familienstand als Faktoren.
Ich bin denken mit als.Faktor :
sex = as.factor(trainingData$sex)
ms = as.factor(trainingData$maritalStatus)
Aber ich bin nicht sicher, wie gebe ich diese Informationen zu rpart. Da das argument Daten in rpart() übernimmt in "trainingData" Daten-frame. Es werden immer die Werte in das Daten-frame.
Ich bin etwas neu auf R und würde schätzen, dass jemand Hilfe auf diesem.
InformationsquelleAutor user4251309 | 2014-11-14
Du musst angemeldet sein, um einen Kommentar abzugeben.
Könnte man änderungen vornehmen, um die
trainingData
Daten-Frames direkt, dann laufenrpart()
.Siehe stackoverflow.com/a/20994978/2140956.
InformationsquelleAutor Jean V. Adams
In der Praxis können Sie verwandeln jeden kategorischen Wert in einen ordinalen Wert, beispielsweise 'Zivilstand' in den Bedingungen 1, 2, 3... Aber im Allgemeinen sollte man nicht machen, der Umwandlung, es sei denn, Sie haben einer begrifflichen definition von beliebigen kontinuierlichen Wert. Zum Beispiel, wenn Sie kann nicht definieren, was ist ein 1.2 Martital Status, Sie sollten nicht die transformation. Statt, manchmal können Sie mit einem repräsentativen Wert, je nach Ziel Ihrer Forschung. Zum Beispiel, wenn Sie versuchen, verknüpfen Sie Ihre Daten, um vorherzusagen, welche Art von Haus ist, das "minimum an Trost" jeder Familienstand ist ein ordinal Wert, der in der Lage ist zu interpretieren, wenn (sagen wir mal) ist 1,2.
InformationsquelleAutor Jose Carlos Machicao Valencia