R randomForest für die Einstufung

Ich versuche zu tun, Klassifikation mit randomForest, aber ich bin immer wieder eine Fehlermeldung, für die es anscheinend keine offensichtliche Lösung (randomForest hat gut funktioniert für mich tun, regression in die Vergangenheit). Habe ich eingefügt, mein code unten. 'Erfolg' ist ein Faktor, der Sie alle abhängigen Variablen sind zahlen. Irgendwelche Vorschläge, wie laufen diese Einstufung richtig?

> rf_model<-randomForest(success~.,data=data.train,xtest=data.test[,2:9],ytest=data.test[,1],importance=TRUE,proximity=TRUE)

Error in randomForest.default(m, y, ...) : 
  NA/NaN/Inf in foreign function call (arg 1)

auch, hier ein Auszug aus den Datensatz:

Kopf(Daten)

success duration  goal reward_count updates_count comments_count backers_count     min_reward_level max_reward_level
True 20.00000  1500           10            14              2            68                1             1000
True 30.00000  3000           10             4              3            48                5             1000
True 24.40323 14000           23             6             10           540                5             1250
True 31.95833 30000            9            17              7           173                1            10000
True 28.13211  4000           10            23             97          2936               10              550
True 30.00000  6000           16            16            130          2043               25              500
  • Ohne einen vollständig reproduzierbaren Beispiel, keine. Zumindest würde ich (1) überprüfen, dass es keine NA-Werte in Ihren Daten, und (2) führen Sie traceback() zu sehen, wenn Sie einige weitere Informationen, wo der Fehler Auftritt.
  • versuchen, sich zu ändern "Erfolg" Werten, Arten, Namen anstelle von "True". können, wie Sie uns die Ausgabe von srt(Daten) ??
  • Es scheint, dass Sie bereits akzeptiert eine Antwort; ich lief in dieser und festgestellt, dass für die Klassifizierung, es war wegen meiner Reaktion variable der chr Klasse. Entweder tun data$var <- as.factor(data$var) oder die Vorhersage mit randomForest(as.factor(data$var) ~ ., ...) Feste das für mich.
  • Verwenden lapply(your_data, class) und prüfen, ob es Beobachtungen der Klasse "Zeichen"
InformationsquelleAutor user1799242 | 2013-01-03
Schreibe einen Kommentar