C5.0 Modelle erfordern ein Faktor Ergebnis
Arbeite ich mit dem Kredit.csv-Format für den Aufbau einer Lern-Struktur, die von Daten ist verfügbar in:
https://github.com/stedy/Machine-Learning-with-R-datasets/blob/master/credit.csv
und ich habe die folgenden Schritte:
credit<-read.csv("credit.csv")
set.seed(12345)
credit_rand<-credit[order(runif(1000)),]
credit_train<-credit_rand[1:900,]
credit_test<-credit_rand[901:1000,]
library(C50)
credit_model<-C5.0(credit_train[-21],credit_train$default)
In der Anleitung, ich bin nach scheint es, dass ich sollte die Beseitigung der letzten Spalte ist der Wert der Standard, aber ich bekam die folgende Fehlermeldung:
Error en C5.0.default(credit_train[, -21], credit_train$default) :
C5.0 models require a factor outcome
Ich habe versucht, die änderung der letzten Zeile:
credit_model<-C5.0(credit_train[,-21],credit_train$default)
aber ohne Erfolg.
Hilfe?
- wenn Sie es ändern, um
credit_model<-C5.0(credit_train[,-21],as.factor(credit_train$default))
funktioniert es?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Dein problem ist, dass
C5.0 models require a factor outcome
. Sie haben das Ergebnis alscredit_train$default
, das ist ein 1/2 Ergebnis, aber R hat als numerische, sondern als ein Faktor:Die Lösung ist dann zu konvertieren, um ein Faktor:
Und führen Sie dann Ihre Ausbildung:
In den ursprünglichen Daten zur Verfügung gestellt vom Verlag, die class-variable (default) gespeichert ist, in Spalte 17, und nicht in Spalte 21. Es sei denn, es wurden wesentliche änderungen in den letzten paar Monaten, es gibt gute Chancen, dass Ihre Datei nicht die richtige.
In meiner Datei, die ich erhalten von diesem Ort nach dem Kauf das Buch, die Klasse der variable "default" ist ein Faktor mit zwei Stufen ("ja" und "Nein"), wie es sein sollte.
Nach dem Buch, entsprechend dem Befehl, der ausgeführt werden sollte, ist
gefolgt von
Dann funktioniert es wie ein Charme.