RandomForest für die Regression in R

Ich experimentiere mit R und die randomForest-Paket, ich habe einige Erfahrungen mit SVM und Neuronale Netze.
Mein Erster test ist, um zu versuchen und regress: sin(x)+Gaußsches Rauschen.
Mit Neuronale Netze und svm, die ich erhalten ein "relativ" schönes approximation von sin(x), so dass das Rauschen herausgefiltert wird und die Lern-Algorithmus nicht overfit. (für menschenwürdige Parameter)
Wenn das gleiche tun auf randomForest ich habe eine ganz overfitted Lösung.
Ich einfach (R 2.14.0, versucht auf 2.14.1 auch, nur für den Fall):

library("randomForest")
x<-seq(-3.14,3.14,by=0.00628)
noise<-rnorm(1001)
y<-sin(x)+noise/4
mat<-matrix(c(x,y),ncol=2,dimnames=list(NULL,c("X","Y")))
plot(x,predict(randomForest(Y~.,data=mat),mat),col="green")
points(x,y)

Ich denke, es ist eine Magie, die option in randomForest, damit es funktioniert korrekt, ich habe versucht ein paar, aber ich fand nicht die richtigen Hebel zu ziehen...

InformationsquelleAutor user1206729 | 2012-02-13
Schreibe einen Kommentar