Tag: random-forest

In Lern-algorithmen und statistischen Klassifizierung, ein random forest einen Klassifizierer besteht in vielen Entscheidungsbäumen. Es gibt die Klasse, die den Modus der Klassen Ausgabe von einzelnen Bäumen, in anderen Worten, die Klasse mit der höchsten Frequenz.

so prüfen Sie die Richtigkeit der random forest Modell mit Hilfe einer Tabelle

Anzahl der Antworten 2 Antworten
Ich bin neu randomForest-Modelle und brauchen Hilfe. Ich erstellt ein random forest 500 Bäume aus mein Zug Daten.frame, und habe ich eine Reihe von Antwort, die Vorhersagen für eine bestimmte variable. Ich brauche zum vergleichen der Vorhersagen

h2o randomForest variable Bedeutung

Anzahl der Antworten 1 Antworten
Ich bin mit h2o-Paket zu erstellen, randomForest-regression-Modell. Ich habe einige Probleme mit den Variablen an Bedeutung. Das Modell, das ich erschaffe, ist hier. Alles funktioniert einwandfrei. Einige der Variablen sind numerisch, aber einige sind kategorisch. RandomForest <-

Tut random forest in R eine Begrenzung der Größe von Trainingsdaten?

Anzahl der Antworten 2 Antworten
Ich bin training randomforest auf mein training Daten 114954 Zeilen und 135 Spalten (Prädiktoren). Und ich erhalte die folgende Fehlermeldung. model <- randomForest(u_b_stars~. ,data=traindata,importance=TRUE,do.trace=100, keep.forest=TRUE, mtry=30) Error: cannot allocate vector of size 877.0 Mb In addition: Warning

Stratified sampling scheint sich nicht zu ändern randomForest Ergebnisse

Anzahl der Antworten 2 Antworten
Ich bin mit dem randomForest-Paket in R zu erstellen mehrere Arten Verbreitung-Modelle. Meine abhängige variable ist Binär (0 - fehlen oder 1-Präsenz), und ziemlich unausgewogen - für einige Arten das Verhältnis von Abwesenheiten: - Präsenzen 37:1. Dieses

Wie die Ausgabe RandomForest Klassifizierer von python?

Anzahl der Antworten 2 Antworten
Habe ich trainiert RandomForestClassifier von Python Sckit Lernen Modul mit sehr großen Datensatz, aber die Frage ist, wie kann ich eventuell dieses Modell speichern und lassen Sie andere Menschen wenden es auf Ihr Ende. Danke! Siehe scikit-learn.org/stable/tutorial/basic/...

Confusion-matrix für die random forest in R Caret

Anzahl der Antworten 4 Antworten
Ich habe Daten mit binären JA/NEIN Klasse Antwort. Mit dem folgenden code für die Ausführung von HF-Modell. Ich habe problem bei der confusion-matrix Ergebnis. dataR <- read_excel("*:/*.xlsx") Train <- createDataPartition(dataR$Class, p=0.7, list=FALSE) training <- dataR[ Train, ]

PySpark & MLLib: Klasse Wahrscheinlichkeiten von Random Forest Vorhersagen

Anzahl der Antworten 4 Antworten
Ich versuche, zu extrahieren die Klasse Wahrscheinlichkeiten der random forest-Objekt habe ich geschult mit PySpark. Allerdings sehe ich nicht ein Beispiel von ihm überall in der Dokumentation, noch ist es eine Methode der RandomForestModel. Wie kann ich

RandomForest für die Regression in R

Anzahl der Antworten 3 Antworten
Ich experimentiere mit R und die randomForest-Paket, ich habe einige Erfahrungen mit SVM und Neuronale Netze. Mein Erster test ist, um zu versuchen und regress: sin(x)+Gaußsches Rauschen. Mit Neuronale Netze und svm, die ich erhalten ein "relativ"

Wie man Gewicht-Klassen in einem RandomForest Umsetzung?

Anzahl der Antworten 1 Antworten
Ich arbeite an einem 3D-Punkt Identifikation mit der RandomForest Methode von scikit. Eine der Fragen, die ich laufen in ist, dass bestimmte Klassen vorhanden sind, öfter als andere Klassen. Dies bedeutet, dass in den Prozess der Generierung

Berechnen Sie R-Quadrat (%Var) erklärt aus einer Kombination von randomForest regression Objekt

Anzahl der Antworten 1 Antworten
Bei der Berechnung einer randomForest regression, die das Objekt enthält die R-Quadrat als "% Var explained: ...". library(randomForest) library(doSNOW) library(foreach) library(ggplot2) dat <- data.frame(ggplot2::diamonds[1:1000,1:7]) rf <- randomForest(formula = carat ~ ., data = dat, ntree = 500)

R mehrere randomForest-Objekte in einem vector

Anzahl der Antworten 4 Antworten
Ich bin gespannt, ob R hat die Fähigkeit, Objekte in Vektoren/Listen/arrays/etc. Ich bin mit dem randomforest-Paket arbeiten, auf Teilmengen von einem größeren Stück von Daten und speichern möchten, jede version in einer Liste. Es wäre ähnlich wie

RF: hohe OOB Genauigkeit durch eine Klasse und sehr geringe Genauigkeit durch den anderen, mit großer Klasse Ungleichgewicht

Anzahl der Antworten 6 Antworten
Ich bin neu in random forest Klassifikator. Ich benutze es zu klassifizieren, die einen Datensatz mit zwei Klassen. - Die Anzahl der features ist 512. - Der Anteil der Daten ist 1:4. I. e, 75% der Daten

Speichern Sie die python random forest Modell-Datei

Anzahl der Antworten 3 Antworten
In R nach der Ausführung von "random forest" - Modell, die ich verwenden kann save.image("***.RData") zum speichern des Modells. Danach kann ich nur laden Sie das Modell, um Vorhersagen machen direkt. Können Sie tun, eine ähnliche Sache

Fehler mit Sklearn Random Forest Regressor

Anzahl der Antworten 2 Antworten
Wenn Sie versuchen, um zu passen ein Random Forest Modell mit Regressor y-Daten, die wie folgt aussieht: [ 0.00000000e+00 1.36094276e+02 4.46608221e+03 8.72660888e+03 1.31375786e+04 1.73580193e+04 2.29420671e+04 3.12216341e+04 4.11395711e+04 5.07972062e+04 6.14904935e+04 7.34275322e+04 7.87333933e+04 8.46302456e+04 9.71074959e+04 1.07146672e+05 1.17187952e+05 1.26953374e+05 1.37736003e+05

Was bedeutet negativer % - IncMSE in RandomForest-Paket bedeuten?

Anzahl der Antworten 1 Antworten
Ich verwendet RandomForest für eine regression-problem. Ich verwendet importance(rf,type=1) um die %IncMSE für die Variablen und einer von Ihnen hat einen negativen %IncMSE. Bedeutet dies, dass diese variable ist schlecht für das Modell? Ich suchte im Internet

Was ist der Unterschied zwischen cross_val_score mit scoring='roc_auc' und roc_auc_score?

Anzahl der Antworten 3 Antworten
Ich bin verwirrt über den Unterschied zwischen der cross_val_score scoring-Metrik "roc_auc' und die roc_auc_score, dass kann ich einfach importieren und direkt aufrufen. In der Dokumentation (http://scikit-learn.org/stable/modules/model_evaluation.html#scoring-parameter) zeigt an, dass die Angabe scoring='roc_auc' verwenden die sklearn.Metriken.roc_auc_score. Wenn ich

Spark Multiclass Klassifizierung Beispiel

Anzahl der Antworten 2 Antworten
Tun Sie Jungs wissen, wo finde ich Beispiele für multiclass Klassifizierung Funken. Ich verbrachte viel Zeit mit der Suche in Büchern und im web, und so weit ich weiß nur, dass es möglich ist, da die neueste

Fehler bei der Verwendung von predict() auf eine randomForest Objekt trainiert mit caret-Zug() mit Formel

Anzahl der Antworten 4 Antworten
R 3.2.0 mit caret-6.0-41 und randomForest 4.6-10 auf einem 64-bit-Linux-Maschine. Wenn man versucht, die predict() Methode auf eine randomForest Objekt ausgebildet train() Funktion aus der caret Paket mit Hilfe einer Formel, die Funktion gibt einen Fehler zurück.

R randomForest für die Einstufung

Anzahl der Antworten 5 Antworten
Ich versuche zu tun, Klassifikation mit randomForest, aber ich bin immer wieder eine Fehlermeldung, für die es anscheinend keine offensichtliche Lösung (randomForest hat gut funktioniert für mich tun, regression in die Vergangenheit). Habe ich eingefügt, mein code

Unterschied zwischen varImp (caret-Zeichen) und Bedeutung (randomForest) für Random Forest

Anzahl der Antworten 4 Antworten
Verstehe ich nicht, was ist der Unterschied zwischen varImp Funktion (caret- Paket) und importance Funktion (randomForest- Paket) für ein Random Forest Modell: Ich berechnete eine einfache HF-classification-Modell und bei der Berechnung variable Bedeutung, ich fand, dass das

Probleme mit tuneGrid parameter in random forest

Anzahl der Antworten 2 Antworten
Habe ich Umgang mit einigen extrem unausgewogen Daten und ich würde gerne verwenden Sie geschichtete Stichproben angelegt, um mehr symmetrische random forests Gerade jetzt, ich bin mit dem caret-Paket, hauptsächlich für die Optimierung des random forests. Also

Variable Bedeutung mit ranger

Anzahl der Antworten 3 Antworten
Trainierte ich ein random forest mit caret + ranger. fit <- train( y ~ x1 + x2 ,data = total_set ,method = "ranger" ,trControl = trainControl(method="cv", number = 5, allowParallel = TRUE, verbose = TRUE) ,tuneGrid =

Proximity Matrix - Random Forest , R

Anzahl der Antworten 3 Antworten
Ich bin mit dem randomForest-Paket in R, die es erlaubt, die Berechnung der proximity-matrix (P). In der Beschreibung des Pakets beschreibt die parameter ein, wie: ", wenn Nähe=TRUE, wenn randomForest aufgerufen wird, wird eine matrix der räumlichen

Hab kontinuierliche wird nicht unterstützt Fehler in RandomForestRegressor

Anzahl der Antworten 2 Antworten
Ich versuche nur zu tun, eine einfache RandomForestRegressor Beispiel. Aber beim testen der Genauigkeit bekomme ich diesen Fehler /Users/noppanit/anaconda/lib/python2.7/site-packages/sklearn/metrics/classification.pyc in accuracy_score(y_true, y_pred, normalisieren, sample_weight) 177 178 # Compute Genauigkeit für jede mögliche Darstellung --> 179 y_type, y_true,

Scikit Lernen Random forest Klassifikator: Wie entsteht ein plot der OOB-Fehler gegen die Zahl der Bäume

Anzahl der Antworten 1 Antworten
Edit 2: Es ist jetzt ein schönes Beispiel in der sklearn Dokumentation. Um zu sehen, wie viele Bäume notwendig sind, in meinem Wald, ich möchte plot der OOB Fehler als die Anzahl der Bäume im Wald ist

matplotlib: Plot-Funktion Bedeutung mit dem feature-Namen

Anzahl der Antworten 2 Antworten
In R gibt es vorgefertigte Funktionen, die zur plot-Funktion Bedeutung der Random-Forest-Modell. Aber in python eine solche Methode scheint zu fehlen. Ich Suche nach einer Methode, die in matplotlib. model.feature_importances gibt mir folgende: array([ 2.32421835e-03, 7.21472336e-04, 2.70491223e-03,

Holen Sie sich die Genauigkeit eines random forest in R

Anzahl der Antworten 1 Antworten
Habe ich eine random forest aus meine Daten: fit=randomForest(churn~., data=data_churn[3:17], ntree=1, importance=TRUE, proximity=TRUE) Ich kann leicht sehen, meine confusion matrix: conf <- fit$confusion > conf No Yes class.error No 945 80 0.07804878 Yes 84 101 0.45405405 Nun

Legende für die Random Forest-Plot in R

Anzahl der Antworten 2 Antworten
Habe ich einen random forest prediction Modell in R mit der Funktion randomForest: model = randomForest(classification ~., data=train, ntree=100, proximity=T) Weiter habe ich gezeichnet das Modell, um die Allgemeinen Fehler des Modells: plot(model, log="y") Das gibt mir

Fehler in der Ausführung randomForest : Objekt nicht gefunden

Anzahl der Antworten 2 Antworten
So, ich bin versucht zu passen, ein random forest Klassifikator für mein dataset. Ich bin sehr neu in R und ich denke, das ist eine einfache Formatierung der Ausgabe. Lese ich in einem text-Datei und wandeln meinen

Random Forest-Funktion Bedeutung Grafik mit Python

Anzahl der Antworten 6 Antworten
Arbeite ich mit RandomForestRegressor in python und ich möchte ein Diagramm erstellen, zeigen die ranking-Funktion Bedeutung. Dies ist der code, den ich verwendet: from sklearn.ensemble import RandomForestRegressor MT= pd.read_csv("MT_reduced.csv") df = MT.reset_index(drop = False) columns2 = df.columns.tolist()

ROC-Kurve zur Klassifikation von randomForest

Anzahl der Antworten 1 Antworten
Ich bin mit randomForest - Paket in R Plattform für die Einstufung Aufgabe. rf_object<-randomForest(data_matrix, label_factor, cutoff=c(k,1-k)) wobei k reicht von 0,1 bis 0,9. pred <- predict(rf_object,test_data_matrix) Habe ich die Ausgabe von dem random forest Klassifikator und ich

Wie die Berechnung der ROC und AUC unter der ROC nach dem training mit caret-Zeichen in R?

Anzahl der Antworten 1 Antworten
Habe ich verwendet caret Paket ist train - Funktion mit 10-fold cross validation. Ich habe auch mit Klasse Wahrscheinlichkeiten für die vorhergesagten Klassen durch Einstellung classProbs = TRUE im trControl wie folgt: myTrainingControl <- trainControl(method = "cv",

Random Forest mit GridSearchCV - Fehler, die auf param_grid

Anzahl der Antworten 2 Antworten
Ich versuche zu erstellen, ein Random Forest Modell mit GridSearchCV aber bin immer ein Fehler in Bezug auf param_grid: "ValueError: Invalid parameter max_features für Schätzer Pipeline. Überprüfen Sie die Liste der verfügbaren Parameter mit ` - Schätzer.get_params().keys()".

Verwendung von randomforest() für die Einstufung in R?

Anzahl der Antworten 2 Antworten
Ursprünglich hatte ich einen Daten-frame besteht aus 12 Spalten, die in N Zeilen. Die Letzte Spalte meiner Klasse (0 oder 1). Ich hatte meine konvertieren gesamte Daten-frame zu nummerischen mit training <- sapply(training.temp,as.numeric) Aber dann dachte ich,

Wie funktioniert sklearn random forest index feature_importances_

Anzahl der Antworten 3 Antworten
Habe ich die RandomForestClassifier in sklearn für die Bestimmung der wichtigsten Funktionen in meinem dataset. Wie bin ich in der Lage, zurückzukehren, die eigentliche feature-Namen (meine Variablen sind mit x1, x2, x3, etc.) eher als relative Namen

Random forest auf einem großen dataset

Anzahl der Antworten 2 Antworten
Ich habe einen großen Datensatz in R (1M+ Zeilen und 6 Spalten), die ich verwenden möchten, für die Ausbildung einer random forest (mit der randomForest - Paket) für die regression Zwecke. Leider bekomme ich einen Error in

R gibt es einen Weg zu finden, Inf/-Inf-Werte?

Anzahl der Antworten 5 Antworten
Ich versuche zu laufen, eine randomForest auf ein large-ish-Daten-set (5000x300). Leider bin ich immer eine Fehlermeldung wie folgt: > RF <- randomForest(prePrior1, postPrior1[,6] + ,,do.trace=TRUE,importance=TRUE,ntree=100,,forest=TRUE) Error in randomForest.default(prePrior1, postPrior1[, 6], , do.trace = TRUE, : NA/NaN/Inf in

Mit der predict_proba () - Funktion von RandomForestClassifier in das sichere und richtige Weg

Anzahl der Antworten 2 Antworten
Ich bin mit Scikit-learn anwenden machine-learning-Algorithmus auf meine datasets. Manchmal muss ich die Wahrscheinlichkeiten von Etiketten/Klassen stiftete der Bezeichnungen/Klassen selbst. Anstatt Spam/Nicht-Spam als Etiketten von E-Mails, ich möchte nur zum Beispiel: 0.78 Wahrscheinlichkeit einer bestimmten E-Mail ist

Wie beseitigen "NA/NaN/Inf in foreign function call (arg 7)" running Vorhersagen mit randomForest

Anzahl der Antworten 2 Antworten
Ich habe recherchiert diese umfassend, ohne eine Lösung zu finden. Ich hab meine Daten wie folgt festgelegt: library("raster") impute.mean <- function(x) replace(x, is.na(x) | is.nan(x) | is.infinite(x) , mean(x, na.rm = TRUE)) losses <- apply(losses, 2, impute.mean)

Was bedeutet "sample_weight" do-der Weg, ein `DecisionTreeClassifier " funktioniert in der sklearn?

Anzahl der Antworten 2 Antworten
Gelesen habe ich von diese Dokumentation: "Class balancing getan werden kann, durch Stichproben die gleiche Anzahl von Proben aus jeder Klasse, oder vorzugsweise durch die Normalisierung der Summe der Stichprobe zu gewichten (sample_weight) für jede Klasse den

Variable Bedeutung mithilfe des caret-Paket (Fehler); RandomForest-Algorithmus

Anzahl der Antworten 2 Antworten
Ich versuche zu erhalten, die variable, wie wichtig ein rf-Modell in keiner Weise. Dies ist der Ansatz, den ich bisher ausprobiert habe, aber Alternative Vorschläge sind sehr willkommen. Ich ausgebildet haben, ein Modell in R: require(caret) require(randomForest)

PySpark & MLLib: Random Forest-Funktion Wichtigkeiten

Anzahl der Antworten 5 Antworten
Ich versuche zu extrahieren, die Funktion Wichtigkeiten eines random forest-Objekt habe ich geschult mit PySpark. Allerdings sehe ich nicht ein Beispiel dafür irgendwo in der Dokumentation, noch ist es eine Methode, RandomForestModel. Wie kann ich die extrahieren-Funktion

Wie zur Verbesserung der randomForest-Leistung?

Anzahl der Antworten 2 Antworten
Habe ich ein Trainings-set der Größe 38 MB (12 Attribute mit 420000 Zeilen). Ich bin mit den unten R - snippet, um das Modell zu trainieren mit randomForest. Das dauert Stunden für mich. rf.model <- randomForest( Weekly_Sales~.,

Numpy-Array-Get Zeile, die index-Suche durch eine Reihe

Anzahl der Antworten 1 Antworten
Ich bin neu in numpy und ich die Umsetzung clustering der mit random forest in python. Meine Frage ist: Wie könnte ich den index der die genaue Zeile in ein array? Zum Beispiel [[ 0. 5. 2.]

Random Forest mit Klassen, die sind sehr unausgewogen

Anzahl der Antworten 4 Antworten
Ich bin mit random forests in einer big-data-problem, die hat einen sehr unausgewogenen Frequenzgang Klasse, so dass ich die Dokumentation gelesen und ich fand die folgenden Parameter: strata sampsize Die Dokumentation für diese Parameter ist spärlich (oder

Wie löse ich overfitting in random forest von Python sklearn?

Anzahl der Antworten 1 Antworten
Ich bin mit RandomForestClassifier in python implementiert sklearn Paket zu bauen, eine binäre Klassifikation-Modell. Das ist unten die Ergebnisse der cross-Validierungen: Fold 1 : Train: 164 Test: 40 Train Accuracy: 0.914634146341 Test Accuracy: 0.55 Fold 2 :

Wie kann ich die Zeile.names-Attribut, um die Reihenfolge der Zeilen meiner dataframe in R?

Anzahl der Antworten 7 Antworten
Erstellte ich ein random forest und vorausgesagt, dass die Klassen meiner test-set, mit dem Leben glücklich in einen dataframe: Zeile.Namen Klasse 564028 1 275747 1 601137 0 922930 1 481988 1 ... Den row.names Attribut sagt mir,

Zufällige Wälder in R (leere Klassen in y-argument-Modellen auferlegt 0)

Anzahl der Antworten 7 Antworten
Ich beschäftige mich zum ersten mal mit random forests und ich habe einige Probleme, die ich nicht herausfinden können.. Wenn ich die Analyse auf alle meinen Daten (über 3000 Zeilen) ich bekomme keine Fehlermeldung. Aber wenn ich

Wie zum ausführen von random forest/cross-Validierung im R

Anzahl der Antworten 3 Antworten
Ich bin nicht in der Lage zu finden, eine Art und Weise der Durchführung cross-validation auf einer random forest regression-Modell, die ich versuche zu produzieren. Also ich habe einen Datensatz mit 1664 erklärenden Variablen (mit unterschiedlichen chemischen

random forest tuning - Baum-Tiefe und Anzahl der Bäume

Anzahl der Antworten 2 Antworten
Ich habe grundsätzliche Frage zum tuning eines random forest Klassifikator. Gibt es eine Beziehung zwischen der Anzahl der Bäume und der Baum mit der Tiefe? Ist es notwendig, dass der Baum die Tiefe sollte kleiner sein als