Tag: cross-validation

Cross-Validation ist eine Methode der Bewertung und der Vergleich der prädiktiven Systemen in der Statistik und dem maschinellen lernen.

Wechseln Sie zwischen den Daten zu libsvm-format zu übergeben grid.py in libsvm

2 Antworten

Ich bin neu in python und ich bin versucht, libsvm. Ich bin versucht zu tun, cross-Validierung mit Hilfe von grid.py. Ich bekomme meine Daten aus einer Datenbank, damit Ihr nicht in spärlicher form. Gibt es eine Möglichkeit,

Berechnen Sie die cross-Validierung für das Verallgemeinerte Lineare Modell in Matlab

1 Antworten

Mache ich eine regression mit Verallgemeinerten Linearen Modell.Ich bin gefangen offguard mit der crossVal Funktion. Meine Implementierung so weit; x = 'Some dataset, containing the input and the output' X = x(:,1:7); Y = x(:,8); cvpart =

cross-validation glm machine-learning matlab regression

Rückkehr Koeffizienten von Pipeline-Objekt in sklearn

3 Antworten

Habe ich Passform eine Pipeline Objekt mit RandomizedSearchCV pipe_sgd = Pipeline([('scl', StandardScaler()), ('clf', SGDClassifier(n_jobs=-1))]) param_dist_sgd = {'clf__loss': ['log'], 'clf__penalty': [None, 'l1', 'l2', 'elasticnet'], 'clf__alpha': np.linspace(0.15, 0.35), 'clf__n_iter': [3, 5, 7]} sgd_randomized_pipe = RandomizedSearchCV(estimator = pipe_sgd, param_distributions=param_dist_sgd, cv=3,

cross-validation pipeline python scikit-learn

So passen Sie sklearn cross validation iterator durch Indizes?

2 Antworten

Ähnlich Custom cross validation split sklearn ich definieren will meine eigenen splits für GridSearchCV, für die ich mich anpassen zu müssen, die eingebaute cross-Validierung iterator. Ich will meinen eigenen Zug-test Indizes für die cross-Validierung, um die GridSearch

cross-validation python scikit-learn validation

Legen Sie benutzerdefinierte Funktionen in Sklearn pipeline

1 Antworten

In meinem Klassifikationsschema, gibt es mehrere Schritte, einschließlich: SCHLUG (Synthetische Minderheit Über-sampling-Technik) Fisher Kriterien für die Funktionsauswahl Standardisierung (Z-score Normalisierung) SVC (Support Vector Classifier) Die wichtigsten Parameter abgestimmt werden, im Schema oben sind die % - Perzentil

cross-validation feature-selection machine-learning pipeline scikit-learn

So erhalten Sie das cross-validierte r-Quadrat von linearen Modells in R?

3 Antworten

Habe ich ein lineares Modell, in R. set.seed(1234) x <- rnorm(100) z <- rnorm(100) y <- rnorm(100, x+z) mydata <- data.frame(x,y,z) fit <- lm(y ~ x + z, mydata) Ich würde gerne um eine Schätzung zu erhalten,

cross-validation linear-regression r

Tut TensorFlow haben Kreuzvalidierung implementiert für seine Nutzer?

3 Antworten

Ich dachte, zu versuchen, wählen Sie " hyper-Parameter (wie Regulation zum Beispiel) mit Kreuz-Validierung oder vielleicht Zug mehrere Initialisierungen der Modelle und wählen Sie dann das Modell mit der höchsten cross validation accuracy. Umsetzung k-fache oder CV

cross-validation machine-learning python scikit-learn tensorflow

Was ist der Unterschied zwischen cross_val_score mit scoring='roc_auc' und roc_auc_score?

3 Antworten

Ich bin verwirrt über den Unterschied zwischen der cross_val_score scoring-Metrik "roc_auc' und die roc_auc_score, dass kann ich einfach importieren und direkt aufrufen. In der Dokumentation (http://scikit-learn.org/stable/modules/model_evaluation.html#scoring-parameter) zeigt an, dass die Angabe scoring='roc_auc' verwenden die sklearn.Metriken.roc_auc_score. Wenn ich

cross-validation machine-learning python random-forest scikit-learn

Erstellen Falten für k-fold CV in R mit Zirkumflex

2 Antworten

Ich versuche zu machen ein k-fold CV für mehrere Klassifikationsverfahren/hiperparameters mit den zur Verfügung stehenden Daten bei http://archive.ics.uci.edu/ml/machine-learning-databases/undocumented/connectionist-bench/sonar/sonar.all-data. Dieses set besteht aus 208 Zeilen, die jeweils mit 60 Parametern. Ich lese es in eine Daten.Rahmen mit dem

cross-validation r r-caret

Die Kombination von Grid-search-und cross-Validierung in scikit lernen

1 Antworten

Zur Verbesserung der Support-Vector-Machine-Ergebnisse habe ich Netz Suche für die Suche nach besseren Parametern und cross-Validierung. Ich bin mir nicht sicher, wie Sie Sie kombinieren Sie in scikit-learn. Raster Suche die besten Parameter (http://scikit-learn.org/stable/modules/grid_search.html) und Kreuzvalidierung vermeiden

cross-validation python scikit-learn svm

Unterschied zwischen der Verwendung train_test_split und cross_val_score in sklearn.cross_validation

1 Antworten

Ich habe eine matrix mit 20 Spalten. Die Letzte Spalte 0/1 labels. Den link zu den Daten ist hier. Ich versuche zu laufen random forest auf das dataset, mit cross validation. Ich verwende zwei Methoden, dies zu

cross-validation python scikit-learn

Was ist der Unterschied zwischen Kreuz-Validierung und der grid-search?

5 Antworten

In einfachen Worten, was ist der Unterschied zwischen Kreuz-Validierung und der grid-search? Wie funktioniert der grid-search arbeiten? Sollte ich zuerst tun eine cross-validation und dann eine Netz Suche? InformationsquelleAutor Linda | 2013-10-12

cross-validation definition difference grid-search

Wie zu extrahieren Modell hyper-Parameter von spark.ml in PySpark?

6 Antworten

Bin ich basteln mit einigen cross-Validierung code aus dem PySpark Dokumentation, und zu versuchen, PySpark, um mir zu sagen, welches Modell gewählt wurde: from pyspark.ml.classification import LogisticRegression from pyspark.ml.evaluation import BinaryClassificationEvaluator from pyspark.mllib.linalg import Vectors from pyspark.ml.tuning

apache-spark-ml apache-spark-mllib cross-validation modeling pyspark

Bewertung der Logistischen regression mit cross-Validierung

1 Antworten

Möchte ich verwenden, cross-Validierung, test - /Zug meinen Daten und bewerten Sie die Leistung der logistischen regression über den gesamten Datensatz und nicht nur auf dem test-set (z.B. 25%). Diese Begriffe sind mir völlig neu und bin

cross-validation logistic-regression python scikit-learn

Modul 'sklearn' hat kein Attribut 'cross_validation'

4 Antworten

Ich versuche zu splitten, mein dataset in Trainings-und Test-Datensatz sein, aber ich bin immer diese Fehlermeldung: X_train,X_test,Y_train,Y_test = sklearn.cross_validation.train_test_split(X,df1['ENTRIESn_hourly']) AttributeError Traceback (most recent call last) <ipython-input-53-5445dab94861> in <module>() ----> 1 X_train,X_test,Y_train,Y_test = sklearn.cross_validation.train_test_split(X,df1['ENTRIESn_hourly']) AttributeError: module 'sklearn' has

cross-validation python scikit-learn

Unterschied zwischen cross_val_score und cross_val_predict

2 Antworten

Möchte ich zur Bewertung einer regression Modell erstellen, mit scikitlearn mit der Kreuzvalidierung und immer verwirrt, welche der beiden Funktionen cross_val_score und cross_val_predict ich verwenden soll. Eine Möglichkeit wäre : cvs = DecisionTreeRegressor(max_depth = depth) scores =

cross-validation machine-learning python regression scikit-learn

MATLAB: 10-Fach-Kreuzvalidierung ohne Verwendung von vorhandenen Funktionen

2 Antworten

Ich habe eine matrix (ich denke, in MatLab-Sie nennen es eine struct) oder Daten-Struktur: data: [150x4 double] labels: [150x1 double] hier ist meine matrix.Daten aussieht, nehme ich das laden meiner Datei mit dem Namen der matrix: 5.1000

cross-validation machine-learning matlab

k-fold cross validation - wie bekommt man die Vorhersage automatisch?

2 Antworten

Dies kann eine dumme Frage sein, aber ich kann es einfach nicht finden, ein Paket, das zu tun...ich weiß, ich kann schreiben, einige der codes zu bekommen, was ich will, aber es wäre schön, eine Funktion, um

cross-validation r

XgBoost : Das am wenigsten besiedelte Klasse y hat nur 1 Mitglieder, die zu wenig ist

1 Antworten

Im mit Xgboost Umsetzung auf sklearn für eine kaggle-Wettbewerb. Aber im bekommen diese 'Warnung' Nachricht : $ python Script1.py /home/sky/private/virtualenv15.0.1 dev/myVE/local/lib/python2.7/site-packages/sklearn/cross_validation.py:516: Warnung: Das am wenigsten besiedelte Klasse y hat nur 1 Mitglieder, was zu wenig ist. Die

cross-validation python scikit-learn xgboost

GridSearchCV auf LogisticRegression in scikit-learn

2 Antworten

Ich versuche zur Optimierung eines logistischen Regressions-Funktion in scikit-learn mit Hilfe des cross-validiert raster-parameter zu suchen, aber ich kann nicht scheinen, um es zu implementieren. Er sagt, dass die Logistische Regression nicht implementieren eine get_params (), sondern

cross-validation logistic-regression machine-learning python scikit-learn

Split-tensor in Trainings-und test-sets

4 Antworten

Lassen Sie s sagen ich ' ve Lesen in eine Textdatei mit einem TextLineReader. Gibt es eine Möglichkeit, aufgeteilt in Zug-und test-sets im Tensorflow? So etwas wie: def read_my_file_format(filename_queue): reader = tf.TextLineReader() key, record_string = reader.read(filename_queue) raw_features,

cross-validation tensorflow training-data

Unterschied zwischen glmnet() und cv.glmnet() in R?

2 Antworten

Arbeite ich an einem Projekt, das zeigen würde, den potenziellen Einfluss einer Gruppe von Ereignissen auf ein Ergebnis. Ich bin mit dem glmnet () - Paket, speziell mit Hilfe der Poisson-Funktion. Hier ist mein code: # de

classification cross-validation glm glmnet r

Scikit F-score Metrische Fehler

2 Antworten

Ich versuche, vorherzusagen, eine Reihe von Etiketten mit Logistische Regression von SciKit. Meine Daten wirklich unausgewogen (es gibt viele weitere '0' als '1' - labels), so muss ich das F1-score metric während der cross-Validierung Schritt, um die

cross-validation logistic-regression machine-learning python scikit-learn

Klassifikation Tabelle für die Logistische regression in R

2 Antworten

Ich habe einen Datensatz, bestehend aus je dichotome variable (Y) und 12 unabhängige Variablen (X1 zu X12) gespeichert in einer csv-Datei. Hier sind die ersten 5 Zeilen der Daten: Y,X1,X2,X3,X4,X5,X6,X7,X8,X9,X10,X11,X12 0,9,3.86,111,126,14,13,1,7,7,0,M,46-50 1,7074,3.88,232,4654,143,349,2,27,18,6,M,25-30 1,5120,27.45,97,2924,298,324,3,56,21,0,M,31-35 1,18656,79.32,408,1648,303,8730,286,294,62,28,M,25-30 0,3869,21.23,260,2164,550,320,3,42,203,3,F,18-24 Konstruierte ich

cross-validation r

Unterschied zwischen StratifiedKFold und StratifiedShuffleSplit in sklearn

2 Antworten

Wie aus dem Titel Frage ich mich, was ist der Unterschied zwischen StratifiedKFold mit dem parameter shuffle = True StratifiedKFold(n_splits=10, shuffle=True, random_state=0) und StratifiedShuffleSplit StratifiedShuffleSplit(n_splits=10, test_size=’default’, train_size=None, random_state=0) und was ist der Vorteil der Verwendung StratifiedShuffleSplit Die

cross-validation python scikit-learn

Was bedeutet KFold in python genau tun?

1 Antworten

Ich freue mich auf dieses tutorial: https://www.dataquest.io/mission/74/getting-started-with-kaggle Hab ich Teil 9, Vorhersagen. Dort gibt es einige Daten in einem dataframe namens titanic, das ist dann aufgeteilt in Falten Verwendung: # Generate cross validation folds for the titanic

cross-validation kaggle python

Anwendung k-fold Cross-Validation-Modell mithilfe des caret-Paket

3 Antworten

Lassen Sie mich beginnen, indem ich sagte, ich habe viele Beiträge gelesen über die Cross-Validierung, und es scheint, gibt es viel Verwirrung gibt. Mein Verständnis, es ist einfach so: Durchführen k-fold Cross-Validation, d.h. 10 Falten zu verstehen,

cross-validation r r-caret rpart

cross-Validierung + decision trees in sklearn

1 Antworten

Versuch, erstellen Sie einen Entscheidungsbaum mit cross-Validierung mit sklearn und panads. Meine Frage ist in dem code unten, wird die Kreuzvalidierung teilt die Daten, die ich dann verwenden für training und Prüfung. Ich werde versuchen zu finden,

cross-validation decision-tree machine-learning

Wie ist scikit-learn cross_val_predict Genauigkeit score berechnet?

4 Antworten

Macht die cross_val_predict (siehe doc, v0.18) mit k-Falten-Methode, wie im code gezeigt unten Genauigkeit berechnen für jede Falte und Durchschnitt Sie endlich oder nicht? cv = KFold(len(labels), n_folds=20) clf = SVC() ypred = cross_val_predict(clf, td, labels, cv=cv)

cross-validation python scikit-learn

grundlegendes zu python-xgboost cv

4 Antworten

Ich würde gerne die xgboost cv-Funktion zu finden, die besten Parameter für meinen Trainings-Daten-set. Ich bin verwirrt durch die api. Wie finde ich die besten parameter? Ist dies ähnlich zu der sklearn grid_search cross-validation-Funktion? Wie kann ich

cross-validation python xgboost

Cross-Validierung ein WARENKORB-Modell

2 Antworten

In einer Zuordnung, sind wir aufgefordert, zu der Durchführung einer cross-Validierung auf ein WARENKORB-Modell. Ich habe versucht mit der cvFit Funktion von cvTools bekam aber eine komische Fehlermeldung. Hier ist ein minimal-Beispiel: library(rpart) library(cvTools) data(iris) cvFit(rpart(formula=Species~., data=iris))

cross-validation r rpart

Deprecation Warnungen von sklearn

2 Antworten

Ich bin mit cross_validation aus sklearn, from sklearn.cross_validation import train_test_split Ich bekomme die folgende Warnung: cross_validation.py:44: DeprecationWarning: Dieses Modul wurde als veraltet markiert in der version 0.18 Gunsten der model_selection Modul, in dem alle die umgestalteten Klassen

cross-validation scikit-learn

Wie die geteilten Daten auf einem ausgewogenen Trainings-set und test-set auf sklearn

4 Antworten

Ich bin mit sklearn für multi-Klassifizierung Aufgabe. Ich brauche split alldata in train_set und test_set. Ich will, dass der zufällig die gleiche sample-Anzahl pro Klasse. Eigentlich habe ich amüsant diese Funktion X_train, X_test, y_train, y_test = cross_validation.train_test_split(Data,

cross-validation machine-learning scikit-learn svm

Wie führen Sie k-fold cross validation mit tensorflow?

2 Antworten

Ich bin nach die IRIS Beispiel tensorflow. Meinem Fall jetzt habe ich alle Daten in einer einzigen CSV-Datei, nicht getrennt, und ich möchte die k-fold-cross-validation der Daten. Habe ich data_set = tf.contrib.learn.datasets.base.load_csv(filename="mydata.csv", target_dtype=np.int) Wie kann ich k-fold

cross-validation python tensorflow train-test-split

predict_proba für ein cross-Modell validiert

4 Antworten

Ich möchte, um vorherzusagen, die Wahrscheinlichkeit von Logistic Regression-Modell mit cross-Validierung. Ich weiß, Sie können Holen Sie sich die cross-Validierung erzielt, aber ist es möglich die Rückkehr der Werte aus predict_proba anstelle der Noten? # imports from

cross-validation logistic-regression scikit-learn

Cross-Validierung für das glm() Modelle

2 Antworten

Ich versuche zu tun, eine 10-fold-cross-validation für einige glm-Modelle, die ich gebaut habe früher in R. ich bin ein wenig verwirrt über die cv.glm() Funktion in der boot Paket, obwohl ich gelesen habe, viel Hilfe-Dateien. Wenn ich

cross-validation glm partitioning prediction r

Wie zum ausführen von random forest/cross-Validierung im R

3 Antworten

Ich bin nicht in der Lage zu finden, eine Art und Weise der Durchführung cross-validation auf einer random forest regression-Modell, die ich versuche zu produzieren. Also ich habe einen Datensatz mit 1664 erklärenden Variablen (mit unterschiedlichen chemischen

cross-validation r random-forest

scikit-learn-Kreuzvalidierung, negative Werte mit dem mittleren quadrierten Fehler

1 Antworten

Wenn ich den folgenden code mit Data-matrix - X Größe (952,144) und output Vektor y Größe (952), mean_squared_error Metrik gibt negative Werte, was ist unerwartet. Haben Sie eine Idee? from sklearn.svm import SVR from sklearn import cross_validation

cross-validation python regression scikit-learn

Wie die k-fold cross validation in scikit mit naive bayes-Klassifikator und NLTK

5 Antworten

Ich habe ein kleines corpus und ich möchte, um die Richtigkeit der Berechnung der naive Bayes-Klassifikator mit 10-fold cross validation, wie Sie es tun können. InformationsquelleAutor der Frage user2284345 | 2013-05-04

bayesian cross-validation nltk python scikit-learn

Wie man besten Schätzer auf GridSearchCV (Random Forest Classifier Scikit) erhalten

2 Antworten

Ich bin mit GridSearch Lebenslauf zu optimieren, den Parameter der Klassifikatoren in scikit. Sobald ich damit fertig bin, würde ich gerne wissen, welche Parameter gewählt wurden als die besten. Immer wenn ich, so bekomme ich einen AttributeError:

cross-validation python random-forest scikit-learn

Wie kann man das RandomForest Modell validieren?

2 Antworten

Möchte ich bewerten, ein random forest ausgebildet, auf einige Daten. Gibt es eine utility, die in Apache Spark, das gleiche zu tun oder habe ich zu erledigen-Kreuzvalidierung manuell? InformationsquelleAutor der Frage ashishsjsu | 2015-09-24

apache-spark apache-spark-ml apache-spark-mllib cross-validation random-forest

Topic-Modelle: Kreuzvalidierung mit Log-Wahrscheinlichkeit oder Perplexität

2 Antworten

Ich bin clustering von Dokumenten mit Thema Modellierung. Ich brauche zu kommen mit dem optimalen Thema zahlen. So, ich entschied mich für ten-fold cross validation mit Themen 10, 20, ...60. Ich teilte meinen Körper in zehn Chargen

cross-validation r tm topic-modeling

Kreuzvalidierung und Rastersuche

3 Antworten

Gibt es jemanden, der erklären kann mich in wirklich einfachen Worten, was ist der Unterschied zwischen cross-Validierung und grid-search? Wie funktioniert das und muss ich als erstes tun eine Kreuzvalidierung und dann eine Netz Suche? Meine Frage

classification cross-validation python scikit-learn