Tag: machine-learning
Umsetzung Fragen über machine-learning-algorithmen. Allgemeine Fragen über maschinelles lernen sollte gebucht werden, um Ihre spezifischen Gemeinschaften.
6
Antworten
Ich bin neu in random forest Klassifikator. Ich benutze es zu klassifizieren, die einen Datensatz mit zwei Klassen. - Die Anzahl der features ist 512. - Der Anteil der Daten ist 1:4. I. e, 75% der Daten
1
Antworten
Gewusst wie: implementieren eine Tiefe autoencoder (eHow bekomme ich die Filter von convulutional neural network(CNN)? Meine Idee ist so etwas wie dies: random-Bilder von der input Bilder (28x28) und zufällige Flecken (8x8). Dann nutzen Sie autoencoders zu
1
Antworten
Nahm ich Beispielcode von sklearn website, die tuned_parameters = [{'kernel': ['rbf'], 'gamma': [1e-3, 1e-4], 'C': [1, 10, 100, 1000]}, {'kernel': ['linear'], 'C': [1, 10, 100, 1000]}] scores = [('f1', f1_score)] for score_name, score_func in scores: print "#
1
Antworten
Apache Apex - ist ein open-source-enterprise-grade unified stream-und batch-processing-Plattform. Es wird verwendet bei GE-Predix-Plattform für das Internet der Dinge. Was sind die wichtigsten Unterschiede zwischen diesen 2 Plattformen? Fragen Daten aus einer wissenschaftlichen Perspektive, wie unterscheidet es
1
Antworten
Diese Frage existiert als github issue , zu. Ich möchte bauen ein neuronales Netzwerk in Keras, die enthält sowohl die 2D-Faltung und eine LSTM-Schicht. Sollte das Netzwerk klassifizieren MNIST. Die Trainingsdaten in MNIST sind 60000 Graustufen-Bilder von
3
Antworten
In R nach der Ausführung von "random forest" - Modell, die ich verwenden kann save.image("***.RData") zum speichern des Modells. Danach kann ich nur laden Sie das Modell, um Vorhersagen machen direkt. Können Sie tun, eine ähnliche Sache
6
Antworten
Ich erhalte die folgende Fehlermeldung c50-code genannt Ausgang mit dem Wert 1 Ich Tue dies auf der titanic verfügbaren Daten von Kaggle # Importing datasets train <- read.csv("train.csv", sep=",") # this is the structure str(train) Ausgabe :-
2
Antworten
Ich habe Folgendes problem und dachte ich könnte mit der Maschine lernen, aber ich bin mir nicht ganz sicher, es funktioniert für meinen Gebrauch Fall. Ich habe einen Datensatz von rund hundert Millionen Datensätzen, die Daten des
2
Antworten
Was ist der beste Ansatz? Was sind die algorithmen, die benutzt werden? Was sind Ihre stärken und Schwächen? Warum aktuelle Film-recommender-Systeme Versagen bei der Bereitstellung von gute Empfehlungen? wahrscheinlich webmasters.stackexchange.com ist der bessere Ort für diese Antwort
2
Antworten
Ich verwendet ffnew Funktionen viele Male, aber wenn ich versuche zum erstellen einer einfachen feed-forward-Netzwerk, so dass der input Vektor ist P=[1;2;3;4] und die gewünschte Ausgabe T=[1 ;0;0;1]. Also ich habe nur eine Beispiel-input-Vektor Den code net
1
Antworten
Haben wir zum Maßstab-input-Daten für das neuronale Netz? Wie beeinflusst das die endgültige Lösung des neuronalen Netzes? Ich habe versucht zu finden einige zuverlässige Quellen auf, die. Das Buch "elements of statistical learning" (Seite 400) sagt, es
4
Antworten
Ich bin mit scikit zur Durchführung einer logistischen regression auf spam - /ham-Daten. X_train ist meine Trainings-Daten und y_train die Etiketten('spam' oder 'ham') und ich trainierte mein LogisticRegression diese Weise: classifier = LogisticRegression() classifier.fit(X_train, y_train) Wenn ich
5
Antworten
scheint diese Frage gebeten worden war, bevor, aber ich kann nicht scheinen, um einen Kommentar für eine weitere Klärung auf die akzeptierte Antwort, und ich konnte nicht herausfinden, die Lösung bereitgestellt. Ich versuche zu lernen, wie sklearn
3
Antworten
Ich brauche, um zu berechnen, Informationen Gewinnen erreicht souverän für >100 K-Funktionen >10k Dokumente für text-Klassifikation. Der Code unten funktioniert einwandfrei, aber für den vollen Datenbestand ist sehr langsam - dauert mehr als eine Stunde auf einem
3
Antworten
Wie Sie vielleicht wissen, viele Dinge geändert, in der OpenCV-3 (im Vergleich zur openCV2 oder die alte erste version). In den alten Tagen, Zug SVM, würde man verwenden: CvSVMParams params; params.svm_type = CvSVM::C_SVC; params.kernel_type = CvSVM::POLY; params.gamma
2
Antworten
Wenn Sie versuchen, um zu passen ein Random Forest Modell mit Regressor y-Daten, die wie folgt aussieht: [ 0.00000000e+00 1.36094276e+02 4.46608221e+03 8.72660888e+03 1.31375786e+04 1.73580193e+04 2.29420671e+04 3.12216341e+04 4.11395711e+04 5.07972062e+04 6.14904935e+04 7.34275322e+04 7.87333933e+04 8.46302456e+04 9.71074959e+04 1.07146672e+05 1.17187952e+05 1.26953374e+05 1.37736003e+05
1
Antworten
Was genau macht der LogisticRegression.predict_proba Funktion zurückgeben? In meinem Beispiel bekomme ich ein Ergebnis wie dieses: [[ 4.65761066e-03 9.95342389e-01] [ 9.75851270e-01 2.41487300e-02] [ 9.99983374e-01 1.66258341e-05]] Aus anderen Berechnungen, die Verwendung der sigmoid-Funktion, ich weiß, dass in der
4
Antworten
Möchte ich nutzen, scikit-learn an einem bevorstehenden Projekt und ich kann absolut nicht installieren. Ich kann andere Pakete mit installieren, entweder indem Sie von der Quelle oder durch pip-ohne ein problem. Für scikit-learn, habe ich versucht, Klonen
3
Antworten
Ich dachte, zu versuchen, wählen Sie " hyper-Parameter (wie Regulation zum Beispiel) mit Kreuz-Validierung oder vielleicht Zug mehrere Initialisierungen der Modelle und wählen Sie dann das Modell mit der höchsten cross validation accuracy. Umsetzung k-fache oder CV
2
Antworten
Was ist der Unterschied zwischen einem Bayes ' schen Netzwerk und einem Naive Bayes-Klassifikator? Ich bemerkte nur implementiert in Matlab als classify die andere hat eine gesamte Netto-toolbox. Wenn könnten Sie erklären in Ihrer Antwort, die eine
6
Antworten
Ich habe versucht, zu verwenden tensorflow für zwei Tage jetzt installieren und neu installieren, es immer und immer wieder auf python2.7 und 3.4. Egal was ich mache, ich bekomme diese Fehlermeldung, wenn Sie versuchen, zu verwenden tensorflow.Platzhalter()
7
Antworten
Habe ich eine Reihe von dataframes, wo eine der Spalten enthält einen kategorischen Variablen. Ich möchte konvertieren, um mehrere dummy-Variablen, in dem Fall würde ich normalerweise verwenden get_dummies. Was passiert, ist, dass get_dummies schaut auf die Daten,
2
Antworten
Lernen erleichtern, implementierte ich eine simple neural network framework unterstützt nur multi-layer-perceptrons und einfache RÜCKFÜHRUNG. Es funktioniert okay-ish für lineare Klassifikation, und die üblichen XOR-problem, aber für die Sinus-Funktion Näherung sind die Ergebnisse nicht befriedigend. Ich bin
2
Antworten
Aus meiner Forschung, fand ich drei widersprüchliche Ergebnisse: SVC(kernel="linear") ist besser LinearSVC ist besser Egal Kann mir jemand erklären, Wann LinearSVC vs. SVC(kernel="linear")? Wie es scheint, LinearSVC ist geringfügig besser als SVC und ist in der Regel
5
Antworten
Versuche ich zu testen, mein Modell mit dem neuen Datensatz. Ich habe das gleiche getan preprocessing-Schritt wie ich getan habe für den Bau meines Modells. Ich habe im Vergleich zwei Dateien, aber es gibt keine Probleme. Ich
4
Antworten
Ich habe eine Tabelle mit Daten ("norm"), numerische - zumindest was ich sehen kann - normalisierten Werte der folgenden form: Wenn ich ausführen k <- kmeans(norm,center=3) Ich bin receving die folgende Fehlermeldung: Error in do_one(nmeth) : NA/NaN/Inf
0
Antworten
Ich versuche zu lernen, über Baum-Welch-Algorithmus(zur Verwendung mit einem hidden markov Modell). Ich verstehe die grundlegende Theorie der forward-backward-Modelle, aber es wäre schön, für jemanden zu helfen, zu erklären, es mit dem code(ich finde es einfacher zu
6
Antworten
Ich versuche, einen Agenten zu lernen, die Maus-Bewegungen notwendig, um am besten führen Sie eine bestimmte Aufgabe in einem reinforcement learning-Einstellung (D. H. die Belohnung signal ist das einzige feedback für das lernen). Ich bin der Hoffnung,
2
Antworten
Habe ich mich schon gefragt, der wirkliche Unterschied zwischen Segmentierung und Klassifizierung. Klassifizierung anhand der Entscheidungsbaum-Algorithmus hat keinen Unterschied von der Segmentierung? Durch die Segmentierung meinst du Sachen wie Bild-Segmentierung? Zug ist das beste Beispiel für die
1
Antworten
Arbeite ich mit libsvm und ich muss implementieren die Einstufung für multiclasses mit einer gegen alle. Wie kann ich es tun? Tut libsvm version 2011 nutzen das? Ich denke, dass meine Frage nicht ganz klar. wenn libsvm
3
Antworten
Ich arbeite derzeit an einem Projekt wo ich habe zum extrahieren der Gesichtsausdruck eines Benutzers (nur ein Benutzer gleichzeitig von einer webcam), wie traurig oder glücklich. Meine Methode für die Klassifizierung von Gesichtsausdrücken ist: Verwenden opencv, um
5
Antworten
Ich habe einen matrice Einer(369x10), was ich will-cluster 19-Cluster. Ich benutze diese Methode [idx ctrs]=kmeans(A,19) ergibt idx(369x1) und Klickraten(19x10) Bekomme ich den Punkt, bis auf hier.Alle meine Zeilen in A Cluster 19 Cluster. Nun habe ich ein
4
Antworten
Ich arbeite gerade an einem text classification task. Jetzt will ich mit ensemble.AdaBoostClassifier mit LinearSVC als base_estimator. Jedoch, wenn ich versuche den code auszuführen clf = AdaBoostClassifier(svm.LinearSVC(),n_estimators=50, learning_rate=1.0, algorithm='SAMME.R') clf.fit(X, y) Ist ein Fehler aufgetreten. TypeError: AdaBoostClassifier
2
Antworten
Ich würde gerne Vektorisieren mit scikit lernen Sie eine Liste, die hat Listen. Ich gehe zu dem Pfad, wo ich die Ausbildung Texte lese ich Sie und dann besorge ich etwas wie dieses: corpus = [["this is
4
Antworten
Habe ich mit der ada - R-Paket für eine Weile, und vor kurzem caret. Laut der Dokumentation caret's train() Funktion haben sollte, eine option, die verwendet ada. Aber, caret-Zeichen ist kotzen mich an wenn ich mit der
2
Antworten
Ich versuche zu lernen scikit-learn - und Machine-Learning durch die Nutzung der Boston Housing Daten. # I splitted the initial dataset ('housing_X' and 'housing_y') from sklearn.cross_validation import train_test_split X_train, X_test, y_train, y_test = train_test_split(housing_X, housing_y, test_size=0.25, random_state=33)
2
Antworten
Wie kann ich berechnen, in python die Cumulative Distribution Function (CDF)? Will ich es berechnet aus einem array von Punkten, die ich habe (diskrete Verteilung), nicht mit der kontinuierlichen Verteilungen, die zum Beispiel scipy hat. Wie wärs
1
Antworten
Wenn ich so etwas wie import numpy from sklearn import linear_model A= #something b= #something clf=linear_model.Lasso(alpha=0.015, fit_intercept=False, tol=0.00000000000001, max_iter=10000000000000, positive=True) clf.fit(A,b) Bekomme ich die Fehlermeldung: usr/local/lib/python2.7/dist-packages/scikit_learn-0.14.1-py2.7-linux-x86_64.egg/ sklearn/linear_model/coordinate_descent.py:418: UserWarning: Objective did not converge. You might want to increase
3
Antworten
Ich Las verschiedene Dokumente, wie CRF(conditional random field) funktioniert, aber alle Papiere stellt die Formel nur. Ist es ein wer kann senden Sie mir ein Papier, das beschreibt, über CRF mit Beispielen wie wenn wir einen Satz
3
Antworten
Ich bin verwirrt über den Unterschied zwischen der cross_val_score scoring-Metrik "roc_auc' und die roc_auc_score, dass kann ich einfach importieren und direkt aufrufen. In der Dokumentation (http://scikit-learn.org/stable/modules/model_evaluation.html#scoring-parameter) zeigt an, dass die Angabe scoring='roc_auc' verwenden die sklearn.Metriken.roc_auc_score. Wenn ich
2
Antworten
Ich trainiert habe und erstellt eine J48-Modell mit WEKA-gui. Ich speicherte die Modell-Datei auf meinem Rechner und jetzt möchte ich es verwenden, um zu klassifizieren, eine einzelne Instanz, in meinem Java-code. Ich würde gerne eine Vorhersage für
3
Antworten
Gibt es eine Möglichkeit, vorherzusagen, wie lange es dauern wird, führen Sie einen Klassifizierer von sci-kit lernen Sie, basierend auf den Parametern und datasets? Ich weiß, ziemlich meta, richtig? Einige Klassifikatoren/parameter-Kombinationen sind Recht schnell, und manche nehmen
2
Antworten
Habe ich nur gebaut, mein erstes Modell mit Keras und das ist die Ausgabe. Es sieht aus wie die standard-Ausgabe, die Sie erhalten, nachdem der Bau Keras künstlichen neuronalen Netzes. Auch nach einem Blick in die Dokumentation,
3
Antworten
Ich habe die Kodierung für ein paar Jahre, aber ich noch nicht dazu gekommen die hängen von pseudo-Code oder tatsächlich mit dem Gedanken, die Sachen im code noch. Wegen diesem problem, ich habe Schwierigkeiten, herauszufinden, genau, was
17
Antworten
Sagen wir, ich habe ein 1d-numpy-array a = array([1,0,3]) Möchte ich zum codieren dieses als 2d-1-hot-array b = array([[0,1,0,0], [1,0,0,0], [0,0,0,1]]) Gibt es einen schnellen Weg, dies zu tun? Schneller als einfach nur Durchlaufen a zu legen
7
Antworten
Ich war einen Blick auf das Convolutional Neural Network von CS231n Convolutional Neural Networks for Visual Recognition. In Convolutional Neural Network, das sind die Neuronen angeordnet in 3 Dimensionen(height, width, depth). Ich habe ein Problem mit der
5
Antworten
Ich bin mit sklearn auf Python zu tun, einige clustering. Ich habe trainiert als 200.000 Daten, und der code unten funktioniert gut. corpus = open("token_from_xml.txt") vectorizer = CountVectorizer(decode_error="replace") transformer = TfidfTransformer() tfidf = transformer.fit_transform(vectorizer.fit_transform(corpus)) km = KMeans(30)
4
Antworten
Die Situation: Frage ich mich, wie zu verwenden TensorFlow optimal, wenn meine Trainingsdaten ist unausgewogen in der label distribution zwischen 2 Etiketten. Nehmen wir zum Beispiel an die MNIST-tutorial ist vereinfacht, um nur unterscheiden zwischen 1 und
3
Antworten
Nehmen wir an, wir erhalten eine Trainings-dataset {yᵢ, xᵢ} für i = 1, ..., n, wo yᵢ kann entweder -1 oder 1 und xᵢ kann es sich z.B. um ein 2D-oder 3D-Punkt. Im Allgemeinen, wenn die Eingabe
1
Antworten
Ich habe einen Datensatz der wie folgt aussieht: data.flu <- data.frame(chills = c(1,1,1,0,0,0,0,1), runnyNose = c(0,1,0,1,0,1,1,1), headache = c("M", "N", "S", "M", "N", "S", "S", "M"), fever = c(1,0,1,1,0,1,0,1), flu = c(0,1,1,1,0,1,0,1) ) > data.flu chills runnyNose