Tag: machine-learning

Umsetzung Fragen über machine-learning-algorithmen. Allgemeine Fragen über maschinelles lernen sollte gebucht werden, um Ihre spezifischen Gemeinschaften.

clustering von sehr großen Datensätzen in R

Anzahl der Antworten 3 Antworten
Ich habe einen Datensatz, bestehend aus 70.000 numerische Werte, die für Entfernungen im Bereich von 0 bis 50, und ich möchte cluster diese zahlen, jedoch, wenn ich versuche, die klassischen clustering-Ansatz, dann würde ich zum einrichten 70,000X70,000

Wie implementieren von mini-batch gradient descent in python?

Anzahl der Antworten 2 Antworten
Ich habe gerade angefangen zu lernen, tiefes lernen. Fand ich mich stecken, wenn es darum ging, Gradienten-Abstieg. Ich weiß, wie das umzusetzen, batch gradient descent. Ich weiß, wie es funktioniert so gut, wie die mini-batch-und stochastic gradient

Panda get_dummies vs. Sklearn ist OneHotEncoder() :: Was sind die vor-und Nachteile?

Anzahl der Antworten 2 Antworten
Lerne ich verschiedene Methoden zur Umwandlung von kategorischen Variablen zu Numerik für machine-learning Classifier. Ich kam über die pd.get_dummies Methode und sklearn.preprocessing.OneHotEncoder() und ich wollte sehen, wie Sie unterschieden sich in Bezug auf Leistung und Verwendung. Fand

Python : Wie finde ich die Genauigkeit Ergebnis in der SVM-Text Classifier-Algorithmus für Multilabel-Klasse

Anzahl der Antworten 1 Antworten
Benutzt habe ich folgenden code: Und ich brauche, um zu überprüfen, die Genauigkeit der X_train und X_test Der folgende code funktioniert für mich in meinem classification problem in multi-Label-Klasse import numpy as np from sklearn.pipeline import Pipeline

Besser text-Dokumenten-clustering als tf/idf-und Cosinus-ähnlichkeit?

Anzahl der Antworten 3 Antworten
Ich versuche, die cluster der Twitter-stream. Ich möchte jeden tweet zu einem cluster, dass reden über das gleiche Thema. Ich habe versucht, zu cluster-stream mit einem online-clustering-Algorithmus mit tf/idf-und Cosinus-ähnlichkeit, aber ich fand, dass die Ergebnisse sind

Python - Eingabe enthält NaN, infinity oder ein Wert zu groß für dtype('float64')

Anzahl der Antworten 3 Antworten
Ich bin neu bei Python. Ich bin versucht, sklearn.cluster. Hier ist mein code: from sklearn.cluster import MiniBatchKMeans kmeans=MiniBatchKMeans(n_clusters=2) kmeans.fit(df) Aber ich bekomme die folgende Fehlermeldung: 50 and not np.isfinite(X).all()): 51 raise ValueError("Input contains NaN, infinity" ---> 52

In Tensorflow, was ist der Unterschied zwischen sampled_softmax_loss und softmax_cross_entropy_with_logits

Anzahl der Antworten 2 Antworten
In tensorflow, gibt es Methoden genannt softmax_cross_entropy_with_logits und sampled_softmax_loss. Lese ich die tensorflow Dokument und suchte google nach mehr Informationen, aber ich konnte nicht finden Sie den Unterschied. Es sieht aus wie mir beide berechnet den Verlust

SVM vs. MLP (Neuronales Netz): Vergleich von Leistungs-und Vorhersage-Genauigkeit

Anzahl der Antworten 1 Antworten
Sollte ich entscheiden zwischen SVM und neuronale Netze für die Bild-Verarbeitung-Anwendung. Der Klassifikator muss schnell genug sein für near-real-time-Anwendung und Genauigkeit ist auch wichtig. Da dies eine medizinische Anwendung ist es wichtig, dass der Klassifikator hat die

Wie führen Sie die Vorhersage mit LDA (lineare DISKRIMINANZANALYSE) in scikit-learn?

Anzahl der Antworten 1 Antworten
Habe ich getestet, wie gut PCA und LDA arbeitet für die Klassifizierung von 3 verschiedenen Arten von image-tags möchte ich automatisch zu identifizieren. In meinem code, X ist meine Daten-matrix, wo jede Zeile werden die Pixel aus

Wie zu verwenden XGBoost Algorithmus für die regression in R?

Anzahl der Antworten 2 Antworten
Ich habe versucht die XGBoost Technik für die Vorhersage. Als meine abhängige variable ist kontinuierlich, ich machte die regression durch Verwendung XGBoost, aber die meisten der Referenzen, verfügbar in den verschiedenen portal sind für eine Einstufung. Obwohl

Wie um zu testen, tensorflow cifar10 cnn-tutorial Modell

Anzahl der Antworten 3 Antworten
Ich bin relativ neu in machine-learning und haben derzeit fast keine Erfahrung entwickeln. Also meine Frage ist: nach der Ausbildung und die Bewertung der cifar10 dataset aus der tensorflow tutorial ich Frage mich, wie kann man es

Was bedeutet clf bedeutet maschinelles lernen?

Anzahl der Antworten 2 Antworten
Tun, wenn passend, ich komme immer über code wie clf = svm.SVC(kernel='linear', C=1).fit(X_train, y_train) (aus http://scikit-learn.org/stable/modules/cross_validation.html#k-fold) Was bedeutet clf steht für? Ich googelte herum, aber er fand keine Anhaltspunkte. InformationsquelleAutor cqcn1991 | 2015-12-31

Wie man SVMs schön zu spielen mit fehlenden Daten in scikit-learn?

Anzahl der Antworten 2 Antworten
Ich bin mit scikit-learn für einige Daten-Analyse, und mein Datensatz hat einige fehlende Werte (vertreten durch NA). Ich lade die Daten in die mit genfromtxt mit dtype='f8' und gehen über die Ausbildung meiner classifier. Die Einstufung ist

Immer eine Große Liste von Substantiven (oder Adjektive) in Python NLTK; oder Python Mad Libs

Anzahl der Antworten 3 Antworten
Wie diese Frage, ich bin daran interessiert, eine große Liste von Wörtern, die von Wortart (eine lange Liste von Substantiven; eine Liste der Adjektive) verwendet werden programmgesteuert anderswo. Diese Antwort hat eine Lösung mit Hilfe der WordNet-Datenbank

Genauigkeit Punktzahl ValueError: nicht Verarbeiten Kann mischen von binären und kontinuierlichen soll

Anzahl der Antworten 7 Antworten
Ich bin mit linear_model.LinearRegression von scikit-learn als ein prädiktives Modell aus. Es funktioniert und es ist perfekt. Ich habe ein problem, zu bewerten, die prognostizierten Ergebnisse mit der accuracy_score Metrik. Dies ist meine wahre Daten : array([1,

Was ist die Standard-Variablen-Initialisierer in Tensorflow?

Anzahl der Antworten 1 Antworten
Was ist die Standard-Methode der Variablen-Initialisierung verwendet, wenn tf.get_variable() genannt wird, ohne jede Spezifikation für die Initialisierung? Die Doku sagt nur 'None' stellen. InformationsquelleAutor luongminh97 | 2016-05-20

'Aus - /import' nicht erkannt wird als Befehl interne oder externe, betriebsbereiten Programm oder batch-Datei

Anzahl der Antworten 2 Antworten
Ich habe Probleme beim importieren von Machine-Learning-algorithmen von scikit-learn. Ich habe es installiert, aber wenn ich geben Sie zum Beispiel "von sklearn.naive_bayes import GaussianNB" heißt es: "'aus' ist, nicht erkannt wird als Befehl interne oder externe, betriebsbereiten

Batch-Normalisierung in Convolutional Neural Network

Anzahl der Antworten 2 Antworten
Ich bin Neuling in convolutional neural networks und habe nur Ahnung von feature maps und wie Faltung erfolgt auf Bilder zum extrahieren von features. Ich wäre froh, zu wissen, einige details über die Anwendung batch-Normalisierung in der

scikit lernen, SVM, wie speichern/laden von support-Vektoren?

Anzahl der Antworten 2 Antworten
mit python scikit svm, nach dem ausführen von clf.fit(X, Y), erhalten Sie Ihren support-Vektoren. könnte ich laden Sie diese support-Vektoren direkt (übergeben als Parameter) beim instanziieren einer svm.SVC-Objekt? das bedeutet brauche ich nicht zu laufen fit ()

Warum ist der F-Measure eine harmonische Mittelwert und nicht das arithmetische Mittel von Präzision und Recall-Maßnahmen?

Anzahl der Antworten 5 Antworten
Wenn wir die Berechnung der F-Measure unter Berücksichtigung von Precision und Recall, wir nehmen das harmonische Mittel der beiden Maßnahmen, anstatt eine einfache arithmetische Mittel. Was ist der intuitive Grund hinter der Einnahme das harmonische Mittel und

Was ist der Unterschied zwischen einem generative und diskriminative Algorithmus?

Anzahl der Antworten 11 Antworten
Bitte helfen Sie mir zu verstehen, den Unterschied zwischen einem generative und ein diskriminative - Algorithmus, wenn man bedenkt, dass ich bin nur ein Anfänger. Dieses Dokument (wies auch darauf hin, indem anguyen8 unten) ist ein guter:

Beispiel für die svm-Funktion Auswahl in R

Anzahl der Antworten 1 Antworten
Ich versuche, gelten die feature-Selektion (z.B. rekursive Funktion-Auswahl) im SVM, mit dem R-Paket. Ich habe installiert Weka unterstützt, die die feature-Auswahl in LibSVM aber ich habe keine gefunden Beispiel für die syntax des SVM oder ähnliches. Ein

So erstellen Sie eine einfache Gradient-Descent-Algorithmus

Anzahl der Antworten 1 Antworten
Ich studiere einfache machine-learning-algorithmen, beginnen Sie mit einer einfachen Gradienten-Abstieg, aber ich habe einige Mühe versucht, es zu implementieren in python. Hier ist das Beispiel, das ich bin versucht zu reproduzieren, ich habe Daten über Häuser, die

Wie trainieren Sie Word2vec auf sehr großen Datenmengen?

Anzahl der Antworten 1 Antworten
Ich denke der Ausbildung word2vec auf riesigen großen Maßstab Daten von mehr als 10 TB+ in der Größe auf web-crawl-dump. Ich persönlich ausgebildete c-Implementierung GoogleNews-2012-dump (1,5 gb) auf meinen iMac dauerte etwa 3 Stunden zu trainieren und

Datei-format für die Klassifikation mit SVM Licht

Anzahl der Antworten 2 Antworten
Ich versuche zu bauen, ein Klassifikator mit SVM Licht, die klassifiziert ein Dokument in einer der beiden Klassen. Ich habe schon trainiert und getestet, der Systematik und eine Modell-Datei ist auf der Festplatte gespeichert. Jetzt will ich

Python text processing: NLTK und pandas

Anzahl der Antworten 1 Antworten
Ich bin auf der Suche nach einer effektiven Weg, zu konstruieren, ein Term-Dokument-Matrix in Python verwendet werden kann, zusammen mit zusätzlichen Daten. Habe ich einige text-Daten mit ein paar anderen Parametern. Ich würde gerne einige Analysen auf

.arff-Dateien mit scikit-learn?

Anzahl der Antworten 4 Antworten
Möchte ich ein Attribute-Relation File Format mit scikit-learn, um einige der NLP-Aufgabe, ist das möglich? Wie kann ein .arff - Datei mit scikit-learn? InformationsquelleAutor tumbleweed | 2014-12-03

Verständnis Neuronalen Netzes Backpropagation

Anzahl der Antworten 3 Antworten
Update: eine bessere Formulierung der Frage. Ich versuche zu verstehen, der backpropagation-Algorithmus mit einem XOR neuronale Netzwerk als ein Beispiel. Für diesen Fall gibt es 2 eingabeneuronen + 1 Neigung, 2 Neuronen in der hidden-layer + 1

Die Visualisierung einer Entscheidung Baum ( Beispiel aus der scikit-learn )

Anzahl der Antworten 2 Antworten
Ich bin ein noob in mit sciki-lernen, also bitte Geduld mit mir. Ging ich durch das Beispiel: http://scikit-learn.org/stable/modules/tree.html#tree >>> from sklearn.datasets import load_iris >>> from sklearn import tree >>> iris = load_iris() >>> clf = tree.DecisionTreeClassifier() >>>

Speichern MinMaxScaler Modell in sklearn

Anzahl der Antworten 4 Antworten
Ich bin mit der MinMaxScaler Modell in sklearn zu normalisieren, die Funktionen eines Modells. training_set = np.random.rand(4,4)*10 training_set [[ 6.01144787, 0.59753007, 2.0014852 , 3.45433657], [ 6.03041646, 5.15589559, 6.64992437, 2.63440202], [ 2.27733136, 9.29927394, 0.03718093, 7.7679183 ], [ 9.86934288,

Wie wendet maschinelles lernen an fuzzy-matching

Anzahl der Antworten 2 Antworten
Sagen, dass ich ein MDM-system (Master Data Management), deren primäre Anwendung ist zu erkennen und zu verhindern, dass die Vervielfältigung von Aufzeichnungen. Jedes mal, wenn ein Vertriebsmitarbeiter betritt ein neuer Kunde in das system, meine MDM-Plattform führt

Fitting Daten vs. transformieren von Daten in scikit-learn

Anzahl der Antworten 3 Antworten
In scikit-learn, alle Schätzer haben eine fit() Methode, und je nachdem, ob Sie werden beaufsichtigt oder unbeaufsichtigt, Sie haben auch eine predict() oder transform() Methode. Ich bin in den Prozess des Schreibens ein Transformator für ein unüberwachtes

Wie zu tun, zero-padding in keras conv Schicht?

Anzahl der Antworten 5 Antworten
Bin ich versucht zu implementieren-Modell aus der wissenschaftlichen Artikel, die sagt, Sie sind mit null Polsterung. Ist es möglich zu konfigurieren, dass dieser Polsterung in keras Conv2D? Nur möglich, Werte für padding, ich sehe sind Polsterung: eine

UseMethod("Vorhersagen") : keine anwendbare Methode für "prognostizieren" angewandt auf ein Objekt der Klasse "Zug"

Anzahl der Antworten 2 Antworten
Habe ich ein Modell (fit), basierend auf historischen Informationen, bis letzten Monat. Jetzt würde ich mag, um vorherzusagen, mit meinem Modell für den aktuellen Monat. Wenn ich versuche zu aufrufen, den folgenden code: predicted <- predict(fit, testData[-$Readmit])

Was ist der Unterschied zwischen np.bedeuten und tf.reduce_mean?

Anzahl der Antworten 4 Antworten
In der MNIST Anfänger-tutorial, es ist die Aussage accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float")) tf.cast im Grunde ändert den Typ von tensor das Objekt ist, aber was ist der Unterschied zwischen tf.reduce_mean und np.bedeuten? Hier ist der doc auf

Python-Implementierung von Gegenseitigen Informationen

Anzahl der Antworten 2 Antworten
Ich bin mit einigen Fragen der Umsetzung der Gegenseitigen Information Funktion das Python-machine learning Bibliotheken bieten, insbesondere : sklearn.Metriken.mutual_info_score(labels_true, labels_pred, Kontingenz=None) (http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html) Ich versuche zu implementieren, das Beispiel finde ich in der Stanford-NLP-tutorial Website: Die Website ist

Was bedeutet erinnern bedeutet maschinelles Lernen?

Anzahl der Antworten 5 Antworten
Ich wissen, dass die Bedeutung erinnern, die in Suchmaschinen, aber was ist die Bedeutung von erinnern, der einen classifier, z.B. bayes-Klassifikatoren? geben Sie bitte ein Beispiel, danke. beispielsweise die Precision = richtig/richtige+falsche Dokumente für Testdaten. wie zu

Python NLP Absicht Identifikation

Anzahl der Antworten 7 Antworten
Ich bin Neuling in Python und NLP, und mein problem ist, wie um herauszufinden, Absicht, bestimmten Fragen, zum Beispiel habe ich Sätze von Fragen und Antworten wie diese : question:What is NLP; answer: NLP stands for Natural

Max-pooling VS Summe-pooling

Anzahl der Antworten 1 Antworten
Habe ich teilweise verstanden Max-pooling, nach der Lektüre Convolutional Neural Networks (LeNet): Ein weiteres wichtiges Konzept der CNNs ist max-pooling, das ist eine form von nicht-lineare down-sampling. Max-pooling-Partitionen mit der Eingabe-Bild in eine Reihe von nicht-überlappende Rechtecke

out-of-sample-definition

Anzahl der Antworten 2 Antworten
Kann mir jemand erklären den Unterschied zwischen "in-sample" - und "out-of-sample" Prognosen? Was genau redest du? Sprechen Sie über die Daten-Punkte liegen außerhalb des sampling-Vertrieb bedeuten? InformationsquelleAutor Amber | 2011-02-23

So erstellen Sie ein neues Fitness-Studio-Umgebung, in OpenAI?

Anzahl der Antworten 2 Antworten
Habe ich eine Zuweisung zu machen, ein KI-Agent, der lernen, spielen, ein video-Spiel mit ML. Ich will erstellen Sie eine neue Umgebung mit OpenAI Fitness-Studio, weil ich nicht wollen, verwenden Sie eine vorhandene Umgebung. Wie kann ich

verwandeln scipy spärlich csr-pandas?

Anzahl der Antworten 2 Antworten
Habe ich die sklearn.preprocessing.OneHotEncoder verwandeln einige Daten die Ausgabe ist scipy.sparse.csr.csr_matrix wie kann ich merge es dann wieder in meiner ursprünglichen dataframe zusammen mit den anderen Spalten? Habe ich versucht zu verwenden pd.concat aber ich bekomme TypeError:

C/C++, Machine Learning Bibliotheken für Clustering

Anzahl der Antworten 2 Antworten
Was sind einige C/c++, Machine learning Bibliotheken, unterstützt das clustering von multi-dimensionalen Daten? (Beispiel: K-Means) So weit ich gekommen bin über SGI MLC++ http://www.sgi.com/tech/mlc/ OpenCV MLL Ich bin geneigt, roll-meinen-eigenen, aber ich bin sicher, dass pre-existing ones

Keras: Modell.bewerten vs-Modell.Vorhersagen Genauigkeit Unterschied in der multi-class-NLP Aufgabe

Anzahl der Antworten 1 Antworten
Trainiere ich ein einfaches Modell in keras für NLP Aufgabe, mit dem folgenden code. Variablen-Namen sind selbsterklärend für Zug -, test-und Validierungsdaten. Dieser Datensatz hat 19 Klassen, so Letzte Schicht des Netzes hat 19 Ausgänge. Etiketten sind

Umgang mit unausgeglichenen Datensätzen in Spark MLlib

Anzahl der Antworten 3 Antworten
Arbeite ich an einem bestimmten binäre Klassifikation problem mit einem sehr unausgeglichen dataset, und ich Frage mich, ob jemand versucht hat, die für die Umsetzung spezifischer Techniken für den Umgang mit unausgeglichenen Datensätzen (wie SCHLUG) in der

Wann sollte ich mit genetischen algorithmen im Gegensatz zu neuronalen Netzen?

Anzahl der Antworten 8 Antworten
Gibt es eine Faustregel (oder Beispiele) zu bestimmen, verwenden die genetischen algorithmen im Gegensatz zu neuronalen Netzen (und Umgekehrt), um ein problem zu lösen? Ich weiß, es gibt Fälle, in denen beide Methoden gemischt, aber ich bin

Können neuronale Netze annähernd jede Funktion, die genug verborgene Neuronen?

Anzahl der Antworten 6 Antworten
Ich verstehen, neuronale Netze mit einer beliebigen Anzahl von versteckten Schichten kann etwa nicht-lineare Funktionen, jedoch kann es annähernd: f(x) = x^2 Ich kann mir nicht denken, wie es könnte. Es scheint wie eine sehr offensichtliche Einschränkung

iloc geben "IndexError: Einzel-positions-indexer ist out-of-bounds"

Anzahl der Antworten 1 Antworten
Bin ich versucht zu codieren, einige Informationen zu Lesen in einer Machine-Learning-Modell mit den folgenden import numpy as np import pandas as pd import matplotlib.pyplot as py Dataset = pd.read_csv('filename.csv', sep = ',') X = Dataset.iloc[:,:-1].values Y

Wie ist die Komplexität des PCA O(min(p^3,n^3))?

Anzahl der Antworten 3 Antworten
Ich lese ein Papier, auf Sparse PCA, die ist: http://stats.stanford.edu/~imj/WEBLIST/AsYetUnpub/spärlich.pdf Ist und besagt, dass, wenn Sie n Daten Punkte, jeweils vertreten mit p Funktionen, dann ist die Komplexität des PCA ist O(min(p^3,n^3)). Kann mir bitte jemand erklären,

Welche Art von Algorithmus ist hinter der Akinator Spiel?

Anzahl der Antworten 5 Antworten
Es mich immer erstaunt, wie die Akinator app könnte ein Charakter durch Befragung nur einige Fragen. Also ich Frage mich, welche Art von Algorithmus oder Methode, lassen Sie es das tun? Gibt es eine Bezeichnung für die