Tag: k-means
In Statistik und data mining k-means clustering ist eine Methode der cluster-Analyse, die Ziel-partition n Beobachtungen in k Cluster, in dem jede Beobachtung gehört zu dem cluster mit dem nächsten Mittelwert (least squares).
2
Antworten
Ich bin neu sowohl python und scikit-learn, also bitte Geduld mit mir. Nahm ich den source code für die k-means-clustering-Algorithmus von k-means-clustering. Habe ich dann geändert, um auf meinem lokalen mittels load_file Funktion. Obwohl der Algorithmus beendet,
3
Antworten
Arbeite ich an einem python-Projekt, wo ich studiere, RNA-Struktur, die die evolution (als Zeichenfolge dargestellt, beispielsweise: "(((...)))" wo die Klammer darstellen Basenpaare). Der springende Punkt dabei ist, dass ich eine ideale Struktur und einer Bevölkerung, die sich
1
Antworten
Meine lecture notes on computer vision erwähnen, dass die Leistung der k-means-clustering-Algorithmus kann verbessert werden, wenn wir wissen, dass die Standardabweichung der Cluster. Wie so? Mein denken ist, dass wir verwenden können, die standard-Abweichungen zu kommen mit
1
Antworten
Ich habe eine k-means-clustering auf meine Daten, importiert aus .csv. Gibt es trotzdem, um den export der gruppierten Ergebnisse zurück .csv-Datei? Cos nach der k-means-clustering ist getan, die Klasse der variable ist nicht ein Daten-frame, aber kmeans.
3
Antworten
Ich versuche, cluster-eine Gruppe von news-Artikeln in Java, die über ein bestimmtes Thema. Ich kroch news-sites zu einem bestimmten Thema mit Crawler4J, rollte meinen eigenen TF/IDF-implementation der Vergleich gegen einen Korpus (es gab Gründe, dass ich nicht
4
Antworten
Ich würde gerne wissen, einfachen k-means-Algorithmus in java. Ich will k-means nur für die Gruppierung der eindimensionalen array nicht multi. Zum Beispiel, vor der Gruppierung der array besteht aus 2,4,7,5,12,34,18,25 wenn wir wollen, vier Gruppe dann bekamen
4
Antworten
Ich das Ziel, mich zu bewerben, ein kmeans-clustering-Algorithmus, um einen sehr großen Datensatz, mit Funken (1.3.1) MLLib. Habe ich aufgerufen, die Daten aus HDFS mit einem hiveContext von Spark und möchte schließlich, um ihn wieder dort Weg
1
Antworten
Den weka SimpleKMeans - Implementierung erlaubt dem Benutzer, geben Sie einen "Startwert" mit der option -s. Ich verstehe nicht, was es bedeutet. In dieser link, Mark Hall, der weka Architekt, sagt, dass es eigentlich um Zufallszahlen zu
6
Antworten
Ich versuche, umzusetzen k-means als Hausaufgabe. Meine übung gibt mir folgende Bemerkung zum leeren Zentren: Während der Iterationen, wenn einer der cluster-Zentren keine Daten Punkte die mit ihm verbunden ist, ersetzen Sie es mit einem zufälligen Datenpunkt.
4
Antworten
Ich habe eine Tabelle mit Daten ("norm"), numerische - zumindest was ich sehen kann - normalisierten Werte der folgenden form: Wenn ich ausführen k <- kmeans(norm,center=3) Ich bin receving die folgende Fehlermeldung: Error in do_one(nmeth) : NA/NaN/Inf
5
Antworten
Ich habe einen matrice Einer(369x10), was ich will-cluster 19-Cluster. Ich benutze diese Methode [idx ctrs]=kmeans(A,19) ergibt idx(369x1) und Klickraten(19x10) Bekomme ich den Punkt, bis auf hier.Alle meine Zeilen in A Cluster 19 Cluster. Nun habe ich ein
1
Antworten
Habe ich eine Reihe von Vektoren V_1, V_2, ..., V_n möchte ich umwandeln in eine matrix. Jeder Vektor wird zu einem Spalten-Vektor in der matrix. Die Größe jedes Vektors ist die gleiche. Gibt es eine einfache Funktion,
3
Antworten
Ich bin mit R-software (R-commander), um cluster-meine Daten. Ich habe eine kleinere Teilmenge der meine Daten enthält 200 Zeilen und etwa 800 Säulen. Ich erhalte die folgende Fehlermeldung, wenn Sie versuchen kmeans-cluster und Plotten Sie in einem
3
Antworten
Ich bin neu bei Python. Ich bin versucht, sklearn.cluster. Hier ist mein code: from sklearn.cluster import MiniBatchKMeans kmeans=MiniBatchKMeans(n_clusters=2) kmeans.fit(df) Aber ich bekomme die folgende Fehlermeldung: 50 and not np.isfinite(X).all()): 51 raise ValueError("Input contains NaN, infinity" ---> 52
4
Antworten
Kann jemand erklären, was der Ausgang des K-Means-clustering in WEKA eigentlich bedeutet. Beispielsweise kMeans Number of iterations: 9 Within cluster sum of squared errors: 9434.911100488926 Missing values globally replaced with mean/mode Cluster centroids: Cluster# Attribute Full Data
2
Antworten
Habe ich getan clustering mit Kmeans mit sklearn. Während es eine Methode zum drucken der centroide, ich finde es eher bizzare, dass scikit-learn nicht haben eine Methode zum drucken der cluster-Punkte der einzelnen cluster (oder ich habe
1
Antworten
Ich bin ein student des clustering und R., um zu erhalten einen besseren Griff der beiden würde ich gerne berechnen, den Abstand centroide und meine xy-matrix, die für jede iteration, bis es "konvergiert". Wie kann ich das
3
Antworten
Bewarb ich mich clustering auf eine Reihe von text-Dokumente (über 100). Ich konvertiert Sie zu Tfidf Vektoren mit TfIdfVectorizer und versorgt die Vektoren als Eingabe für scikitlearn.cluster.KMeans(n_clusters=2, init='k-means++', max_iter=100, n_init=10). Wenn ich jetzt model.fit() print model.score() auf
3
Antworten
Ich bin in der Notwendigkeit einer Javascript-Implementierung der k-means-clustering-Algorithmus. Ich habe nur 1-dimensionale Daten und selten mehr als 100 Elemente, so dass Leistung ist nicht ein Problem. PS: ich konnte nur finden, ein aber es scheint extrem
1
Antworten
Ich versuche zu laufen kmeans auf einem 3-Kanal-Farb-Bild, aber jedes mal, wenn ich versuchen zu laufen, die Funktion scheint es zum Absturz mit der folgenden Fehlermeldung: OpenCV Error: Assertion failed (data.dims <= 2 && type == CV_32F
2
Antworten
wenn ich versuche zu füttern df2 zu kmeans, bekomme ich folgenden Fehler clusters = KMeans.train(df2, 10, maxIterations=30, runs=10, initializationMode="random") Den Fehler bekomme ich: Cannot convert type <class 'pyspark.sql.types.Row'> into Vector df2 ist ein dataframe erstellt wie folgt:
4
Antworten
In meinem Programm, ich bin dabei für k=2 für k-mean-Algorithmus ich.e ich will nur 2 Clustern. Ich habe implementiert eine sehr einfache und unkomplizierte Art und Weise immer noch bin ich nicht in der Lage zu verstehen,
1
Antworten
Ich habe einen data-matrix 510x6 und durchführen wollen K-means-cluster-Analyse auf. Ich habe Probleme in das Plotten all der verschiedenen Cluster in 2 Dimensionen. Ist es nicht möglich, plot 6 verschiedenen Clustern in 2 Dimensionen? InformationsquelleAutor nprak |
1
Antworten
Tue ich k-means-clustering auf den Satz von 30 Proben mit 2 Clustern (ich weiß schon, es gibt zwei Klassen). Ich Teile meine Daten in Trainings-und test-set und versuchen zu berechnen, wird die Genauigkeit Punktzahl auf meiner test-set.
1
Antworten
Wenn ich ein kmeans-Algorithmus erhalte ich diese Fehlermeldung : Error in kmeans(x, 2, 15) : more cluster centers than distinct data points. Wie kann dieser Fehler behoben werden und was bedeutet es ? Ich denke, dass meine
1
Antworten
Lerne ich python scikit. Das Beispiel hier zeigt die top vorkommende Wörter in den einzelnen Cluster-und nicht-Cluster-name. http://scikit-learn.org/stable/auto_examples/document_clustering.html Fand ich, dass die km Objekt "km.label" die Listen der Schwerpunkt-id, die ist die Nummer. Ich habe zwei Frage
3
Antworten
Ich gruppierte Daten durch k-means-clustering-Methode, wie bekomme ich die cluster-Anzahl entspricht, um Daten mit k-means clustering-Techniken, die in R? Um jeden Datensatz gehört zu dem cluster. Beispiel 12 32 13 => 1. 12,13 2. 32 InformationsquelleAutor Java
2
Antworten
Verwenden Sie den folgenden code, um cluster-geolocation-Koordinaten Ergebnisse in 3 Clustern: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, y =
2
Antworten
Ich arbeite mit k-means in MATLAB. Ich bin beim erstellen der plot/graph, aber meine Daten drei-dimensionales array. Hier ist mein k-means-code: clc clear all close all load cobat.txt; % read the file k=input('Enter a number: '); %
3
Antworten
Ich versuche, mit kmeans clustering in scipy, genau die hier anwesend: http://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.vq.kmeans.html#scipy.cluster.vq.kmeans Was ich versuche zu tun ist, konvertieren Sie eine Liste wie die folgende: data without_x[ [0, 0, 0, 0, 0, 0, 0, 20.0, 1.0, 48.0,
2
Antworten
Ich habe die Nummer von kleineren Datensätzen, mit 10 XY-Koordinaten jedes. Ich bin mit Matlab (R2012a)und k-means zu erhalten, einen Schwerpunkt. In einigen Clustern (siehe Abbildung unten), sehe ich einige extreme Punkte, weil meine Daten so klein
5
Antworten
Ich bin mit dem sklearn.cluster KMeans-Paket. Ich beende mal das clustering, wenn ich brauche, um zu wissen, welche Werte wurden zusammengefasst, wie kann ich es tun? Sagen ich hatte 100 Datenpunkte und KMeans gab mir 5 cluster.
2
Antworten
Ich möchte cluster eine matrix mit kmeans, und in der Lage zu zeichnen Sie es als heatmap. Es klingt sehr trivial, und ich habe gesehen, viele Grundstücke wie dieses. Ich habe versucht, google atround, kann Sie aber
3
Antworten
Ging ich durch die k-means-Wikipedia-Seite. Basierend auf den Algorithmus, ich denke, die Komplexität ist O(n*k*i) (n = Gesamtzahl der Elemente, die k = Anzahl von cluster-iteration) So kann sich das jemand erklären mir diese Aussage aus Wikipedia
5
Antworten
Will ich mit der K-Means-Clustering für mein dataset. Ich bin mit dem kmeans () - Funktion in R, dies zu tun. k<-kmeans(data,centers=3) plotcluster(m,k$cluster) Aber ich bin nicht sicher, was ist der richtige Wert von K für diese
3
Antworten
Ich verwendet dieser code Mein Fehler ist: Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties 17/02/03 20:39:24 INFO SparkContext: Running Spark version 2.1.0 17/02/03 20:39:25 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where
2
Antworten
Diese Frage ist spezifisch für opencv: Die kmeans Beispiel in der opencv-Dokumentation hat eine 2-Kanal-matrix - one-Kanal für die einzelnen dimension des feature-Vektors. Aber einige andere Beispiel scheinen zu sagen, dass es eine ein-Kanal-matrix mit Eigenschaften entlang
2
Antworten
Ich würde gerne ein 2d-plot Graphen mit der x-Achse als Begriff-und y-Achse als TFIDF-score (oder Dokument-id) für meine Liste von Sätzen. Ich verwendet scikit lernen ist fit_transform (), um die scipy-matrix, aber ich weiß nicht, wie Sie
1
Antworten
Sci-Kit lernen Kmeans und PCA dimensionsreduktion Ich habe einen Datensatz, 2M Zeilen und 7 Spalten, wobei verschiedene Messungen von zu Hause den Stromverbrauch mit einem Datum für jede Messung. Datum, Global_active_power, Global_reactive_power, Spannung, Global_intensity, Sub_metering_1, Sub_metering_2, Sub_metering_3
3
Antworten
Ich versuche zu tun, ein scatter-plot des kmeans-Ausgabe, welche Cluster Sätze mit dem gleichen Thema zusammen. Das problem ich bin vor Punkte darstellen, gehört zu jedem cluster mit einer bestimmten Farbe. sentence_list=["Hi how are you", "Good morning"
2
Antworten
Möchte ich cluster Dokumente basierend auf der ähnlichkeit. Ich haved versucht ssdeep (similarity-hashing), sehr schnell, aber mir wurde gesagt, dass k-means ist schneller und flann ist am schnellsten von allen Implementierungen, und genauer, so dass ich versucht
3
Antworten
Ich bin mit diesem Skript um cluster einen Satz von 3D-Punkten mit dem kmeans matlab-Funktion, aber ich bekomme immer diese Fehlermeldung "Leere cluster erstellt am iteration 1". Das Skript, das ich verwende: [G,C] = kmeans(XX, K, 'distance','sqEuclidean',
5
Antworten
Möchte ich wissen, ob der k-means-clustering-Algorithmus kann tun Klassifikation? Wenn ich einen einfachen k-means-clustering . Nehme an, ich habe viele Daten , die ich verwenden k-means-clusterungen sowie dann erhalten Sie 2 Cluster A, B und das centroid-Berechnung-Methode
2
Antworten
Ich habe ein array von 13.876(13,876) Werte zwischen 0 und 1. Ich möchte sklearn.cluster.KMeans nur für diesen Vektor zu finden, die verschiedenen Clustern, in denen die Werte gruppiert sind. Es scheint jedoch, KMeans arbeitet mit einem mehrdimensionalen
1
Antworten
Lesung Umsetzung von scikit-learn in tensroflow : http://learningtensorflow.com/lesson6/ und scikit-learn : http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html ich bin kämpfen, um zu entscheiden, welche Implementierung zu verwenden ist. scikit-learn ist installiert, wie Teil des tensorflow docker container, so kann entweder die Umsetzung.
4
Antworten
Ich Lesen möchte wav-Dateien in Java, und ich bin dabei, Sie zu klassifizieren, die mit K-means. Wie kann ich Lesen Sie wav-Dateien in Java und ordnen diese in ein array oder sowas(Sie können Ihnen Ideen für Sie),
3
Antworten
Lerne ich die K-medoids Algorithmus also ich bin sorry, wenn ich Frage, unangemessene Fragen. Ich weiss,das K-medoids-Algorithmus implementiert eine K-means-clustering verwenden, aber die tatsächlichen Daten Punkte werden Schwerpunkt anstelle von mathematisch berechneten Mittel. Als ich gegoogelt online,
4
Antworten
Habe ich gesucht um scipy und sklearn für clustering-algorithmen für ein bestimmtes problem habe ich auch. Ich brauche einige für die Charakterisierung einer population von N Teilchen in den k-Gruppen, wobei k nicht unbedingt wissen, und darüber
1
Antworten
Ich war erforderlich, um zu schreiben, eine die sich kreuzenden k-means-Algorithmus, aber ich didnt verstehen des Algorithmus. Ich kenne k-means-Algorithmus. Kann Sie erklären den Algorithmus, aber nicht in Akademische Sprache Dank. InformationsquelleAutor Nir | 2011-07-29
2
Antworten
Ich bin mit dem kmeans () - Funktion in R, und ich war neugierig, was ist der Unterschied zwischen den totss und tot.withinss Attribute des zurückgegebenen Objekts. Aus den Unterlagen, die Sie zu sein scheinen Rückgabe der