Tag: cluster-analysis

Cluster-Analyse ist der Prozess der Gruppierung „ähnlicher“ Objekte in Gruppen, bekannt als „Clustern“, zusammen mit der Analyse dieser Ergebnisse.

wie funktioniert die Daten-clustering Hilfe in Bild-oder Mustererkennung

Anzahl der Antworten 1 Antworten
Ich habe das Spiel mit verschiedenen Daten clustering-algorithmen arbeiten auf der Suche nach Cluster zwischen zufälligen Datenpunkten repräsentiert ein Knoten, immer wieder lese ich, dass die Daten-clustering verwendet wird, für die Bilderkennung. Bin ich andernfalls, um die

Zeichnung heatmap mit das dendrogramm zusammen mit Beispiel-Etiketten

Anzahl der Antworten 2 Antworten
Mithilfe der heatmap Funktion made4 ich aus dieser heatmap das dendrogramm aus der Beispiel-Datei: data(khan) heatplot(khan$train[1:30,], lowcol="blue", highcol="red") Wie kann ich ein panel von Etiketten für die Proben am Rand der heatmap, wie Sie in dieser Abbildung?

scikit-learn, wie zu wissen, Dokumente im cluster?

Anzahl der Antworten 2 Antworten
Ich bin neu sowohl python und scikit-learn, also bitte Geduld mit mir. Nahm ich den source code für die k-means-clustering-Algorithmus von k-means-clustering. Habe ich dann geändert, um auf meinem lokalen mittels load_file Funktion. Obwohl der Algorithmus beendet,

Kann ich mit K-means-Algorithmus auf einem string?

Anzahl der Antworten 3 Antworten
Arbeite ich an einem python-Projekt, wo ich studiere, RNA-Struktur, die die evolution (als Zeichenfolge dargestellt, beispielsweise: "(((...)))" wo die Klammer darstellen Basenpaare). Der springende Punkt dabei ist, dass ich eine ideale Struktur und einer Bevölkerung, die sich

Welche Methode verwenden Sie für die Auswahl der optimalen Anzahl der Cluster beim k-means und EM?

Anzahl der Antworten 2 Antworten
Viele algorithmen für das clustering verfügbar sind. Ein beliebter Algorithmus ist der K-means-wo, basierend auf einer bestimmten Anzahl der Cluster, die der Algorithmus iteriert um die besten zu finden von Clustern für die Objekte. Welche Methode sollten

Export-kmeans clustering-Ergebnisse .csv

Anzahl der Antworten 1 Antworten
Ich habe eine k-means-clustering auf meine Daten, importiert aus .csv. Gibt es trotzdem, um den export der gruppierten Ergebnisse zurück .csv-Datei? Cos nach der k-means-clustering ist getan, die Klasse der variable ist nicht ein Daten-frame, aber kmeans.

Effiziente k-means-Auswertung mit silhouette score in sklearn

Anzahl der Antworten 2 Antworten
Ich bin mit k-means-clustering auf ~1 Mio Artikel (jeweils dargestellt als ~100-feature-Vektor). Ich habe das clustering für verschiedene k, und möchten nun eine Bewertung der unterschiedlichen Ergebnisse, die mit der silhouette Partitur umgesetzt sklearn. Versuch es mit

Scikit-Learn: die Vorhersage, die neuen Punkte mit DBSCAN

Anzahl der Antworten 4 Antworten
Ich bin mit DBSCAN-cluster-einige Daten mithilfe von Scikit-Learn (Python 2.7): from sklearn.cluster import DBSCAN dbscan = DBSCAN(random_state=0) dbscan.fit(X) Allerdings fand ich, dass es keine built-in Funktion (abgesehen von "fit_predict") könnten ordnen Sie die neuen Daten Punkte, Y,

Raster-Suche für hyperparameter evaluation von clustering in scikit-learn

Anzahl der Antworten 2 Antworten
Ich bin clustering eine Stichprobe von rund 100 Datensätze (unbeschrifteten) und versuchen, zu verwenden grid_search zur Bewertung der clustering Algorithmus mit verschiedenen hyperparameters. Ich bin scoring mit silhouette_score welche gut funktioniert. Mein problem hier ist, dass ich

Computing F-measure für das clustering

Anzahl der Antworten 4 Antworten
Kann mir jemand helfen bei der Berechnung F-measure gemeinsam ? Ich weiß wie berechnen Sie recall und precision, aber nicht wissen, für einen bestimmten Algorithmus wie berechnet man F-measure-Wert. Als Beispiel, angenommen mein Algorithmus erstellt m Clustern,

der dist () - Funktion in R: vector-Größe Begrenzung

Anzahl der Antworten 3 Antworten
Ich versuche zu zeichnen, ein hierarchisches clustering von einigen Proben (40) über einige Merkmale(Gene) und ich habe eine große Tabelle mit 500k Zeilen und 41 Spalten (1. ein name ist) und als ich versuchte d<-dist(as.matrix(file),method="euclidean") Bekam ich

Parameter estimation in DBSCAN

Anzahl der Antworten 1 Antworten
Ich brauche zu finden, natürlich vorkommende Klassen der Substantive basiert auf deren Verteilung mit verschiedener Präposition (wie agentive, instrumental, Ort, Zeit usw.). Ich habe versucht mit k-means-clustering, aber weniger helfen, es hat nicht funktioniert gut, es wurde

was ist solr-clustering-Komponente

Anzahl der Antworten 1 Antworten
Ich ging gerade durch solr wiki-Seite für das clustering. Aber ich bin nicht immer was ist der Vorteil der Verwendung von clustering. Kann mir jemand sagen, was ist eigentlich clusering und was seine Verwendung in der Indizierung

Dokument-Clustering in Java mithilfe von Weka

Anzahl der Antworten 3 Antworten
Ich versuche, cluster-eine Gruppe von news-Artikeln in Java, die über ein bestimmtes Thema. Ich kroch news-sites zu einem bestimmten Thema mit Crawler4J, rollte meinen eigenen TF/IDF-implementation der Vergleich gegen einen Korpus (es gab Gründe, dass ich nicht

Wie kann ich KNN /K-Mittel-clustering von Zeitreihen in einem dataframe

Anzahl der Antworten 2 Antworten
Angenommen, ein dataframe enthält 1000 Zeilen. Jede Zeile stellt eine Zeit-Serie. Dann baute ich eine DTW-Algorithmus zur Berechnung der Entfernung zwischen 2 Zeilen. Ich weiß nicht, was als Nächstes zu tun ist, um complish einer unüberwachten Klassifikation

Wie finde ich die Mitte aus einem cluster von Daten-Punkten?

Anzahl der Antworten 14 Antworten
Sagen wir mal ich aufgetragen, der die position des Hubschraubers jeden Tag für das vergangene Jahr und kam mit der folgenden Karte: Jedem menschlichen Blick auf diese in der Lage wäre, mir zu sagen, dass dieser Hubschrauber

silhouette Koeffizient in python mit sklearn

Anzahl der Antworten 1 Antworten
Ich habe Probleme bei der Berechnung der silhouette Koeffizient in python mit sklearn. Hier ist mein code : from sklearn import datasets from sklearn.metrics import * iris = datasets.load_iris() X = pd.DataFrame(iris.data, columns = col) y =

Was ist die rechnerische Komplexität des EM-Algorithmus?

Anzahl der Antworten 3 Antworten
Im Allgemeinen, und insbesondere für Bernoulli mixture Modell (aka Latent-Class-Analyse). InformationsquelleAutor Jessica | 2012-12-27

Wie cluster-Instanz mit Weka ist DBSCAN?

Anzahl der Antworten 3 Antworten
Ich habe versucht, verwenden Sie die DBSCAN clusterers von Weka-cluster-Instanzen. Von dem, was ich verstehe, ich sollte mit der clusterInstance() Methode für diese, aber zu meiner überraschung, wenn man einen Blick auf den code der Methode, wie

Clustering in Gephi (Louvain-Methode)

Anzahl der Antworten 2 Antworten
habe ich begonnen, die Arbeit mit gephi, um mir zu helfen-display ein dataset. Das dataset enthält: tags (Suchbegriffe für eine bestimmte Bild) als Knoten Normalisierte Google-Ähnlichkeit Abstand zwischen diesen tags, als Kanten mit einem Gewicht (zwischen 0

Sollte eine Verwendung Distanzen (Unähnlichkeiten) oder ähnlichkeiten in der R für clustering?

Anzahl der Antworten 1 Antworten
Ich mache ein cluster-problem, und die proxy - Paket in R bietet sowohl dist und simil Funktionen. Für meine Zwecke brauche ich eine Distanz-matrix, also habe ich zunächst verwendet, dist, und hier ist der code: distanceMatrix <-

Wie berechnen clustering Entropie? Ein funktionierendes Beispiel oder software-code

Anzahl der Antworten 2 Antworten
Möchte ich berechnen Sie die Entropie dieser Beispiel-Schema http://nlp.stanford.edu/IR-book/html/htmledition/evaluation-of-clustering-1.html Kann jemand bitte Schritt für Schritt erklären, mit echten Werten? Ich weiß, es gibt unliminted viele Formeln, aber ich bin wirklich schlecht im Verständnis der Formeln 🙂 Beispielsweise

Bedeutung von "seed" im weka-K-means-clustering

Anzahl der Antworten 1 Antworten
Den weka SimpleKMeans - Implementierung erlaubt dem Benutzer, geben Sie einen "Startwert" mit der option -s. Ich verstehe nicht, was es bedeutet. In dieser link, Mark Hall, der weka Architekt, sagt, dass es eigentlich um Zufallszahlen zu

Wie berechnet man die Affinität der Matrix eines Bildes?

Anzahl der Antworten 1 Antworten
Habe ich gelesen das Formeln, wie die Berechnung der Affinität der matrix eines Bildes, und ich bin ein wenig verwirrt. Im Idealfall würde ich gerne die Farbe verwenden, die Intensität der Distanz-Metrik. Fand ich diesen Hinweis: http://spectrallyclustered.wordpress.com/2010/06/05/sprint-1-k-means-spectral-clustering/

Wie berechnen Sie precision und recall in clustering?

Anzahl der Antworten 7 Antworten
Ich bin wirklich verwirrt, wie berechnen Sie precision und recall, die in clustering-Anwendungen. Ich habe die folgende situation: Gegeben zwei Mengen A und B. Durch die Verwendung einer eindeutigen Schlüssel für jedes element kann ich bestimmen, welche

Ist eine Fuzzy-C-Means-Algorithmus zur Verfügung, für Python?

Anzahl der Antworten 4 Antworten
Habe ich einige Punkte in einem 3 dimensionalen Raum und möchte zu Clustern. Ich weiß, Pythons Modul "cluster", aber es hat nur K-Means. Kennst du ein Modul, das hat FCM (Fuzzy-C-Means)? (Wenn Sie wissen einige andere python-Module,

Fehler in do_one(nmeth) : NA/NaN/Inf in foreign function call (arg 1)

Anzahl der Antworten 4 Antworten
Ich habe eine Tabelle mit Daten ("norm"), numerische - zumindest was ich sehen kann - normalisierten Werte der folgenden form: Wenn ich ausführen k <- kmeans(norm,center=3) Ich bin receving die folgende Fehlermeldung: Error in do_one(nmeth) : NA/NaN/Inf

Clustering-cosine similarity matrix

Anzahl der Antworten 1 Antworten
Ein paar Fragen auf stackoverflow erwähnen dieses problem, aber ich habe nicht gefunden eine konkrete Lösung. Habe ich eine quadratische matrix, die aus Kosinus-ähnlichkeiten (Werte zwischen 0 und 1), zum Beispiel: | A | B | C

Matlab:K-means-clustering

Anzahl der Antworten 5 Antworten
Ich habe einen matrice Einer(369x10), was ich will-cluster 19-Cluster. Ich benutze diese Methode [idx ctrs]=kmeans(A,19) ergibt idx(369x1) und Klickraten(19x10) Bekomme ich den Punkt, bis auf hier.Alle meine Zeilen in A Cluster 19 Cluster. Nun habe ich ein

Identifizieren Cluster in der SOM (Self Organizing Map)

Anzahl der Antworten 3 Antworten
Einmal habe ich gesammelt und organisiert Daten in einer SOM-wie erkenne ich Clustern? (Items aggregiert und gruppiert mit vielen Eigenschaften - nach oben von 10) Speziell möchte ich finden der 'Mitte' der cluster - dafür, dass Sie

Beste Python-clustering-Bibliothek zu verwenden, für die Produkt-Daten-Analyse

Anzahl der Antworten 6 Antworten
Habe ich eine Sammlung von alphanumerischen product codes von verschiedenen Produkten. Ähnliche Produkte haben keine innere ähnlichkeit in Ihren codes, dh Produkt-code "A123" könnte bedeuten, "Harry Potter Band 1 DVD" und "B123", könnte bedeuten "Kelloggs Corn Flakes".

Clustering using Latent Dirichlet Allocation algo im gensim

Anzahl der Antworten 4 Antworten
Ist es möglich zu tun clustering in gensim für einen gegebenen Satz von Eingängen mit LDA? Wie kann ich das machen? InformationsquelleAutor Sharmila | 2011-06-26

Grundstück das dendrogramm mit sklearn.AgglomerativeClustering

Anzahl der Antworten 4 Antworten
Ich versuche zu bauen, das dendrogramm mit der children_ - Attribut zur Verfügung gestellt von AgglomerativeClustering, aber bisher bin ich aus Glück. Ich kann nicht mit scipy.cluster seit agglomerative clustering in scipy fehlen einige Optionen, die mir

clustering von sehr großen Datensätzen in R

Anzahl der Antworten 3 Antworten
Ich habe einen Datensatz, bestehend aus 70.000 numerische Werte, die für Entfernungen im Bereich von 0 bis 50, und ich möchte cluster diese zahlen, jedoch, wenn ich versuche, die klassischen clustering-Ansatz, dann würde ich zum einrichten 70,000X70,000

R - 'princomp' kann nur verwendet werden mit mehr Einheiten als Variablen

Anzahl der Antworten 3 Antworten
Ich bin mit R-software (R-commander), um cluster-meine Daten. Ich habe eine kleinere Teilmenge der meine Daten enthält 200 Zeilen und etwa 800 Säulen. Ich erhalte die folgende Fehlermeldung, wenn Sie versuchen kmeans-cluster und Plotten Sie in einem

Besser text-Dokumenten-clustering als tf/idf-und Cosinus-ähnlichkeit?

Anzahl der Antworten 3 Antworten
Ich versuche, die cluster der Twitter-stream. Ich möchte jeden tweet zu einem cluster, dass reden über das gleiche Thema. Ich habe versucht, zu cluster-stream mit einem online-clustering-Algorithmus mit tf/idf-und Cosinus-ähnlichkeit, aber ich fand, dass die Ergebnisse sind

"NAs introduced by coercion" während der Cluster-Analyse im R

Anzahl der Antworten 1 Antworten
Leute, ich bin neu in dieser Sprache ,ich bin mit cluster-Analyse auf einen Daten-frame, aber wenn ich die Entfernung zu berechnen bekomme ich die Warnung "NAs introduced by coercion". Was bedeutet das? d <- dist(as.matrix(mydata1)) Warning message:

Das finden der Mitte eines Clusters

Anzahl der Antworten 4 Antworten
Ich habe Folgendes problem - aus abstrakten, um den Schlüssel Fragen. Habe ich jeweils 10 Punkten, die in einiger Entfernung von den anderen. Ich möchte in der Lage sein zu finden, das Zentrum des Clusters, d.h. der

WEKA K-Means-Clustering

Anzahl der Antworten 4 Antworten
Kann jemand erklären, was der Ausgang des K-Means-clustering in WEKA eigentlich bedeutet. Beispielsweise kMeans Number of iterations: 9 Within cluster sum of squared errors: 9434.911100488926 Missing values globally replaced with mean/mode Cluster centroids: Cluster# Attribute Full Data

Clustering mit einer Distanz-matrix

Anzahl der Antworten 3 Antworten
Habe ich eine (symmetrische) matrix M repräsentiert den Abstand zwischen jedem paar von Knoten. Zum Beispiel, A B C D E F G H I J K L Ein 0 20 20 20 40 60 60 60

Wie zum ausführen von clustering ohne entfernen von Zeilen, in denen die NA ist in R

Anzahl der Antworten 2 Antworten
Ich habe eine Daten enthalten NA-Wert in Ihre Elemente. Was ich will zu tun ist, um durchführen clustering ohne entfernen von Zeilen wo der NA vorhanden ist. Ich verstehe, dass gower Entfernung Messen in daisy erlauben, eine

Wie die Berechnung von Entfernungen zwischen centroide und data matrix (für kmeans-Algorithmus)

Anzahl der Antworten 1 Antworten
Ich bin ein student des clustering und R., um zu erhalten einen besseren Griff der beiden würde ich gerne berechnen, den Abstand centroide und meine xy-matrix, die für jede iteration, bis es "konvergiert". Wie kann ich das

C/C++, Machine Learning Bibliotheken für Clustering

Anzahl der Antworten 2 Antworten
Was sind einige C/c++, Machine learning Bibliotheken, unterstützt das clustering von multi-dimensionalen Daten? (Beispiel: K-Means) So weit ich gekommen bin über SGI MLC++ http://www.sgi.com/tech/mlc/ OpenCV MLL Ich bin geneigt, roll-meinen-eigenen, aber ich bin sicher, dass pre-existing ones

Extrahieren von Cluster von seaborn clustermap

Anzahl der Antworten 2 Antworten
Ich bin mit der seaborn clustermap zum erstellen von Clustern und visuell funktioniert es Super (diese Beispiel produziert sehr ähnliche Ergebnisse). Aber ich habe Schwierigkeiten, herauszufinden, wie programmgesteuert zu extrahieren, die Cluster. Zum Beispiel, in dem Beispiel-link,

k-means-clustering Implementierung in Javascript?

Anzahl der Antworten 3 Antworten
Ich bin in der Notwendigkeit einer Javascript-Implementierung der k-means-clustering-Algorithmus. Ich habe nur 1-dimensionale Daten und selten mehr als 100 Elemente, so dass Leistung ist nicht ein Problem. PS: ich konnte nur finden, ein aber es scheint extrem

scikit-learn DBSCAN memory Nutzung

Anzahl der Antworten 5 Antworten
AKTUALISIERT: In das Ende, die Lösung ich entschied mich für das clustering verwenden meine großen Datensatzes wurde ein Vorschlag Anony-Mousse unten. Das heißt, mit ELKI ist DBSCAN Umsetzung zu tun, meine clustering statt scikit-learn ist. Es kann

MATLAB: Self-Organizing Map (SOM) - clustering

Anzahl der Antworten 1 Antworten
Ich versuche, cluster einige Bilder je nach Winkel zwischen den Körperteilen. Features extrahiert aus jedem Bild sind: angle1 : torso - torso angle2 : torso - upper left arm .. angle10: torso - lower right foot Daher

PCA multiplot in R

Anzahl der Antworten 1 Antworten
Ich habe einen Datensatz, der wie folgt aussieht: India China Brasil Russia SAfrica Kenya States Indonesia States Argentina Chile Netherlands HongKong 0.0854026763 0.1389383234 0.1244184371 0.0525460881 0.2945586244 0.0404562539 0.0491597968 0 0 0.0618342901 0.0174891774 0.0634064181 0 0.0519483159 0.0573851759 0.0756806292

clustering-Bild-Segmente in opencv

Anzahl der Antworten 4 Antworten
Ich arbeite bei Bewegungserkennung mit nicht-statischen Kamera mit opencv. Ich bin mit einem ziemlich grundlegenden hintergrund-Subtraktion und thresholding-Ansatz, um einen breiten Einblick in all das bewegt sich in einem Beispiel-video. Nach der Binarisierung, die ich gewinnen Sie

Clustering in Gephi 0.8.2

Anzahl der Antworten 1 Antworten
Arbeite ich mit einem dataset in Gephi, die abgeleitet ist von einer Freunde-Tabelle aus einer Buddypress-Website. Ich habe eine Reihe von Dingen, die Grafik, die nützlich sind, mit der eingebauten Funktionalität, wäre aber interessiert an einer besseren