Das finden der Mitte eines Clusters
Ich habe Folgendes problem - aus abstrakten, um den Schlüssel Fragen.
Habe ich jeweils 10 Punkten, die in einiger Entfernung von den anderen. Ich möchte
- in der Lage sein zu finden, das Zentrum des Clusters, d.h. der Punkt für die paarweisen Abstand zu jedem anderen Punkt wird minimiert,
lassen Sie p(j) ~ p(k) stellen die paarweisen Abstand beteen Punkte j und k
p(i) ist der Mittelpunkt der cluster-iff p(i) s verwendet.t. min[sum(p(j)~p(k))] für 0 < j,k <= n, wo wir n Punkte im cluster - bestimmen, wie die Aufteilung der cluster in zwei Cluster aufgeteilt, sobald die Anzahl der Datenpunkte im cluster geht über eine Schwelle t.
Diesem nicht-euklidischen Raum. Aber die Entfernungen lassen sich wie folgt zusammenfassen - p(i), Punkt i:
p(1) p(2) p(3) p(4) p(5) p(6) p(7) p(8) p(9) p(10)
p(1) 0 2 1 3 2 3 3 2 3 4
p(2) 2 0 1 3 2 3 3 2 3 4
p(3) 1 1 0 2 0 1 2 1 2 3
p(4) 3 3 2 0 1 2 3 2 3 4
p(5) 2 2 1 1 0 1 2 1 2 3
p(6) 3 3 2 2 1 0 3 2 3 4
p(7) 3 3 2 3 2 3 0 1 2 3
p(8) 2 2 1 2 1 2 1 0 1 2
p(9) 3 3 2 3 2 3 2 1 0 1
p(10) 4 4 3 4 3 4 3 2 1 0
Wie würde ich berechnen, was ist der Mittelpunkt dieser cluster?
- Bitte definieren Sie "center cluster"
- Nifle - getan ... habt Ihr Ideen
- Die Anwendung hat zu tun mit clustering-Konzepte - meine Anwendung ist ein semantisches Daten speichern - die Punkte stellen abstrakte Objekte. Ich will cluster von Objekten feststellen zu können "Konzepte"
- Meinst du das: wählen Sie ich, minimiert [sum(p(i)~p(j)] für 0 < j <= n, so dass p(i) ist das Zentrum? Wenn dem so ist, denke ich, dass deine Antwort zu Teil 1; sonst bin ich nicht sicher, was du meinst.
- in Worten, wir wollen eine Minimierung der paarweisen Distanzen für alle Paare von Punkten in einem cluster. Der Punkt gibt die minimale ist der Mittelpunkt.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Soweit ich das verstanden habe sieht es wie K-Means-Clustering, und das, was Sie suchen, ist in der Regel bekannt als "Medoids'.
Ich kann mich über zu haben, der Schauder, der kommt nur vor der Anzeige völlige Dummheit. Aber nicht diese Rendite leicht zu brute-force? In Python:
a)
b)
keine Idee für heute..
vielleicht für jedes p, finden Sie die Maschine näher.
durch diese Logik erstellen Sie ein Diagramm.
als irgendwie (noch habe ich keine Ahnung) unterteilen das Diagramm
Was Sie zu tun versuchen, oder zumindest (b) gehört zur Cluster-Analyse. Ein Zweig der Mathematik /Statistik /ökonometrie, wo Datenpunkte (z.B. Punkte im n-dimensionalen Raum) sind geteilt in Gruppen oder Cluster. Wie Sie dies tun, ist keine triviale Frage, es gibt viele, viele Möglichkeiten.
Lesen Sie mehr auf der wikipedia-Artikel zu Clusteranalyse.