scipy Verbindungsformat
Ich geschrieben habe, meine eigenen clustering-routine und würde gerne erzeugen ein das dendrogramm. Der einfachste Weg, dies zu tun wäre die Verwendung von scipy das dendrogramm Funktion. Allerdings erfordert dies die Eingabe im gleichen format, das von scipy linkage-Funktion produziert. Ich kann nicht finden, ein Beispiel, wie die Ausgabe formatiert wird. Ich Frage mich, ob jemand kann mich aufklären.
InformationsquelleAutor der Frage geo_pythoncl | 2012-03-23
Du musst angemeldet sein, um einen Kommentar abzugeben.
Dies ist aus der scipy.cluster.Hierarchie.Gestänge() Funktion Dokumentation, ich denke, es ist eine ziemlich klare Beschreibung der für das Ausgabe-format:
Benötigen Sie etwas mehr?
InformationsquelleAutor der Antwort dkar
Ich Stimme mit https://stackoverflow.com/users/1167475/mortonjtdass die Dokumentation nicht vollständig erklären, die Indizierung von intermediate-Cluster, während ich nicht einverstanden mit der https://stackoverflow.com/users/1354844/dkar , das format ist ansonsten genau erklärt.
Mithilfe der Beispiel-Daten aus dieser Frage: Tutorial für scipy.cluster.Hierarchie
Einem Verknüpfungs-matrix kann mit Hilfe der single (ich.e, die nächste matching-Punkte):
Als die Dokumentation erläutert die Cluster unten n (hier: 11) sind einfach die Daten, die Punkte in der ursprünglichen matrix A. Die intermediate-Cluster in der Zukunft indiziert werden sukzessive.
So, Cluster 7 und 9 (die ersten Zusammenführen) zusammengeführt werden, die in cluster 11 Cluster 4 und 6 in 12. Dann beobachten, Zeile drei, verschmelzenden Cluster 5 (A) und 12 (aus dem nicht-gezeigten intermediate cluster 12) mit einer daraus resultierenden Binnen-Cluster-Abstand (WCD) von 0,5. Die einzelne Methode mit sich bringt, dass die neuen WCS ist 0,5, das ist die Entfernung, die zwischen Einer[5] und der nächste Punkt in cluster 12, [4] und[6]. Let ' s check:
Diesem cluster soll nun intermediate cluster 13 auf, die anschließend zusammengeführt werden[2]. So, die neue Strecke sollte das nächste zwischen den Punkten[2] und[4,5,6].
Welche, wie man sehen kann auch Prüfungen aus, und erläutert die intermediate-format neuer Cluster.
InformationsquelleAutor der Antwort user1603472
Den scipy Dokumentation ist genau wie dkar wies darauf hin, ... aber es ist ein bisschen schwer zu drehen, um die zurückgegebenen Daten in etwas, das brauchbar ist für die weitere Analyse.
Meiner Meinung nach sollten Sie umfassen die Fähigkeit, um die Daten zurück, die in einem Baum wie Struktur der Daten. Der folgende code wird Durchlaufen der matrix und bauen einen Baum:
InformationsquelleAutor der Antwort Salik Syed