Test Bedeutung der Cluster auf einem PCA-plot
Ist es möglich zu testen, die Bedeutung von Clusterbildung zwischen 2 bekannten Gruppen auf einem PCA-plot? Um zu testen, wie nah Sie sind oder die Höhe der Streuung (Varianz) und den Betrag der überlappung zwischen den Clustern etc.
InformationsquelleAutor rmf | 2013-11-28
Du musst angemeldet sein, um einen Kommentar abzugeben.
Könnte man eine PERMANOVA partition die euklidische Distanz, die durch Ihre Gruppen:
Wenn Sie wollen, um die paarweisen permanova/adonis haben Sie es code für sich selbst.
InformationsquelleAutor EDi
Hier ist eine qualitative Methode, die verwendet
ggplot(...)
zu ziehen, 95% KONFIDENZ-Ellipsen rund um Cluster. Beachten Sie, dassstat_ellipse(...)
verwendet die bivariate t-Verteilung.Produziert dies:
Vergleich von
ggdata$Clusters
undggdata$Species
zeigt, dass setosa Karten perfekt zu cluster 1, während versicolor dominiert cluster 2 und virginica dominiert cluster 3. Allerdings gibt es erhebliche überschneidungen zwischen den Clustern 2 und 3.Dank Etienne Low-Decarie für dieses posting sehr nützliche Ergänzung
ggplot
auf github.InformationsquelleAutor jlhoward
Hy, nach zu sehen, dass prcomp Plotten kann sehr zeitaufwendig sein, basierend auf der Arbeit von Etienne Low-Decarie geschrieben von jlhoward, und das hinzufügen von Vektor Plotten von envfit{vegan} Objekte (Dank Gavin Simpson). Ich habe dafür eine Funktion zu erstellen ggplots.
Und als ein Beispiel, mit data(varespec) data(varechem), beachten Sie, dass varespec umgesetzt, um zu zeigen, Abstand zwischen den Arten:
InformationsquelleAutor Adrià
Ich habe zwei gefunden die Entfernungen zu repräsentieren, was Sie sehen, auf einer PCA-plot in zahlen.
Mahalanobis-Distanz:
Bhattacharyya-Abstand:
Messen, Signifikanz zwischen den Clustern
InformationsquelleAutor rmf