scikit-learn, wie zu wissen, Dokumente im cluster?

Ich bin neu sowohl python und scikit-learn, also bitte Geduld mit mir.

Nahm ich den source code für die k-means-clustering-Algorithmus von k-means-clustering.

Habe ich dann geändert, um auf meinem lokalen mittels load_file Funktion.

Obwohl der Algorithmus beendet, aber es erzeugt keine Ausgabe, wie die Dokumente gruppiert werden, zusammen.

Fand ich, dass die km Objekt "km.label" array der Listen der Schwerpunkt-id des jeweiligen Dokuments.

Es hat auch die centroid-Vektor mit "km.cluster_centers_"

Aber was für ein Dokument ist es ? Ich habe um die Karte zu "dataset", die einen "Haufen" - Objekt.

Wenn ich drucken dataset.Daten[0], bekomme ich die Daten der ersten Datei, die ich denke, sind gemischt. aber ich will nur den Namen wissen.

Ich bin verwirrt Fragen, wie wird das Dokument im dataset.Daten[0] ist clusterd zu centoid bei km.label[0] ?

Mein grundlegendes problem ist, herauszufinden, welche Dateien gebündelt sind.
Wie finden Sie das ?

  • Stellen Sie sicher, zu überprüfen, ob die Ergebnisse sinnvoll sind. K-means wird oft zurück, Ergebnisse, mathematische optimas, aber überhaupt nicht hilfreich für das eigentliche problem bei der hand!
InformationsquelleAutor Ashish Negi | 2013-07-22
Schreibe einen Kommentar