Kann ich mit autoencoder für clustering?

In den folgenden code, verwenden Sie autoencoder als überwachtes clustering, Klassifikation, weil Sie Daten Etiketten.
http://amunategui.github.io/anomaly-detection-h2o/
Aber, kann ich mit autoencoder zu cluster-Daten wenn ich Sie nicht haben Ihre Etiketten.?
Hinsichtlich

InformationsquelleAutor forever | 2016-11-24

6

Den deep-learning-autoencoder ist immer unüberwachtes lernen. Die "betreute" Teil des Artikels, den Sie verlinken, ist die Bewertung, wie gut es Tat.

Folgende Beispiel (entnommen aus ch.7 mein Buch, Praktische Maschine Lernen mit H2O, wo ich versuche alle H2O-unüberwachte algorithmen, die auf denselben Daten - bitte entschuldigen Sie den Stecker) nimmt 563 Funktionen, und versucht zu codieren, Sie in nur zwei versteckten Knoten.
```
m <- h2o.deeplearning(
  2:564, training_frame = tfidf,
  hidden = c(2), auto-encoder = T, activation = "Tanh"
  )
f <- h2o.deepfeatures(m, tfidf, layer = 1)
```
Der zweite Befehl gibt, extrahiert die versteckten Knoten GEWICHTE. f ist ein Daten-frame, mit zwei numerischen Spalten und eine Zeile für jede Zeile in der tfidf Quelle Daten. Ich wählte nur zwei versteckten Knoten, so dass ich konnte plot der Cluster:

Suchergebnisse ändern sich bei jedem Lauf. Sie können (vielleicht) bessere Ergebnisse mit gestapelten auto-Encoder, oder mit mehr versteckten Knoten (aber dann sind Sie nicht zeichnen können, Sie). Hier fühlte ich die Ergebnisse wurden begrenzt durch die Daten.

BTW, habe ich die obige Darstellung mit diesem code:
```
d <- as.matrix(f[1:30,]) #Just first 30, to avoid over-cluttering
labels <- as.vector(tfidf[1:30, 1])
plot(d, pch = 17) #Triangle
text(d, labels, pos = 3) #pos=3 means above
```
(P. S. Die original-Daten stammen Brandon Rose ' s ausgezeichneten Artikel mit NLTK. )
- Danke, Dirk, für diese Erklärung das. Wenn ich mehr als zwei versteckte Schichten, wie kann ich die Darstellung der Ergebnisse? Danke
- Sie könnten hidden = c(32,2,32), Bedeutung 32 Neuronen, dann 2, dann wieder auf 32. Anschließend extrahieren Sie die mittlere Schicht, mit f <- h2o.deepfeatures(m, tfidf, layer = 2)
- Wie kann ich wissen, ob ich die richtigen Parameter?. Wie kann ich den plot der Fehler vs Epochen?
- Re: "Recht-Parameter". Neuronales Netz-tuning fühlt sich an wie mehr Kunst als Wissenschaft 🙂 Einfach weiter Experimentieren (h2o ' s raster kann helfen). Re: "plot-Fehler vs. Epochen". Blick auf die Partitur der Geschichte (es ist ein fertiges Diagramm in das Flow-UI, oder Sie rufen die Daten mit h2o.scoreHistory(m).)
- Wir haben ein Beispiel für die Verwendung der Rauschunterdrückung Autoencoder und Gestapelt Autoencoder?
- I berühren Sie im Kontext von H2O, in diesem blog-post: darrendev.blogspot.co.uk/2016/10/... sowie in dem Buch.
- Durch die Art und Weise, stackoverflow zu halten versucht jede Frage und jede Antwort sehr deutlich. Verwenden Sie Kommentare für die Klärung, aber wenn Sie weitere Fragen haben, ist es meist besser, zu Fragen, Sie als neue Fragen. (Und wenn Sie glücklich sind, diese Antwort beantwortet deine ursprüngliche Frage, bitte geben Sie die Zecke - dann sind beide Ruf auf die Website gehen.)
- Ich werde es tun, Mr. Darren. Ich einfach ma neue für die Stackoverflow-Welt. Danke
- Darren, ich trage deinen code in mein dataset und endlich kann ich zwei Cluster. Aber warum wenn ich den autoencoder, bekam ich unterschiedliche Ergebnisse, Gruppen oder jeder Zeit, auch habe ich keine änderungen an den Parametern?. Prostata.dl = h2o.deeplearning(x = feature_names, training_frame = Prostata.hex, autoencoder = TRUE hidden = c( 2 ), Epochen = 600, - Aktivierung = "Tanh" ), Wenn ich reproduzierbare = T,seed=1, ich habe das gleiche Cluster. Danke
- Ich glaube, du hast selbst die Antwort: "deep learning ist nicht-deterministisch, es sei denn, Sie beschränken es auf einen single-core mit reproduzierbaren (und legen Sie einen Samen).
- So, wie in der Regel in der Tiefe lernen Sie mit den Ergebnissen zufrieden, wenn Sie nicht produzieren können, Sie natürlich?
- Ich versuche zu Plotten die Fehlermeldung v. s ephochs mittels:plot(Prostata.dl,Zeitschritt = "Epochen",metric = "rmse"), Aber ich bekam die folgende Fehlermeldung: Fehler im plot.H2OModel(Prostata.dl, Zeitschritt = "Epochen", metric = "rmse") : Muss sein: H2OBinomialModel, H2OMultinomialModel oder H2ORegressionModel
- Das sollte auf jeden Fall eine neue Frage. Versuchen Sie, und geben eine volle reproduzierbare Beispiel, dass die Menschen ausführen können. (Die iris-data-set ist gut für diese, im Fall von H2O.)
- Danke, dein Buch ist sehr interessant. Ich mag es.
- wenn du 2 Neuronen in der mittleren verdeckten Schicht (d.h. 32,2,32), ist das die gleiche wie die Einstellung der Anzahl von Clustern zu 2? Sagen, ich habe 10 Vektoren von zahlen, und ich möchte das reduzieren der Dimensionalität von Daten diese Daten und dann cluster Sie. Die "2" bezeichnen die 2-Cluster?
- Nein: es reduziert die Daten auf zwei Fließkomma-Dimensionen. Wenn Sie möchten, clustering müssen Sie entweder führen Sie kmeans auf diese beiden Dimensionen, oder verwenden Sie kmeans direkt auf den original-Daten.
InformationsquelleAutor Darren Cook
1

In einige Aspekte der Kodierung von Daten und clustering data-share einige überschneidungen Theorie. Als Ergebnis, können Sie Autoencoders zu cluster(Kodierung) der Daten.

Einem einfachen Beispiel zu visualisieren ist, wenn Sie eine Reihe von Trainingsdaten, die Sie vermuten, hat zwei Klassen. Wie-Wähler-Geschichte Daten für Republikaner und Demokraten. Wenn Sie ein Autoencoder und codieren Sie es auf zwei Dimensionen, dann zeichnen Sie es auf einen scatter-plot, dieses clustering wird mehr klar. Unten ist ein Beispiel-Ergebnis von einem meiner Modelle. Sie können sehen, eine spürbare Trennung zwischen den zwei Klassen, als auch ein bisschen erwartet überlappen.

Den code gefunden werden kann hier

Diese Methode erfordert nicht nur zwei binäre Klassen, konnten Sie auch trainieren, auf wie viele verschiedene Klassen, wie Sie wollen. Zwei polarisierte Klassen ist einfacher zu visualisieren.

Diese Methode ist nicht auf zwei begrenzt-Ausgang Abmessungen, das war nur zum Plotten Bequemlichkeit. In der Tat, können Sie finden es schwierig, sinnvoll ansehen bestimmte, große dimension Räume zu einem so kleinen Raum.

In Fällen, In denen die kodierte (gruppierten) Schicht ist größer in der dimension ist es nicht so klar zu "visualisieren" - Funktion Cluster. Dies ist, wo es wird ein bisschen schwieriger, als Sie haben, die Verwendung einer form des betreuten Lernens auf die Karte codiert(gruppierten) Funktionen, um Ihr training Etiketten.

Sind ein paar Möglichkeiten, um zu bestimmen, welche Klasse features gehören, ist die Pumpe der Daten in das knn-clustering-Algorithmus. Oder, was ich bevorzuge zu tun ist, um die codierten Vektoren und geben Sie Sie in einem standard-back-Fehler-propagation neural network. Beachten Sie, dass abhängig von Ihren Daten können Sie feststellen, dass Sie nur pumpt die Daten direkt in die back-propagation neural network ist ausreichend.
- "was ziehe ich zu tun ist, um die codierten Vektoren und geben Sie Sie in einem standard-back-Fehler-propagation neural network" - Hallo, können Sie pls arbeiten dieses oder ein Beispiel geben, das zu tun?
- Nehmen Sie die hypothetische problem, wo Sie wollen, Sie zu klassifizieren eine Reihe von Bildern als porno/nicht porno. Übernehmen die input-Bilder der Größe [500x500] (250,000 dimension Vektoren). Unsere Ausgabe wird eine 2-dimension vector: [0,1] = porno, [1, 0] nicht porn. Wie Sie sich vorstellen können ein 250.000-dimension vector ist Recht groß und enthält eine Menge Informationen. Ein logischer Erster Schritt könnte sein, den ERSTEN Zug ein autoencoder auf die Bild-Daten zu "komprimieren" werden die Bild Daten in kleinere Vektoren, oft auch als feature-Faktoren, (z.B. 250 Abmessungen), und DANN mit dem Zug die Bild-feature-Vektoren mit einem standard-back-propagation Ziffer Netzwerk.
- Der autoencoder ausgebildet feature-Vektoren im Idealfall enthalten weniger Lärm und mehr "wichtige" Informationen über die original-Bilder. Und von kleiner Größe macht es Ihnen mehr ideal/praktische Ausbildung in einem kleineren neuronale Netzwerk über so etwas wie back-Fehlerfortpflanzung, da es weniger Informationen zu filtern/zu lernen.
InformationsquelleAutor Kenny Cason

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.