Das betreute Lernen, (ii) Unüberwachtes Lernen, (iii) Verstärkung Lernen

Ich bin neu in Machine learning. Beim Lesen über Überwachtes Lernen, Unüberwachtes Lernen, Reinforcement Learning stieß ich auf eine Frage weiter unten und verwirrt. Bitte helfen Sie mir bei der Identifizierung in weniger als drei, welche ein Überwachtes Lernen, Unüberwachtes Lernen, Reinforcement learning.

Welche Arten des Lernens, wenn überhaupt, beschreiben am besten die folgenden drei Szenarien:

(i) Eine Münze classification system erstellt für Sie einen Automaten. Um dies zu tun,
die Entwickler erhalten exakt die Münze, die Spezi Kationen von der US Mint und ableiten
ein statistisches Modell, der Größe, des Gewichts und der Bezeichnung, welche die Automaten -
Maschine dann verwendet, um zu klassifizieren, seine Münzen.

(ii) Anstelle von aufrufen der US-Mint zu erhalten, Münze, Informationen, ein Algorithmus ist
präsentiert sich mit einer großen Menge von beschrifteten Münzen. Der Algorithmus verwendet diese Daten, um
ableiten Entscheidung, die Grenzen, die der Automat dann verwendet, um zu klassifizieren, seine
Münzen.

(iii) Ein computer entwickelt eine Strategie für das spielen von Tic-Tac-Toe-spielen immer wieder
und Anpassung der Strategie durch Bestrafung bewegt, führen Sie schließlich zu verlieren.

Das klingt nach Hausaufgaben. Wenn es ist, es sollte wenigstens gekennzeichnet werden, entsprechend.
a1.phobos.apple.com/us/r30/CobaltPublic/v4/bd/c2/2a/...
die Hausaufgaben-tag ist veraltet.
Es war nicht, als ich gepostet diese vor 2,5 Jahren.

InformationsquelleAutor user2201536 | 2013-04-03

artificial-intelligence machine-learning

3

(i) unüberwachtes lernen - wie nicht gelabelte Daten verfügbar

(ii) betreute lernen - wie Sie bereits gelabelte Daten verfügbar

(iii) - reinforcement learning - ist, wo Sie lernen und umlernen auf der Grundlage der Aktionen und die Auswirkungen/Chancen aus, dass Aktionen.

(ii) "ein Algorithmus wird vorgestellt, mit einer großen Menge von mit Münzen"
(i) nicht unbeaufsichtigt: die wahre Verteilung der Daten bekannt ist. Dies bedeutet, können Sie die Bayes-optimale entscheidungsregel. Keine gelabelte Daten -> unbeaufsichtigt ist zu simpel, in der Regel, ich denke, die richtige Antwort "keiner der genannten". Zu sein, unbeaufsichtigt, Sie hätten vorgelegt werden mit ein paar Münzen, aber keine Informationen, welche Instanzen gehörte zu dem Typen.
Vereinbart, aber wenn nur eine Methode gewählt werden, aus drei Methoden gegeben, ich denke, es sollte unüberwachtes lernen, da es keine Informationen in der hand leicht (Etiketten)
Im RL wird Ihnen mitgeteilt, ob das Ergebnis gut oder schlecht ist, aber nicht die Antwort.

InformationsquelleAutor marc
2

Lassen Sie uns sagen, Sie haben dataset dargestellt als matrix X. Jede Zeile in X ist eine Beobachtung (Beispiel) und jede Spalte repräsentiert bestimmte variable (Merkmal).

Wenn Sie auch haben (und benutzen) Vektor y Etiketten, entsprechende Beobachtungen, dann ist dies eine Aufgabe, betreute lernen. Es gibt "supervisor" engagiert, sagt, dass die Beobachtungen gehören zu der Klasse #1, die zu der Klasse #2, usw.

Wenn Sie nicht über Etiketten für Bemerkungen, dann haben Sie die Entscheidung auf der Basis der X dataset selbst. Zum Beispiel, in dem Beispiel mit Münzen, die Sie aufbauen können Modell der Normalverteilung, die für die Münze Parameter und erstellen system signalisiert, wenn die Münze hat eine ungewöhnliche Parameter (und damit möglicherweise versuchter Betrug). In diesem Fall Sie don ' T haben jede Art von Vorgesetzten, die sagen würde, was Münzen sind ok und was repräsentieren Betrug Versuch. So ist es unüberwachtes lernen Aufgabe.

In 2 vorherigen Beispielen, die man zunächst geschult, Ihr Modell und dann wird es verwendet, ohne weitere änderungen am Modell. In reinforcement learning Modell kontinuierlich verbessert, basierend auf verarbeiteten Daten und dem Ergebnis. Zum Beispiel Roboter, der versucht einen Weg zu finden, von Punkt A zu Punkt B kann zunächst berechnen Sie die Parameter der zu bewegen, dann bei gedrückter Umschalttaste auf diesen Parametern basiert, dann analysieren Sie neue position-und update-Parameter bewegen, so dass der nächste Schritt wäre genauer (solange wiederholen, bis man Punkt B).

Basierend auf diesem, bin ich mir ziemlich sicher, dass Sie werde in der Lage sein zu finden, eine Entsprechung zwischen diesen 3 Arten des Lernens und Ihre Elemente.

das betreute lernen

InformationsquelleAutor ffriend
0

In überwachten algorithmen, die Klassen sind vorgegeben. Diese Klassen gedacht werden kann als eine endliche Menge, die zuvor ankamen, von einem Menschen. In der Praxis, ein bestimmtes segment der Daten gekennzeichnet werden, die mit diesen Klassifikationen. Die Maschine Lernenden Aufgabe ist die Suche nach mustern und konstruieren mathematische Modelle. Diese Modelle werden dann ausgewertet, auf der Grundlage Ihrer prädiktiven Kapazität in Bezug auf Maßnahmen der Varianz in den Daten selbst. Viele der Methoden auf die in der Dokumentation (der Entscheidungsbaum-Induktion, naive Bayes, usw.) sind Beispiele für überwachtes lernen von Techniken.

Unüberwacht Lernenden sind nicht mit Klassifizierungen. In der Tat, die grundlegende Aufgabe des unüberwachten Lernens ist die Entwicklung von Klassifizierungs Etiketten automatisch. Unüberwachte algorithmen suchen, die ähnlichkeit zwischen den Stücken von Daten, um festzustellen, ob Sie kann charakterisiert werden als die Bildung einer Gruppe. Diese Gruppen werden als Cluster, und es gibt eine ganze Familie von clustering, machine learning-Techniken.

Gute Erklärung, aber du bist fehlt reinforcement learning.

InformationsquelleAutor Arif Hussain
0

Schrieb ich einen Artikel über Perceptron für Anfänger. Ich habe erklärt, das Betreute Lernen mit der Delta-Regel. Auch beschrieben Unüberwachtes Lernen und Reinforcement Learning (in Kürze). Sie können überprüfen, wenn Sie interessiert sind.

"Ein Intuitives Beispiel eines Künstlichen Neuronalen Netzes (Perceptron) die Erkennung von Autos /Fußgänger von einem Selbst gefahrenen Auto"

https://www.spicelogic.com/Blog/Perceptron-Artificial-Neural-Networks-10

InformationsquelleAutor Emran Hussain

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.