support vector machines - eine einfache Erklärung?
So, ich bin versuchen zu verstehen, wie der SVM-Algorithmus funktioniert, aber ich kann einfach nicht herausfinden, wie, verwandeln Sie einige Datensätze in der Punkte des n-dimensionalen Ebene, hätte eine mathematische Bedeutung zu trennen, um die Punkte durch eine hyperplane und clasify Sie.
Gibt es ein Beispiel hier, die Sie versuchen zu clasify Bilder von Tigern und Elefanten, Sie sagen "Wir digitalisieren Sie in 100x100 pixel-Bilder, so haben wir x in n-dimensionalen Ebene, wo n=10,000", aber meine Frage ist, wie transformieren Sie die Matrizen, die tatsächlich repräsentieren nur einige Farb-codes IN Punkten, die einen methematical Bedeutung, um clasify Sie in 2 Kategorien?
Wohl jemand erklären kann, mir diese in ein 2D-Beispiel, da jede grafische Darstellung, ich sehe, es ist nur 2D, nicht nD.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Die kurze Antwort ist: Sie nicht, transformieren Sie die Matrizen, sondern behandeln jedes element in der matrix als eine dimension (im machine-learning-jedes element aufgerufen werden würde, eine Funktion).
Daher müssen Sie sich klassifizieren Elemente mit 100x100 = 10000 Eigenschaften jeder. In der lineare SVM Fall, so tun Sie das mit einem hyperplane, das teilt die 10.000-dimensionalen Raum in zwei unterschiedliche Regionen.
Längere Antwort wäre:
Betrachten Sie Ihre 2D-Fall. Nun, Sie wollen, um zu trennen, eine Reihe von zwei-dimensionalen Elementen. Dies bedeutet, dass jedes element der Menge kann mathematisch beschrieben werden als ein 2-Tupel, nämlich: e = (x1, x2). Zum Beispiel, in Ihre Figur, etwas voll Punkten könnte: {(1,3), (2,4)}, und einige der hohlen könnte {(4,2), (5,1)}. Beachten Sie, dass, um Sie zu klassifizieren mit einem lineare Klassifikatoren, benötigen Sie einen 2-dimensionalen linearen Klassifizierer, die sich ergeben würde eine entscheidungsregel, die könnte wie folgt Aussehen:
Beachten Sie, dass der Klassifikator ist lineare, wie es ist, eine lineare Kombination der Elemente von e. Die 'w' s und heißt 'GEWICHTE' und 'C' ist die Entscheidung, die Schwelle. eine lineare Funktion mit 2-Elemente wie oben, ist einfach eine Linie, das ist der Grund, warum in Ihren Figuren die H ' s sind Linien.
Nun, zurück zu unserer n-dimensionalen Fall, können Sie wahrscheinlich unsere Abbildung, die einer Zeile wird nicht den trick tun. Im 3D-Fall müssen wir ein Flugzeug: (w1 * x1 + w2 * x2 + w2 * x3) > C, und in den n-dimensionalen Fall, wäre eine hyperplane: (w1 * x1 + w2 * x2 + ... + wn * xn) > C, das ist verdammt schwer vorstellen, nicht weniger zu zeichnen :-).