Wie man einen Film recommender system?
- Was ist der beste Ansatz?
- Was sind die algorithmen, die benutzt werden? Was sind Ihre stärken und Schwächen?
- Warum aktuelle Film-recommender-Systeme Versagen bei der Bereitstellung von gute Empfehlungen?
- wahrscheinlich webmasters.stackexchange.com ist der bessere Ort für diese Antwort
- Kann ich wissen, warum?
- "Warum haben die meisten Film-recommender-Systeme saugen?" klingt nicht wie eine Frage der Programmierung. vielleicht bin ich nicht Recht webmasters.stackexchange.com
- Es ist nicht beantwortbar Frage an alle. Bitte nicht dump es auf einer anderen Website.
- Nur weil Sie nicht wissen, die Antwort nicht auf diese Frage unmöglich zu beantworten. Wenn Es nicht geeignet für Stack-Überlauf, kann ich verstehen. Ich kann nicht erkennen, warum, obwohl es ein algorithmisches problem schließlich.
- Diese Frage ist viel, viel zu breit. Lesen Sie auf der NetFlix prize und klassifikationssystemen in allem, und Fragen Sie dann gezielt Fragen. Diese Frage ist ähnlich der Frage "ich will, dass mein computer mit mir zu reden in Englisch. Wie mache ich es?"
- Werfen Sie einen Blick auf Filmaster ist open-source-Film recommendation engine. Es nutzt die kollaborative Filterung-Algorithmus mit matrix-Faktorisierung und eine niedrig-Rang matrix-approximation techique. Es ist dokumentiert auf der Projekt-wiki: filmaster.org/display/DEV/New+Empfehlung+Motor und Sie können den C++ - Quellcode, gibt es auch.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Dies ist eine sehr offene Frage, die beinhaltet eine Menge verschiedener Konzepte.
Als die erste Diskussion Stelle, sollten die k-nearest neighbor Algorithmus. Es ist weit verbreitet in ähnliche Probleme, wie Sie Ihren Film auszuwählen. Ein großes problem mit diesem Algorithmus ist der menschliche input bei der Entscheidung, wie viele Dimensionen, die Sie verwenden, um das segment den feature-Raum und die Wahl der Eigenschaften jeder dieser Dimensionen, so dass jeder Mehrwert, anstelle der Duplizierung der Wert der anderen dimension.
Direkt mit der k-NN-Algorithmus ist das Feld der cluster-Analyse. Wenn Sie Daten Plotten Punkte für Informationen, Klumpen innerhalb mehr einzelne "Ausreißer" können Sie intuitiv sehen, dass es irgendeine Art von ähnlichkeit, die aufgehäuften Punkte. Sie können in der Lage sein zu gruppieren einige der verstreut Ausreißer mit der einen oder anderen Klumpen, aber es gibt viele Punkte, die liegen zwischen Klumpen, die passen könnte mit zwei oder mehr konkurrierenden Klumpen. Der einzige Weg, dies zu beheben dilemma ist, fügen Sie weitere Parameter, um Ihre Daten Punkte, so dass diejenigen, die kein commit Ausreißer werden gezogen, um ein Büschel. (Folgen Sie dem link, um zu sehen, ein schönes Bild von aufgehäuften Daten).
Diese kurze Einleitung führt zum nächsten Begriff: Mustererkennung. Dieses Thema ist Mathematik-schwer und das Thema der viel Forschung in den Bereichen Theoretische informatik, Statistik, Künstlicher Intelligenz, Machine-Learning, und Hellsehen. Das Letzte ist ein halb-Witz, aber es zeigt den Kern des Problems: Wie kann ein computer Vorhersagen, was Sie in Zukunft tun wird? Die kurze Antwort ist, dass es nicht geht. Die längere Antwort versucht zu erklären, warum Ihre Vorlieben und Stimmungen wechseln in scheinbar zufällige Richtungen in scheinbar zufälligen Zeiten. Eine gute pattern-recognition-system kann pick 20 Filme, die Sie wirklich genießen und empfehlen dann noch einer aus der gleichen Gruppe, dass die anderen 20 haben, gründlich zu hassen. Wo hast das system nicht? War es in der algorithmen-Implementierung, die anfängliche Auswahl von Parametern für die Abmessungen der feature-Raum, oder haben Ihr Profil Durcheinander geraten ist, weil jemand anderes verwendet Ihr Netflix Konto, um 'Howard die Ente', 'Kreuzfahrt' und 'Strände'?
Die wikipedia-Seite für "Pattern-Recognition" - Listen, viele verschiedene algorithmen und Methoden. Sie können anfangen zu Lesen gibt, um einen besseren Griff auf die individuellen stärken und Schwächen. Sie könnten auch versuchen, diese Frage in der Theoretische Informatik stack zu Holen Sie sich die langhaarigen Antworten.
Einem team von BellKor gewann die Netflix Prize. So, wohl, kann dieser Ansatz den besten Ansatz.
Geben, um ein high-level, intuitive Erklärung dafür, wie diese Empfehlung Systemen arbeiten, betrachten Sie die folgende situation. Ich gucke Star Wars zweimal in der Woche. Nun, wenn Sie hatte zu empfehlen, ein Film den ich mir gerne, welchen Film würdest du wählen? Ein Film mit Harrison Ford? Ein sci-fi-Film? Vielleicht einen Film in den 80er Jahren gemacht?
Die große Idee hinter der Empfehlung Systemen ist, dass die mehr Sie wissen, was Sie mögen (d.h. was für genres, Schauspieler, etc), desto bessere Empfehlungen können Sie geben.
Allerdings, wenn Ihrem Geschmack widersprechen einander (z.B. Sie lieben, Saving Private Ryan, aber auch Liebe Filme über Pazifisten), dann wird es schwer zu empfehlen, einen Film für Sie.
Kurz gesagt, viele empfehlungsalgorithmen wissen müssen: