Was ist der beste Algorithmus zum berechnen von den die meisten erzielte Element?
Habe ich eine Musik-Elemente, die erzielt werden, indem die Nutzer zwischen 1 bis 5, und
Ich brauche eine Formel, um die 5 am meisten scored-items.
Aber offensichtlich ein Element, das Holen 3.5 Durchschnittliche Punktzahl von 1000 verschiedenen Usern werden mehr erzielte dann ein Element thet bekommen 4.9 Durchschnittliche Punktzahl von nur 5 Usern... in anderen Worten, ich denke, dass wenn ein Element, das die Aufmerksamkeit von Menschen zu Punkten, zeigt dies, dass das Element ist interessant. also in die Berechnung der votesCount parameter muss eine Kraft haben. (wie viel macht? Ich weiß nicht sicher, und ich fragte Sie, um Ideen zu bekommen).
Ich denke, wir müssen die folgenden Parameter in der Funktion: votesAverage, votesCount.
- Ein Ort, um zu starten Lesen über diese Art von Problemen ist in der Netflix Herausforderung. Es gibt eine Tonne von nützlichen und interessanten web-posting - + - Algorithmus Beispiele den Umgang mit dieser Art der Sache.
- Sie müssen definieren, in diesem Konzept "die meisten erzielte" besser - wenn Sie nicht können, sagen Sie uns, was Sie zu erreichen hoffen mit dieser Punktzahl; das könnte geben uns eine bessere Idee von was Sie reden.
- Was ist falsch mit nur insgesamt erzielt? In deinem Beispiel ein Element wird insgesamt 3.500 und die anderen nur 24.5
- Danke, ich werde versuchen, für ihn zu suchen. @Jakob Ist es jetzt besser? @MAK bitte versuchen Sie zu verstehen.
- Gutiérrez meinem Beispiel nur um den Punkt zu machen. im Falle, dass eine 1 Durchschnitt von 1000, und die zweite 5 von 150, der zweite muss gewinnen, und t=nicht die erste
- Carlos: ein Element mit 1000 Stimmen und 1 ist besser als einer mit 100 Stimmen 5? 🙂
- Es ist erwähnenswert, dass, trotz Mendy mögen einige Antworten und andere nicht, jede Antwort (wie von 11/3/2010) ist genau das gleiche.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Weighted voting für die 5-Sterne-Systemen mit vielen Wählern
Können Sie die Bayes-Schätzungen zur Berechnung gewichteter Abstimmung.
IMDb (Internet Movie Database) verwendet, diese Berechnung zu bestimmen, dessen IMDb-Top-250. (Hinweis: die IMDb verwendet, mit 10 Sternen, aber die Formeln sind identisch mit 5 Sternen).
IMDb Referenz
Wikipedia Referenz
Den reddit-scoring-Algorithmus ist wahrscheinlich die beste Wette, wenn Sie wirklich wollen, es zu tun der richtige Weg. Es ist hier im detail erklärt und ein hohes Niveau von xkcd-Autor Randall hier.
Das problem ist, es funktioniert nicht wirklich für fünf-Sterne-Bewertungen, das ist das, was Sie für gehen. Sie sollten in der Lage sein, zu verallgemeinern reddit ist Sortieren-system zu verwenden Bewertungen. Was solls, es ist vermutlich schon irgendwo. Ich werde es zu suchen.
Einen einfachen Weg, um das Gleichgewicht des Systems ist, um eine Feste Anzahl von hypothetischen Benutzer (sagen die Zählung H), die alle Stimmen für den langfristigen Durchschnitt Ein für alle Ihre Stücke. Sagen, dass der Durchschnitt liegt bei 3; dann ist die Formel wird
Score = (votesCount x votesAverage + H x A) /(votesCount + H)
Nun, wenn votesCount wächst, die relative Wirkung der hypothetischen Durchschnitts-Wähler abnimmt.
Können Sie festlegen, H experimentell oder durch das denken ungefähr es. E. g. wenn Sie denken, dass 20 Stimmen ist ausreichend, um relativ starke Bewertung, Sie könnte H=5. Sagen.
Ich benutze für meine Musik-Dateien folgende Methode:
Bewertung gemessen wird in Prozent (0-100)
Songs, die nicht bewertet und erhalten Sie 50% als Geschenk
Jedes mal, wenn jemand Stimmen für ein Lied, das rating erhöht wird
Jedes mal, wenn jemand Stimmen gegen das Lied das rating wird um eins verringert
Wenn der song Bewertung steigt höher als MAX die 100, dann ist MAX aktuelle song-Bewertung
Wenn der song Bewertung geht unter MIN, dann MIN eingestellt ist, um song-Bewertung
Nach jeder Abstimmung, die änderungen der MIN-oder MAX-ich bin dabei-Normalisierung für jeden song in der Liste so:
NewRating = (CurrentRating - MIN) *100/(MAX -MIN) Dann bin ich Sie wieder MIN auf 0 und MAX auf 100.
Diese Methode bietet die gleiche chance für alte und neue songs um die richtige Bewertung schnell. Auch jede Abstimmung über die besten und schlechtesten song Auswirkungen andere, was ich auch überlegen, wie die Rechte Sache zu tun.
Wenn die Auswahl der Lieder zu spielen (oder zu Stimmen) ich bin die Erzeugung einer Zufallszahl im Bereich von 0-100 und der Suche nach dem nächsten song mit rating gleich oder höher als diese Zahl.
Schlechte songs gehen runter und gewählt, selten, gute songs werden rauf und gewählt werden mehr Häufig, aber ich bin noch zu verlassen, eine chance für auch schlechtesten song zu spielen(gewählt) irgendwann in der Zukunft.
Ist der Begriff für diese ist Bayes-Schätzung.
Einem gemeinsamen Beispiel:
m=0
=>Bayesian rating = R
. Und ich auf der Suche zu haltenv
in der Funktion.