Berechnen der statistischen Signifikanz mit Excel
Ich habe 2 Spalten und mehrere Zeilen von Daten in excel. Jede Spalte repräsentiert einen Algorithmus, und die Werte in den Zeilen sind die Ergebnisse dieser algorithmen mit verschiedenen Parametern. Ich möchte, um statistische Signifikanz-test der beiden algorithmen mit excel. Kann jemand empfehlen eine Funktion?
Als ein Ergebnis, es wird nett sein, um etwas wie "Algorithmus A führt 8% besser als Algorithmus B mit .9 Wahrscheinlichkeit (und 95% Konfidenzintervall)"
Den wikipedia-Artikel erklärt genau, was ich brauche:
http://en.wikipedia.org/wiki/Statistical_significance
Es scheint wie eine sehr einfache Aufgabe, aber ich konnte nicht finden, eine wissenschaftliche Messung-Funktion.
Jede Beratung über eine integrierte Funktion von excel oder Funktion snippets sind geschätzt.
Dank..
Edit:
Nach tharkun ' s Kommentare merkte ich, sollte ich klären, einige Punkte:
Die Ergebnisse sind lediglich reelle zahlen zwischen 1-100 (Sie sind prozentuale Werte). Da jede Zeile steht für verschiedene parameter Werte in einer Zeile steht ein Algorithmus das Ergebnis für diesen parameter. Die Ergebnisse hängen nicht von einander.
Wenn ich der Durchschnitt aller Werte für einen Algorithmus A und Algorithmus B, ich sehe, dass der Mittelwert aller Ergebnisse, die der Algorithmus produziert, sind 10% höher ist als Algorithmus B ist. Aber ich weiß nicht, ob dieser statistisch signifikant ist oder nicht. In anderen Worten, vielleicht für den ein-parameter-Algorithmus erzielt 100 Prozent höher ist als Algorithmus B und für den rest Algorithmus B hat höhere Werte, aber nur, weil dieses Ergebnis, das der Unterschied im Durchschnitt bei 10%.
Und ich will diese Berechnung mit excel.
InformationsquelleAutor someone | 2009-08-05
Du musst angemeldet sein, um einen Kommentar abzugeben.
Danke für die Klarstellung. In diesem Fall Sie wollen eine unabhängige Stichproben T-Test. Bedeutung, die Sie vergleichen möchten, und die Mittel von zwei unabhängigen Datensätzen.
Excel-Funktion TTEST, das ist, was Sie brauchen.
Für dein Beispiel, sollten Sie wahrscheinlich verwenden Sie zwei Schwänzen und Typ 2.
Die Formel ausgegeben wird ein Wahrscheinlichkeits-Wert, bekannt als die Wahrscheinlichkeit des alpha-Fehlers. Dies ist der Fehler, die Sie machen würde, wenn Sie davon ausgegangen, die zwei Datensätze sind unterschiedlich, aber Sie sind es nicht. Je niedriger der alpha-Fehler-Wahrscheinlichkeit, desto höher die chance, dass deine Sätze sind unterschiedlich.
Sollten Sie akzeptieren nur die Differenz der zwei Datensätze, wenn der Wert niedriger als 0,01 (1%) oder für die kritischen Ergebnisse auch auf 0,001 oder weniger. Sie sollten auch wissen, dass in den t-test muss mindestens 30 Werte pro Datensatz zuverlässig genug sind und dass der Typ-2-test nimmt gleich Varianzen der beiden Datensätze. Wenn alle die gleiche Varianz nicht gegeben sind, sollten Sie die Typ-3-test.
http://depts.alverno.edu/nsmt/stats.htm
Nein, tut es nicht. was würde besser werden, in Ihrem Fall?
Wenn die Werte unter eine Spalte höher sind als die Werte, die unter den anderen. Also ich sollte in der Lage sein zu sagen "der Algorithmus A hat 10% höhere Werte als Algorithmus B mit .9 Wahrscheinlichkeit"
aber das ist einfach. berechnen Sie den Mittelwert jeder Spalte. der ttest vergleicht die beiden bedeutet. so kann man sagen, über die höheren bedeutet, dass diese Spalte hat wesentlich höhere Werte als die anderen.
InformationsquelleAutor markus