Kruskal-Wallis-test mit details über paarweise Vergleiche
Die standard-stats::kruskal.test-Modul ermöglicht eine Berechnung der kruskal-wallis-test auf einem Datensatz:
>>> data(diamonds)
>>> kruskal.test(price~carat, data=diamonds)
Kruskal-Wallis rank sum test
data: price by carat by color
Kruskal-Wallis chi-squared = 50570.15, df = 272, p-value < 2.2e-16
Dies ist richtig, es ist mir eine Wahrscheinlichkeit, dass alle Gruppen in den Daten haben den gleichen Mittelwert.
Allerdings würde ich gerne die details für jedes paar ein Vergleich, wie wenn Diamanten der Farben D und E haben den gleichen Mittelwert Preis, wie einige andere softwares tun (SPSS), wenn Sie Fragen, für einen test Kruskal.
Habe ich gefunden kruskalmc aus dem Paket pgirmess die mir erlaubt, zu tun, was ich tun will:
> kruskalmc(diamonds$price, diamonds$color)
Multiple comparison test after Kruskal-Wallis
p.value: 0.05
Comparisons
obs.dif critical.dif difference
D-E 571.7459 747.4962 FALSE
D-F 2237.4309 751.5684 TRUE
D-G 2643.1778 726.9854 TRUE
D-H 4539.4392 774.4809 TRUE
D-I 6002.6286 862.0150 TRUE
D-J 8077.2871 1061.7451 TRUE
E-F 2809.1767 680.4144 TRUE
E-G 3214.9237 653.1587 TRUE
E-H 5111.1851 705.6410 TRUE
E-I 6574.3744 800.7362 TRUE
E-J 8649.0330 1012.6260 TRUE
F-G 405.7470 657.8152 FALSE
F-H 2302.0083 709.9533 TRUE
F-I 3765.1977 804.5390 TRUE
F-J 5839.8562 1015.6357 TRUE
G-H 1896.2614 683.8760 TRUE
G-I 3359.4507 781.6237 TRUE
G-J 5434.1093 997.5813 TRUE
H-I 1463.1894 825.9834 TRUE
H-J 3537.8479 1032.7058 TRUE
I-J 2074.6585 1099.8776 TRUE
Jedoch, dieses Paket ermöglicht nur eine kategorische variable (z.B. ich kann nicht, studieren Sie die Preise gruppierten, die durch Farbe und von carat, wie ich es machen kann mit dem kruskal.test), und ich weiß nichts über die pgirmess Paket, ob es eingehalten wird oder nicht, oder wenn es getestet wird.
Können Sie mir empfehlen ein Paket zum ausführen der Kruskal-Wallis-test gibt details, die für jeden Vergleich? Wie würdest du das problem umgehen?
kruskal
Funktion in agricolae
Paket. Man könnte prüfen, ob Ihren Bedürfnissen passt.Offensichtlich meinst du kruskal.test (ohne den zweiten .- test). Ich denke, Sie sind mit Diamanten dataset von ggplot2-Paket. Gut, ich kann nicht herausfinden, warum, aber wenn ich versuche es zu laden bekomme ich eine Fehlermeldung
internal error -3 in R_decompress1 In addition: Warning message: restarting interrupted promise evaluation
. (Ich weiß, das sieht aus wie eine Frage, die ich posten sollte, aber hat jemand vor dem gleichen problem?)Marek: ich danke Ihnen sehr. Ich sah agricolae, aber es scheint das gleiche problem wie pgirmess 🙁 @gd047: ich habe keine Ahnung, was Ihre Fehler sein mögen, wirklich. Vielleicht sollten Sie versuchen, neu zu installieren ggplot2. Sie haben den gleichen Fehler mit anderen Datenbeständen oder Pakete?
Ich Frage mich nur, was macht Sie glauben, dass
kruskal.test
umgehen kann mehr als eine Gruppierung der Variablen. Es ist ein one-way-test, nachdem alle. Wenn Sie wollen, schauen alle Kombinationen von zwei Faktoren ab, erstellen Sie einfach eine neue Kombination mit interaction
.InformationsquelleAutor dalloliogm | 2010-03-19
Du musst angemeldet sein, um einen Kommentar abzugeben.
Einen anderen Ansatz, neben dem kruskal::agricolae erwähnt von Marek, der Nemenyi-Damico-Wolfe-Dunn-test implementiert in der Hilfe-Seite für oneway_test in der Münze-Paket, das verwendet multcomp. Mit der hadley-setup und die Verringerung der B= Wert für die Ungefähre () - Funktion, so dass es endet in endlicher Zeit:
Stabile Ergebnisse auf, dass größeren Datenmenge erfordern, erhöhen den B-Wert und die Erhöhung der Benutzer die Geduld.
Jan: 2012: Es gab vor kurzem ein posting im R-Hilfe zu fordern, unerwartete Ergebnisse von dieser Methode, so daß ich weitergeleitet, die E-Mail an den Betreuer. Daneben Difford sagte, er hatte bestätigt, dass die Probleme und bot eine Alternative tests mit dem nparcomp Paket: https://stat.ethz.ch/pipermail/r-help/2012-January/300100.html
Gab es auch in der gleichen Woche ein paar andere Vorschläge, die auf rhelp für post-hoc-Kontraste KW Prüfungen:
kruskalmc vorgeschlagen von Mario Garrido Escudero und
rms::polr
gefolgt vonrms::contrasts
vorgeschlagen von Frank Harrell https://stat.ethz.ch/pipermail/r-help/2012-January/300329.htmlNov 2015: Vereinbaren Sie mit toto_tico, dass die Hilfe-Seite code der coin Paket wurde geändert in der Zwischenzeit. Die
?independence_test
Hilfe-Seite bietet nun eine multivariate-KW-test und der?oneway_test
Hilfe-Seite ist als Ersatz für Ihre frühere Umsetzung mit dem code oben usng dieindependence_test
Funktion.Die oneway_test (in pkg=Münze) - Hilfe-Seite nennt diese in den code: "Nemenyi-Damico-Wolfe-Dunn-test (joint ranking) Hollander & Wolfe (1999), Seite 244 (wo die Stahl-Dwass Ergebnisse gegeben sind)" Und diese in den Referenzen: Myles Hollander \& Douglas A. Wolfe (1999). Nichtparametrische Statistische Methoden, 2. Auflage. New York: John Wiley & Sons.
Nicht Tukey-test auch davon ausgehen, Normalität und Homogenität der Varianz? Aber hier sind Sie darauf hindeutet, dass es nach einer nicht-parametrischen test (Kruskal-Wallis-Test). Darüber hinaus
oneway_test
(mit dem Monte-Carlo-aproximation, d.h.distribution = approximate(B=1000)
) ist auch nicht-parametrische. Wie kommt die Türkei ist diesem Fall so in Ordnung?Um einen paarweisen Vergleich für die Münze Paket, das
oneway_test
sollte ersetzt werden, mit derindependence_test
. Dieoneway_test
Dokumentation auch die darauf folgenden ParameterNDWD <- independence_test(dv ~ iv, data = sum_codings1, distribution = approximate(B = 10000), ytrafo = function(data) trafo(data, numeric_trafo = rank_trafo), xtrafo = mcp_trafo(iv = "Tukey"))
. Wenn Sie zeigen können, was ist der Unterschied, ich würde es wirklich schätzen.Ich sehe nicht, wo ich vorgeschlagen, mit einem Tukey-test, (ich glaube auch nicht, dass die Autoren waren entweder.). Die Verwendung von "Tukey" Stil der Kontraste wird nur angewendet, nachdem Sie mit einem Rang-transformation, wird erwartet, dass im Ergebnis eine Verteilung der Fehler, die verteilungseffekte Annahmen. Die ursprüngliche Antwort wurde am Beispiel der coin Paket zum Stand von vor 5 Jahren. Es hat In der Zwischenzeit offenbar geändert worden.
InformationsquelleAutor 42-
Können Sie PMCMR Paket. Dort mehr Informationen über Sie.
Den beiden oben genannten Methoden geben gleiche Resultate.
InformationsquelleAutor İzzet KILIÇ
Leider weiß ich nicht mehr von einer Funktion wie diese. Wenn es nicht bereits, wäre es eine interessante Aufgabe, eine Funktion zu konstruieren, liefert eine matrix mit allen paarweisen Behandlung Vergleiche. Ein Kontrast als signifikant, wenn die folgende Ungleichung erfüllt ist
alt-text http://www.statsdirect.com/help/image/stat0199_wmf.gif
wobei T der Kruskal-Wallis-test Statistik für k Proben, S^2 ist der Nenner der T-Statistik, N ist die Gesamtzahl (alle ni) und Ri ist die Summe der Ränge (von allen Proben zusammengefasst) für die I-TEN Probe, und t ist ein Quantil aus der Student t-Verteilung mit N-k Freiheitsgraden.
Ich weiß, dass ich nicht viel helfen 🙂
Ich bin auch warten auf eine bessere Antwort
InformationsquelleAutor George Dontas
Hätte ich gedacht Sie würde in der Lage sein, Folgendes zu tun:
Aber es scheint, wie
multcomp
nicht unterstützencoin
Objekte (noch?) nicht.aber schauen Sie sich die Autoren der beiden Pakete...
Danke für die Antwort, obwohl die origonal post war vor langer Zeit - ich beschäftige mich mit einem ähnlichen problem selbst. Wahrscheinlich bin ich ein kompletter ignorant - aber darf ich Sie bitten, ein wenig konkreter, ich Schätze jede Hilfe.
InformationsquelleAutor hadley