Interpretation von "stat_summary = mean_cl_boot" in ggplot2?
eine vielleicht einfache Frage
Ich habe versucht, eine errorgraph wie in der Abbildung auf Seite 532 von Field "Discovering Statistics Using R".
Den code finden Sie hier http://www.sagepub.com/dsur/study/DSUR%20R%20Script%20Files/Chapter%2012%20DSUR%20GLM3.R :
line <- ggplot(gogglesData, aes(alcohol, attractiveness, colour = gender))
line + stat_summary(fun.y = mean, geom = "point") +
stat_summary(fun.y = mean, geom = "line", aes(group= gender)) +
stat_summary(fun.data = mean_cl_boot, geom = "errorbar", width = 0.2) +
labs(x = "Alcohol Consumption", y = "Mean Attractiveness of Date (%)", colour = "Gender")
Produzierte ich das gleiche Diagramm; meine y-Achsen-variable hat nur 4 Punkte (es ist eine diskrete Skala 1-4), jetzt die y-Achse hat die Punkte 1.5, 2, 2.5, in der die Zeilen variieren.
Und die Frage ist: was bedeuten diese Punkte und Graphen beschreiben?
Ich gehe davon aus, dass der wichtige Teil ist stat_summary(fun.data = mean_cl_boot, geom = "errorbar", width = 0.2)
werden Sie Anzahl von Beobachtungen der Gruppe und die Ebene(x-Achse)? Sind Sie Frequenzen? Oder, sind Sie Proportionen?
Fand ich diese http://docs.ggplot2.org/0.9.3/stat_summary.html aber es hat mir nicht geholfen
Danke
InformationsquelleAutor Pulse | 2013-07-01
Du musst angemeldet sein, um einen Kommentar abzugeben.
Hier ist, was die ggplot2 buchen auf Seite 83 sagt über
mean_cl_boot()
Ich denke, dass es die
smean.cl.boot()
aus dem Hmisc Paket aber umbenannt alsmean.cl.boot()
in ggplot2.und hier ist die definition der ursprünglichen Funktion aus dem Hmisc Paket :
smean.cl.boot
ist eine sehr schnelle Implementierung der grundlegende nichtparametrische bootstrap für den Erhalt der Konfidenzintervalle für den Mittelwert der Grundgesamtheit, ohne dass NormalitätInformationsquelleAutor Metrics
Ich reproduzierte die Grafik mit dem code und ich bekommen im wesentlichen die gleiche Grafik angezeigt, die im Feld 'Buch" Discovering Statistics Using R, Abbildung 12.12, Seite 532, außer für die Anordnung der Variablen auf der x-Achse. Die y-Achse zeigt die kontinuierliche variable, Meine Attraktivität Datum (%). Die 95% Konfidenzintervalle,--wie Sie--mit dem stat_summary () - Funktion und die mean_cl_boot argument sind die bootstrap-Konfidenzintervalle mit der smean.cl.boot () - Funktion in Hmisc, wie bereits von einem anderen Kommentator weiter oben. Diese Funktion ist beschrieben auf Seite 262 des Hmisc Dokumentation. Die ggplot2 Dokumentation auf mean_cl_boot ist spärlich und verweist auf die Beschreibung in dem Hmisc Paket.
Beachten Sie, dass die Argumente für mean_cl_boot in ggplot2 sind die gleichen wie die in der smean.cl.boot-Funktion in dem Hmisc Paket. Sie können ändern Sie die gewünschten Konfidenzniveau von der Standardeinstellung .95 durch die Verwendung der conf.int-argument und die Anzahl der bootstrap-samples mit Hilfe des B-argument. Hier z.B. ist der code für die Erstellung der gleiche plot mit einer 99% - Konfidenzintervall und 5000 bootstrap samples:
InformationsquelleAutor user2871533