Interpretation von "stat_summary = mean_cl_boot" in ggplot2?

eine vielleicht einfache Frage
Ich habe versucht, eine errorgraph wie in der Abbildung auf Seite 532 von Field "Discovering Statistics Using R".

Den code finden Sie hier http://www.sagepub.com/dsur/study/DSUR%20R%20Script%20Files/Chapter%2012%20DSUR%20GLM3.R :

line <- ggplot(gogglesData, aes(alcohol, attractiveness, colour = gender))
line + stat_summary(fun.y = mean, geom = "point") + 
stat_summary(fun.y = mean, geom = "line", aes(group= gender)) + 
stat_summary(fun.data = mean_cl_boot, geom = "errorbar", width = 0.2) + 
labs(x = "Alcohol Consumption", y = "Mean Attractiveness of Date (%)", colour = "Gender")

Produzierte ich das gleiche Diagramm; meine y-Achsen-variable hat nur 4 Punkte (es ist eine diskrete Skala 1-4), jetzt die y-Achse hat die Punkte 1.5, 2, 2.5, in der die Zeilen variieren.

Und die Frage ist: was bedeuten diese Punkte und Graphen beschreiben?
Ich gehe davon aus, dass der wichtige Teil ist stat_summary(fun.data = mean_cl_boot, geom = "errorbar", width = 0.2) werden Sie Anzahl von Beobachtungen der Gruppe und die Ebene(x-Achse)? Sind Sie Frequenzen? Oder, sind Sie Proportionen?

Fand ich diese http://docs.ggplot2.org/0.9.3/stat_summary.html aber es hat mir nicht geholfen

Danke

InformationsquelleAutor Pulse | 2013-07-01

ggplot2 r usage-statistics

13

Hier ist, was die ggplot2 buchen auf Seite 83 sagt über mean_cl_boot()
```
Function          Hmisc original        Middle Range
mean_cl_boot() smean.cl.boot() Mean Standard error from bootstrap
```
Ich denke, dass es die smean.cl.boot() aus dem Hmisc Paket aber umbenannt als mean.cl.boot() in ggplot2.

und hier ist die definition der ursprünglichen Funktion aus dem Hmisc Paket :

smean.cl.boot ist eine sehr schnelle Implementierung der grundlegende nichtparametrische bootstrap für den Erhalt der Konfidenzintervalle für den Mittelwert der Grundgesamtheit, ohne dass Normalität

InformationsquelleAutor Metrics
1

Ich reproduzierte die Grafik mit dem code und ich bekommen im wesentlichen die gleiche Grafik angezeigt, die im Feld 'Buch" Discovering Statistics Using R, Abbildung 12.12, Seite 532, außer für die Anordnung der Variablen auf der x-Achse. Die y-Achse zeigt die kontinuierliche variable, Meine Attraktivität Datum (%). Die 95% Konfidenzintervalle,--wie Sie--mit dem stat_summary () - Funktion und die mean_cl_boot argument sind die bootstrap-Konfidenzintervalle mit der smean.cl.boot () - Funktion in Hmisc, wie bereits von einem anderen Kommentator weiter oben. Diese Funktion ist beschrieben auf Seite 262 des Hmisc Dokumentation. Die ggplot2 Dokumentation auf mean_cl_boot ist spärlich und verweist auf die Beschreibung in dem Hmisc Paket.

Beachten Sie, dass die Argumente für mean_cl_boot in ggplot2 sind die gleichen wie die in der smean.cl.boot-Funktion in dem Hmisc Paket. Sie können ändern Sie die gewünschten Konfidenzniveau von der Standardeinstellung .95 durch die Verwendung der conf.int-argument und die Anzahl der bootstrap-samples mit Hilfe des B-argument. Hier z.B. ist der code für die Erstellung der gleiche plot mit einer 99% - Konfidenzintervall und 5000 bootstrap samples:
```
line <- ggplot(gogglesData, aes(alcohol, attractiveness, colour = gender))
line + stat_summary(fun.y = mean, geom = "point") + 
stat_summary(fun.y = mean, geom = "line", aes(group= gender)) + 
stat_summary(fun.data = mean_cl_boot, conf.int = .99, B = 5000, geom = "errorbar", width = 0.2) + 
labs(x = "Alcohol Consumption", y = "Mean Attractiveness of Date (%)", colour = "Gender") 
```
InformationsquelleAutor user2871533

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.