R-Sprache: Wie kann ich drucken / siehe zusammenfassende Statistiken für die Stichprobe Teilmenge?
Diese sind einige newbie Fragen zur statistischen Programmierung für R, für die ich nicht in der Lage, eine Antwort zu finden online. Mein dataframe mit der Bezeichnung "eitc" im code unten.
1) Sobald ich geladen habe in einen Daten-frame, ich möchte schauen, zusammenfassende Statistiken. Ich habe die Funktionen:
eitc <- read.dta(file="/Users/Documents/eitc.dta")
summary(eitc)
sapply(eitc,mean,na.rm=TRUE) #for sample mean, min, max, etc.
Wie finde ich die Zusammenfassung der Statistiken über meine dataframe, wenn bestimmte Bedingungen erfüllt sind. Zum Beispiel würde ich gerne sehen, die Zusammenfassung der Statistiken für alle Variablen, wenn die variable "Kinder" ist größer als oder gleich 1 ist. Das entspricht Stata-code:
summarize if children >= 1
2) Ähnlich, wie finde ich bestimmte Parameter, wenn bestimmte Bedingungen erfüllt sind? Zum Beispiel, ich möchte zu finden, den Mittelwert der variable "Arbeit", wenn beide "post93" variable ist gleich null und "anykids" variable gleich 1 ist. Das entspricht Stata-code:
mean work if post93==0 & anykids==1
3) Ideal, wenn ich die Zusammenfassung der Statistik oben, würde ich mag, um herauszufinden, wie viele Beobachtungen wurden in der Berechnung enthalten sind /passen die Kriterien.
4) Wenn ich lese in meinem Daten-frame, es wäre auch schön, zu sehen, wie viele Beobachtungen in den Datensatz aufgenommen (und vielleicht, wie viele Zeilen mit fehlenden Werten oder "NA").
5) Auch, ich habe schon die Erstellung der dummy-Variablen mit dem folgenden code. Ist das der richtige Weg, es zu tun oder gibt es einen effizienteren Weg?
post93.dummy <- as.numeric(eitc$year>1993)
eitc=cbind(eitc,post93.dummy)
InformationsquelleAutor baha-kev | 2011-01-29
Du musst angemeldet sein, um einen Kommentar abzugeben.
Viele Ihrer Anforderungen sind beantwortet
subset
z.B.Den
?subset
Dokumentation guter Beispiele.Den
cbind
Verfahren zum anbringen von dummy-Variablen ist unneccesary. Nur:InformationsquelleAutor Michael Dunn
Verwende ich
mtcars
Daten indatasets
Paket. Sehen?mtcars
.Ad 1. Sehen Sie die Zusammenfassung der
mtcars
wenngear
größer ist als 3:Ad 2. Verwenden
with
:Ad 3. EBD (aber verwenden
length
):Ad 4. Siehe vorige, aber um das herauszufinden
etwas wie das hier tun:
Ad 5. Dies ist nicht eine dummy-variable, das ist eine Art Teilmenge der ursprünglichen Daten, columnwise verkettet. Was versuchen Sie zu erreichen, eh?
Bitte prägnant. Eine Frage pro Frage, bitte!
InformationsquelleAutor aL3xa
Ich würde empfehlen, du schaust auf die plyr - Paket für die Generierung von Zusammenfassungen. Hier einige quick-code (nicht ausgeführt);
Vielleicht wollen Sie auch Blick auf die hmisc und psych - Pakete für mehr beschreibende stat-Routinen. (Check out Quick-R für mehr info)
InformationsquelleAutor PaulHurleyuk
Hier, wie Sie könnten schnell einige zusammenfassende Statistiken für eine Teilmenge Ihrer Daten mit Daten.Tabelle.
Können Sie
model.matrix
für die Erstellung von dummy-Variablen, siehe hier.InformationsquelleAutor pbaylis