Wie für die Berechnung der durchschnittlichen Werte von großen Datensätzen
Ich arbeite mit einem Datensatz, Temperatur-Messwerte einmal pro Stunde, 24 Stunden pro Tag für 100+ Jahre. Ich möchte eine Durchschnittliche Temperatur für jeden Tag, um die Größe zu reduzieren von meinen Daten. Die überschriften so Aussehen:
YR MO DA HR MN TEMP
1943 6 19 10 0 73
1943 6 19 11 0 72
1943 6 19 12 0 76
1943 6 19 13 0 78
1943 6 19 14 0 81
1943 6 19 15 0 85
1943 6 19 16 0 85
1943 6 19 17 0 86
1943 6 19 18 0 86
1943 6 19 19 0 87
etc für 600.000+ Daten-Punkte.
Wie kann ich eine verschachtelte Funktion zur Berechnung des täglichen durchschnittlichen Temperatur, so dass ich die Erhaltung der YR, MO, DA, TEMP?
Sobald ich diese habe, möchte ich in der Lage sein, zu betrachten, langfristige Durchschnitte & berechnen Sie sagen, die Durchschnittliche Temperatur für den Monat Januar über 30 Jahren. Wie mache ich das?
Zwei Warnungen: beachten Sie zum entfernen von unvollständig Tage (oder interpoliert) und dass der einfache Mittelwert über alle Stunden nicht was meteo Menschen in der Regel betrachten die Durchschnittliche Temperatur -- es gibt einige dumme standards wie Temperatur von 9:00 Uhr mit Gewicht 0,4 plus Temperatur von 13:00 Uhr mit 0,6.
vielen Dank für das heads-up! momentan ist dies nur für einen Kurs Projekt - & wird nicht verwendet werden für die Veröffentlichung. ich werde in diesem Blick, obwohl für die Zukunft.
vielen Dank für das heads-up! momentan ist dies nur für einen Kurs Projekt - & wird nicht verwendet werden für die Veröffentlichung. ich werde in diesem Blick, obwohl für die Zukunft.
InformationsquelleAutor user2113985 | 2013-02-27
Du musst angemeldet sein, um einen Kommentar abzugeben.
In einem Schritt, den man tun konnte:
Dieser gibt Ihnen einen Datum-Uhrzeit-formatierte index als auch die Werte. Wenn Sie wollte nur das Datum, als Zeichen, ohne die nachfolgende Zeit:
Die monatlichen Durchschnittswerte getan werden könnte mit:
InformationsquelleAutor 42-
Können Sie es mit
aggregate
:InformationsquelleAutor N8TRO
Deiner ersten Frage kann erreicht werden durch die
plyr
Paket:In Analogie zu der obigen Lösung, um die monatlichen Mittel:
oder um monatliche Durchschnittswerte über den gesamten Datensatz (30 Jahre, auch bekannt als normalen Klima), nicht pro Jahr:
Lesen Sie in der Dokumentation
mean
spezifischna.rm
.InformationsquelleAutor Paul Hiemstra