Tag: time-series
Eine Zeitreihe ist eine Sequenz von Daten-Punkte mit Werten gemessen, die bei aufeinander folgenden Zeiten (entweder in kontinuierlichen oder diskreten Zeitabschnitten). Zeitreihen-Analyse nutzt diese natürlichen zeitlichen bestellen, Bedeutung zu extrahieren und trends aus den zugrunde liegenden Daten.
6
Antworten
Habe ich meine Serie und gezwungen es zu einer datetime-Spalte dtype=datetime64[ns] (obwohl nur müssen Tag Auflösung...nicht sicher, wie Sie Sie ändern können). import pandas as pd df = pd.read_csv('somefile.csv') column = df['date'] column = pd.to_datetime(column, coerce=True) aber
3
Antworten
Will ich tun, passen irgendeine Art von multi-variate Zeitreihe Modell mit R. Hier ist ein Beispiel, meine Daten: u cci bci cpi gdp dum1 dum2 dum3 dx 16.50 14.00 53.00 45.70 80.63 0 0 1 6.39 17.45
7
Antworten
Ich bin neu Pandas.... Ich habe ein Bündel von polling die Daten; ich möchte zur Berechnung einer rollenden bedeuten, einen Schätzwert für jeden Tag, basierend auf einer drei-Tages-Fenster. So wie ich das verstehe von diese Fragedie rolling_*
3
Antworten
Nach dem Kampf mit NumPy und dateutil für die Tage, die ich vor kurzem entdeckt die erstaunliche Pandas-Bibliothek. Ich habe poring durch die Dokumentation und source-code, aber ich kann nicht herausfinden, wie man date_range() zur Generierung von
10
Antworten
Ich bin ein system zu erschaffen welches abfragt, Geräte für Daten auf unterschiedlichen Metriken wie CPU-Auslastung, disk-Auslastung, Temperatur usw. bei (wahrscheinlich) 5-Minuten-Intervallen mit Hilfe von SNMP. Das ultimative Ziel ist es, Visualisierungen zu einem Benutzer des Systems
5
Antworten
Durch die Verarbeitung von Zeitreihen-graph, Möchte ich Muster zu erkennen, die ähnlich Aussehen wie diese: Anhand einer Beispiel-Zeitreihe als Beispiel, ich möchte in der Lage sein, zu erkennen, die Muster, die gekennzeichnet hier: Welche Art von AI-Algorithmus
3
Antworten
Es gibt sehr nette Möglichkeiten, Untergruppen xts Objekte. Zum Beispiel, kann man alle Daten für alle Jahre, Monate, Tage, aber strikt zwischen 9:30 UHR und 4 Uhr durch machen: my_xts["T09:30/T16:00"] Oder Sie können alle Beobachtungen zwischen zwei
10
Antworten
Wird wahrscheinlich aussetzen, ich bin neu in R, aber in SPSS, lags läuft ist sehr einfach. Offensichtlich ist das user-Fehler, aber das, was ich bin fehlt? x <- sample(c(1:9), 10, replace = T) y <- lag(x, 1)
5
Antworten
Ich bin daran interessiert, die überwachung von einigen Objekten. Ich erwarte, dass man über 10000 Datenpunkten pro 15 Minuten. (Vielleicht nicht auf den ersten, aber dies ist die 'Allgemeinen ballpark'). Ich möchte auch in der Lage, um
7
Antworten
Ich bin neu in R aber verwandelt haben, um es zu lösen, ein problem mit einer großen Datenmenge, die ich versuche zu verarbeiten. Derzeit habe ich 4 Spalten von Daten (Y-Werte) gegen-Minuten-Intervall Zeitstempel (Monat/Tag/Jahr Stunde:Minute) (X-Werte) wie
4
Antworten
Habe ich eine mal-Baureihe mit Temperatur und Strahlung in ein pandas dataframe. Die zeitliche Auflösung beträgt 1 minute in regelmäßigen Schritten. import datetime import pandas as pd import numpy as np date_times = pd.date_range(datetime.datetime(2012, 4, 5, 8,
2
Antworten
Wie verwende ich strptime oder andere Funktionen zum analysieren von Zeitstempel mit Millisekunden in R? time[1] # [1] "2010-01-15 13:55:23.975" strptime(time[1], format="%Y-%m-%d %H:%M:%S.%f") # [1] NA strptime(time[1], format="%Y-%m-%d %H:%M:%S") # [1] "2010-01-15 13:55:23"` InformationsquelleAutor der Frage signalseeker
6
Antworten
Ich versuche herauszufinden, genau was diese neumodischen Daten speichert wie bigtable, hbase und cassandra wirklich sind. Arbeite ich mit massiven Mengen an Lager-Markt-Daten, Milliarden von Zeilen von Preis/Kursdaten, können bis zu 100 Gigabyte jeden Tag (obwohl diese
3
Antworten
Ich versuche zu konvertieren, einen Daten-frame zu xts-Objekt mit dem als.xts()-Methode. Hier ist meine Eingabe-dataframe q: q t x 1 2006-01-01 00:00:00 1 2 2006-01-01 01:00:00 2 3 2006-01-01 02:00:00 3 str(q) 'data.frame': 10 obs. of 2
7
Antworten
Gibt es verlustfreie Komprimierung Methoden, die angewendet werden können, um floating-point-Zeit-Serien Daten, und wird deutlich stärker als, sagen wir, das schreiben der Daten als Binärdaten in eine Datei und es läuft durch gzip? Reduzierung der Präzision könnte
4
Antworten
Arbeite ich auf Zeitreihen in python. Die Bibliotheken, die fand ich sinnvoll und erfolgversprechend sind pandas; statsmodel (für ARIMA); einfache exponentielle Glättung ist von pandas. Auch für die Visualisierung: matplotlib Kennt jemand eine Bibliothek für die exponentielle
4
Antworten
Ich versuche zu tun, Zeitreihen-Modellierung und-Vorhersage mit Hilfe von R basiert auf wöchentlichen Daten wie unten - biz week Amount Count 2006-12-27 973710.7 816570 2007-01-03 4503493.2 3223259 2007-01-10 2593355.9 1659136 2007-01-17 2897670.9 2127792 2007-01-24 3590427.5 2919482 2007-01-31
2
Antworten
Kann mir jemand eine practicale Beispiel eines rekurrenten neuronalen Netzwerk (pybrain) python, um vorherzusagen den nächsten Wert einer Sequenz ? (Ich habe gelesen, die pybrain Dokumentation und es gibt keine klare Beispiel dafür, denke ich.) Ich fand
2
Antworten
Ich versuche, mongodb für ein Zeitreihen-Datenbank und Frage mich, ob jemand vorschlagen kann, wie am besten, um es einzurichten für dieses Szenario. Der Zeitreihen ist sehr ähnlich wie ein Aktienkurs Geschichte. Ich habe eine Sammlung von Daten
8
Antworten
Ich bin auf der Suche, um Stack Overflowers' Beratung und Vorschlag über die time-series-Bibliotheken in C++ geschrieben, einige der Einschränkungen und Anforderungen für die Bibliothek: Leistung ist sehr kritisch In der Lage Umgang mit sehr große data sets
1
Antworten
Ich versuche zu verstehen, ein wenig mehr über den Weg Rollen verbindet Arbeit und bin etwas Durcheinander, ich hatte gehofft, jemand könnte das für mich aufklären. An einem ganz konkreten Beispiel: dt1 <- data.table(id=rep(1:5, 10), t=1:50, val1=1:50,
17
Antworten
Update: Die beste Leistung der Algorithmus so weit dies ist eine. Diese Frage untersucht, robuster algorithmen für die Erkennung von plötzlichen Spitzen in der real-time-timeseries Daten. Betrachten Sie den folgenden Datensatz: p = [1 1 1.1 1
3
Antworten
Wie kann ich JFreeChart anzeigen nur die aktuellsten Daten in einem laufend aktualisierten Zeitreihen? Nachtrag: Ein vollständiges, lauffähiges Beispiel, beinhaltet, dass die akzeptierte Antwort wird hier. Siehe auch diese variation mit zwei Serien. Siehe auch diese Q&A
2
Antworten
Obwohl ich fand Hadley ' s post in der google-Gruppe auf POSIXct und geom_vline ich konnte nicht bekommen es getan. Ich habe eine Zeitreihe aus und würde gerne so zeichnen Sie eine vertikale Linie, die für die
2
Antworten
Ich bin zurzeit in der tick-Daten mit R und ich würde gerne Zusammenführen von Datum und Zeit in ein einziges Objekt, wie ich brauche, um eine genaue Zeit-Objekt berechnen Sie einige Statistiken über meine Daten. Hier ist,
4
Antworten
Wie kann ich K-means clustering von Zeitreihen-Daten? Ich verstehe, wie dies funktioniert, wenn die Eingabe-Daten ist eine Reihe von Punkten, aber ich weiß nicht, wie cluster eine Zeitreihe mit 1XM, wobei M die Länge. Insbesondere bin ich
4
Antworten
Wie kann ich Auszug stammt aus einem times-Serie? Hier ist mal eine Serie: x = seq (1, 768) myts <- ts(x, start=1982, frequency=24) Ursprünglich hatte ich vor, die erforderlich sind, um eine Vektor-holding Datum/Zeit-Daten für die rts
3
Antworten
Habe ich eine riesige Datei in HDFS mit Zeitreihendaten Punkte (Yahoo Aktienkurse). Will ich finden, die den gleitenden Durchschnitt der Zeitreihe, wie gehe ich über das schreiben der Apache-Spark-job zu tun . InformationsquelleAutor der Frage Ahmed Shabib
6
Antworten
In mehreren Projekten, die wir haben, zu speichern, zu aggregieren, zu bewerten einfache Messwerte. Eine Zeile typcially besteht aus einem Zeitstempel, Wert und einige Attribute auf den Wert. In einigen Anwendungen, die wir speichern möchten 1000 Werte
4
Antworten
Sehr newbish Frage, aber sagen, ich habe Daten wie diese: test_data <- data.frame( var0 = 100 + c(0, cumsum(runif(49, -20, 20))), var1 = 150 + c(0, cumsum(runif(49, -10, 10))), date = seq(as.Date("2002-01-01"), by="1 month", length.out=100) ) Wie
2
Antworten
War ich mit GRETL. Es, wenn ich die Prognosen für die Validierung des arima-Modells, bekomme ich die eingebaut-Serie in der blauen Linie und die original-Serie in rot Linie. Später wechselte ich zu R und hier konnte ich
4
Antworten
Zeitreihen ZERLEGUNG ist eine Methode, die trennt ein time-series-Daten-set in drei (oder mehr) Komponenten. Zum Beispiel: x(t) = s(t) + m(t) + e(t) wo t is the time coordinate x is the data s is the seasonal
7
Antworten
Welche algorithmen existieren für die Zeit-Serie Prognose/regression ? Was ist mit neuronalen Netzen ? (am besten docs zu diesem Thema ?) Sind es python-Bibliotheken/code-snippets, die helfen können ? Kommentar zu dem Problem Es wäre hilfreich, wenn Sie
2
Antworten
Habe ich ein Zeitreihen-Objekt in R mit verschiedenen Vektoren. Ich möchte die Berechnung der Zeit-over-Periode prozentuale Veränderung an jedem Punkt in der Zeit (außer t = 1, das wäre natürlich NA) für jeden Vektor. > data <-
6
Antworten
Habe ich einige hierarchische Daten, die Böden in Zeitreihen-Daten, die wie folgt aussieht: df = pandas.DataFrame( {'value_a': values_a, 'value_b': values_b}, index=[states, cities, dates]) df.index.names = ['State', 'City', 'Date'] df value_a value_b State City Date Georgia Atlanta 2012-01-01
4
Antworten
Ich bin auf der Suche nach einer einfachen (D. H. - keine Mathe-notation, lange form reproduzierbar code) Beispiele für die filter Funktion in R Ich glaube, ich habe meinen Kopf um die convolution-Methode, bin aber stecken geblieben