Tag: time-series
Eine Zeitreihe ist eine Sequenz von Daten-Punkte mit Werten gemessen, die bei aufeinander folgenden Zeiten (entweder in kontinuierlichen oder diskreten Zeitabschnitten). Zeitreihen-Analyse nutzt diese natürlichen zeitlichen bestellen, Bedeutung zu extrahieren und trends aus den zugrunde liegenden Daten.
1
Antworten
Habe ich eine einfache Zeit-Serie, ich habe ein wenig Lärm, um eine sin-Funktion und versucht zu zerlegen, es mit der "stl" und "zerlegen" Funktion in R, während meine Serie hat definitiv mehr als 2 Periode und periodisch
6
Antworten
Habe ich ein paar mal-Serie jeweils durch zwei Komponenten beschrieben, ein timestamp-Vektor (in Sekunden), und ein Vektor, der die Werte gemessen. Die Zeit, die Vektor ist nicht einheitlich (D. H. Stichprobe in unregelmäßigen Abständen) Ich versuche, berechnen
3
Antworten
Habe ich ein Pandas dataframe, das ist indiziert durch eine DatetimeIndex: <class 'pandas.core.frame.DataFrame'> DatetimeIndex: 53732 entries, 1993-01-07 12:23:58 to 2012-12-02 20:06:23 Data columns: Date(dd-mm-yy)_Time(hh-mm-ss) 53732 non-null values Julian_Day 53732 non-null values AOT_870 53732 non-null values 440-870Angstrom 53732
3
Antworten
Gegeben eine Zeitreihe, ich will berechnen Sie den maximum drawdown, und ich auch möchten, suchen Sie den Anfang und das Ende Punkte der maximale drawdown, also kann ich die Berechnung der Dauer. Ich möchte markieren den Anfang
1
Antworten
Ich bin mit ggplot2 zeichnen einfache Linien-charts von Zeitreihen-Daten. Eine Schwierigkeit, die ich habe, laufen in der Etikettierung bestimmter Punkte der entsprechenden x-Achsen-Werte, d.h. Termine. library(ggplot2) library(scales) date <- c("2011-09-19","2011-09-20","2011-09-21", "2011-09-22","2011-09-23","2011-09-26","2011-09-27") price <- c(100,110,105,115,120,115,125) tmp <- data.frame(date,price)
3
Antworten
Nehmen wir an ich habe folgende Zeitreihe: Timestamp Category 2014-10-16 15:05:17 Facebook 2014-10-16 14:56:37 Vimeo 2014-10-16 14:25:16 Facebook 2014-10-16 14:15:32 Facebook 2014-10-16 13:41:01 Facebook 2014-10-16 12:50:30 Orkut 2014-10-16 12:28:54 Facebook 2014-10-16 12:26:56 Facebook 2014-10-16 12:25:12 Facebook ...
2
Antworten
Ich habe eine Zeitreihe problem, von dem ich hoffe, jemand kann helfen mit! Das problem dreht sich um zwei Sätze von Daten mit unterschiedlichen Zeitstempeln. Ein Satz von Daten mit Kalibrier-Daten, die andere enthält Beispieldaten. Die Kalibrierung
2
Antworten
Habe ich ein intra-day-Serie von log-Renditen über mehrere Tage, würde ich mag, um eine Neuberechnung der täglichen ehts. Ich kann etwas tun, wie hi = series.resample('B', how=lambda x: np.max(np.cumsum())) low = series.resample('B', how=lambda x: np.min(np.cumsum())) Aber es
3
Antworten
Habe ich versucht die Maschine zu lernen, Vorhersage auf der Basis von Zeitreihen-Daten. In einer stackoverflow-Frage (createTimeSlices Funktion in der CARET-Paket in R) ist ein Beispiel für die Verwendung createTimeSlices cross-Validierung für das Modell Ausbildung und parameter-tuning:
4
Antworten
Was ist der effizienteste Weg, um eine matrix der verzögerten Variablen in R, für eine beliebige variable (d.h. nicht regelmäßigen Zeit-Serie) Beispiel: Eingang: x <- c(1,2,3,4) 2 lags, Ausgabe: [1,NA, NA] [2, 1, NA] [3, 2, 1]
1
Antworten
Ich versuche zu erklären, mir das Prognose-Ergebnis aus der Anwendung der ARIMA-Modell zu einem Zeitreihen-Datensatz. Die Daten aus der M1-Wettbewerb, die Serie ist MNB65. Ich bin versucht, um zu passen die Daten einem ARIMA(1,0,0) - Modell und
1
Antworten
Ich habe eine zoo Zeitreihen in R: d <- structure(c(50912, 50912, 50912, 50912, 50913, 50913, 50914, 50914, 50914, 50915, 50915, 50915, 50916, 50916, 50916, 50917, 50917, 50917, 50918, 50918, 2293.8, 2302.64, 2310.5, 2324.02, 2312.25, 2323.93, 2323.83, 2338.67,
3
Antworten
Mein Antrag betrifft den Umgang mit Daten (enthalten in eine CSV), die von der folgenden form: Epoch (number of seconds since Jan 1, 1970), Value 1368431149,20.3 1368431150,21.4 .. Derzeit lese ich die CSV mit numpy loadtxt-Methode (einfach
4
Antworten
Will ich haben beide month und day in der x-Achse der Zeitreihen-plot bei Verwendung facet seit Jahren in ggplot2. Mein MWE unten: set.seed(12345) Date <- seq(as.Date("2010/1/1"), as.Date("2014/1/1"), "week") Y <- rnorm(n=length(Date), mean=100, sd=1) df <- data.frame(Date, Y)
2
Antworten
Habe ich einige Daten in python, das ist die unixtime, Wert: [(1301672429, 274), (1301672430, 302), (1301672431, 288)...] Zeit ständig Schritten von einer Sekunde. Wie könnte ich das reduzieren dieser Daten, damit der Zeitstempel wird jede Sekunde, aber
3
Antworten
Ich habe eine Zeitreihe von mehreren Jahren, die ich brauche, um plot in einem graph. Die größte Serie hat einen Mittelwert von 340 und einem minimum von 245 und maximal 900. Die kleinste Serie hat einen Mittelwert
1
Antworten
Möchte ich Prognose timeseries Daten. Ich lese in früheren posts, dass Modul statsmodels hat das nötige Werkzeug, um ARMA-Methode für die Prognose und das ist genau der, den ich gesucht habe. Trotz, dass ich Schwierigkeiten bei der
4
Antworten
Habe ich 2 mal Serie und ich bin mit ccf zu finden, die Kreuz-Korrelation zwischen Ihnen. ccf(ts1, ts2) listet die Kreuz-Korrelationen für alle Zeit lag. Wie finde ich die Verzögerung, die Ergebnisse in einer maximalen Korrelation, ohne
3
Antworten
Ich versuche zu generieren, die eine Reihe von PostgreSQL mit der Funktion generate_series. Ich brauche eine Reihe von Monaten ab Jan 2008 bis current month + 12 (ein Jahr). Ich bin mit und beschränkt sich auf das
1
Antworten
Ich bin mit Python Pandas für die erste Zeit. Ich habe 5-min lag traffic-Daten im csv-format: ... 2015-01-04 08:29:05,271238 2015-01-04 08:34:05,329285 2015-01-04 08:39:05,-1 2015-01-04 08:44:05,260260 2015-01-04 08:49:05,263711 ... Gibt es mehrere Probleme: für einige timestamps gibt es
1
Antworten
Ich habe eine große Pandas DataFrame <class 'pandas.core.frame.DataFrame'> DatetimeIndex: 3425100 entries, 2011-12-01 00:00:00 to 2011-12-31 23:59:59 Data columns: sig_qual 3425100 non-null values heave 3425100 non-null values north 3425099 non-null values west 3425097 non-null values dtypes: float64(4) Ich
4
Antworten
Habe ich ein Pandas DataFrame, der ein Datum enthält, dass ein stream-gage gestartet-flow-Messung und das Datum, dass die station stillgelegt wurde. Ich will generieren Sie einen plot der hervorgeht, wie diese Daten grafisch dargestellt. Hier ist eine
2
Antworten
Ich würde gerne speichern, 1M+ verschiedene Zeit-Serie in Amazon DynamoDb Datenbank. Jeder Zeit-Serie über 50K Datenpunkte. Ein Datenpunkt besteht aus einem Zeitstempel und einen Wert. Wird die Anwendung neue Daten hinzufügen, Punkte zu Zeitreihen Häufig (die ganze
3
Antworten
Meine Pandas Dataframe frame sieht ungefähr so aus 1. 2013-10-09 09:00:05 2. 2013-10-09 09:05:00 3. 2013-10-09 10:00:00 4. ............ 5. ............ 6. ............ 7. 2013-10-10 09:00:05 8. 2013-10-10 09:05:00 9. 2013-10-10 10:00:00 Möchte ich die Daten liegen
1
Antworten
Problem habe ich die Zusammenlegung mehrerer Zeitreihen auf einen gemeinsamen DataFrame. Der Beispiel-code, den ich verwende: import pandas import datetime import numpy as np start = datetime.datetime(2001, 1, 1) end = datetime.datetime(2001, 1, 10) dates = pandas.date_range(start,
3
Antworten
Habe ich die folgenden 15-Minuten-Daten als dataframe für 3 Jahre. Mit den ersten beiden Spalten des index. 2014-01-01 00:15:00 1269.6 2014-01-01 00:30:00 1161.6 2014-01-01 00:45:00 1466.4 2014-01-01 01:00:00 1365.6 2014-01-01 01:15:00 1362.6 2014-01-01 01:30:00 1064.0 2014-01-01 01:45:00
2
Antworten
Scikit-learn nutzt eine sehr praktischen Ansatz, basierend auf fit und predict Methoden. Ich habe Zeit-Serien-Daten in das format, geeignet für fit und predict. Ich habe zum Beispiel den folgenden Xs: [[1.0, 2.3, 4.5], [6.7, 2.7, 1.2], ...,
2
Antworten
Ich habe einen zoo Zeitreihen mit fehlenden Tage. Um diesen zu füllen und haben eine fortlaufende Serie, ich weiß... Generiere ich eine chron Datum-Zeit-Sequenz von Anfang bis Ende. Ich reduziere meine Serie mit diesem ein. Benutze ich
2
Antworten
Frage ich mich, wie ich können machen, verwenden Sie ein bereits bestehendes Datum-Feld beim erstellen einer ts in R. Manchmal muss man einfach ein Datum bevor du das ts-Objekt, z.B. x <- as.Date("2008-01-01") + c(30,60,90,120,150) # add
4
Antworten
Ich habe eine csv-Datei, in der ich 2 Schlusskurse der Aktie(auf täglicher basis) Dates Bajaj_close Hero_close 3/14/2013 1854.8 1669.1 3/15/2013 1850.3 1684.45 3/18/2013 1812.1 1690.5 3/19/2013 1835.9 1645.6 3/20/2013 1840 1651.15 3/21/2013 1755.3 1623.3 3/22/2013 1820.65 1659.6
5
Antworten
Ich bin momentan an einem kleinen Projekt, in dem ich vergleichen möchten, zwei Zeit-Serie. Die ähnlichkeit zu Messen ist wirklich vage, Sie gelten als ähnlich, wenn die beiden Zeitreihen etwa die gleiche Form haben. Also dachte ich
2
Antworten
Die Ausgabe eines Zeit-Serie sieht aus wie ein Daten-frame: ts(rnorm(12*5, 17, 8), start=c(1981,1), frequency = 12) Jan Feb Mar Apr May Jun Jul ... 1981 14.064085 21.664250 14.800249 -5.773095 16.477470 1.129674 16.747669 ... 1982 23.973620 17.851890 21.387944
2
Antworten
Ich versuche, einige Zeit Series Analysis in Python mit Numpy. Habe ich zwei etwas mittlere Reihe, mit 20k-Werte und ich möchten zu prüfen die gleitende Korrelation. Den corrcoef gibt mir als Ausgabe eine Matrix der auto-Korrelation/Korrelationskoeffizienten. Nichts
3
Antworten
Ich habe eine Abfrage wie diese, die schön ist, generiert eine Reihe von Daten, die zwischen 2 angegebenen Terminen: select date '2004-03-07' + j - i as AllDate from generate_series(0, extract(doy from date '2004-03-07')::int - 1) as
1
Antworten
Ich habe ein Grundstück von Zeitreihen in ggplot2-Paket und ich durchgeführt haben, die den Gleitenden Durchschnitt, und ich möchte hinzufügen das Ergebnis des gleitenden Durchschnitts, um den plot der Zeitreihe. Sample-Daten-set (p31): ambtemp dt -1.14 2007-09-29 00:01:57
4
Antworten
Arbeitete ich nun schon einige Zeit mit python und pandas für die Analyse eine Reihe von stündlichen Daten aus und finde es ganz nett (Kommt aus Matlab.) Nun bin ich irgendwie stecken. Ich habe meine DataFrame so:
1
Antworten
Ich versuche, fit ARIMA-Modell einer saisonal zerlegt Serie. Aber wenn ich versuche zu execure folgenden: fit = arima(diff(series), order=c(1,0,0), seasonal = list(order = c(1, 0, 0), period = NA)) Er gibt mir folgenden Fehler: Fehler in arima(diff(Serie),
5
Antworten
Ich versuche, mit einem hidden Markov Modell (HMM) für ein problem wo ich habe die M verschiedenen beobachteten Variablen (Yti) und eine einzelne verdeckte Variablen (Xt) zu jedem Zeitpunkt t an. Für Klarheit, lassen Sie uns davon
2
Antworten
Ich habe einen DataFrame enthält eine Menge von intraday-Daten, die DataFrame hat mehrere Tage von Daten, Daten sind nicht kontinuierlich. 2012-10-08 07:12:22 0.0 0 0 2315.6 0 0.0 0 2012-10-08 09:14:00 2306.4 20 326586240 2306.4 472 2306.8
4
Antworten
Habe ich ein numpy-array der Form (6,2) [[00,01], [10,11], [20,21], [30,31], [40,41], [50,51]] Brauche ich eine Schiebe-Fenster mit Schritt-Größe 1 und Größe der Fenster 3 mag: [[00,01,10,11,20,21], [10,11,20,21,30,31], [20,21,30,31,40,41], [30,31,40,41,50,51]] Ich bin auf der Suche nach ein
3
Antworten
Habe ich eine Frage im Hinterkopf, das bezieht sich auf die Verwendung von pybrain zu tun regression einer Zeitreihe. Ich Plane, verwenden Sie die LSTM-Ebene in pybrain zu trainieren und Vorhersage von Zeitreihen. Fand ich ein Beispiel-code
3
Antworten
Ich bin derzeit versuchen zu bauen ein einfaches Modell für die Vorhersage von Zeitreihen. Das Ziel wäre, um das Modell zu trainieren, mit einer Sequenz, so dass das Modell in der Lage ist, zur Prognose zukünftiger Werte.
6
Antworten
Ich versuche, vorherzusagen, weekly sales mit ARMA ARIMA-Modelle. Ich konnte nicht finden, eine Funktion für die Optimierung der Ordnung(p,d,q) in statsmodels. Derzeit R eine Funktion auto.arima() die Stimmen der (p,d,q) - Parameter. Wie gehe ich über die
2
Antworten
Ich bin auf der Suche nach einer Möglichkeit zum konvertieren eines DataFrame zu einer TimeSeries ohne die Aufteilung der index und Wert-Spalten. Irgendwelche Ideen? Danke. In [20]: import pandas as pd In [21]: import numpy as np
1
Antworten
Ich habe einen dataframe, wie dies d={} d['z']=['Q8','Q8','Q7','Q9','Q9'] d['t']=['10:30','10:31','10:38','10:40','10:41'] d['qty']=[20,20,9,12,12] Ich soll vergleichen, die erste Zeile mit der zweiten Zeile ist Menge gleiche wie nächste Zeile UND ist t größer in der nächsten Zeile, UND ist der
1
Antworten
Ich habe einen normalen df.index, die ich möchte hinzufügen, einige Stunden. In [1]: test[1].index Out[2]: <class 'pandas.tseries.index.DatetimeIndex'> [2010-03-11, ..., 2014-08-14] Length: 52, Freq: None, Timezone: None Dies ist, wie das erste element sieht wie folgt aus: In
5
Antworten
Ich habe gerade angefangen zu spielen mit den ts Klasse zu analysieren, einige Zeit-Serien Daten, die ich habe. Bin ich immer ein Gefühl, dass die ts Klasse ist nicht gut geeignet für die Analyse von täglichen oder
3
Antworten
Ich habe einige der Forschung getan, und ich bin stecken geblieben bei der Suche nach der Lösung. Ich habe eine Zeitreihe von Daten, von sehr einfachen Daten-frame, nennen wir es x: Date Used 11/1/2011 587 11/2/2011 578
4
Antworten
Ich habe eine begrenzte Zeit, die Serie der Exposition in R. So ist, Frage ich mich, welche Zeit - /Datum-Klasse (und die damit verbundenen Paket) wäre am besten geeignet, um mit zu beginnen. Unter der fülle der
3
Antworten
Gegeben, die unter pandas DataFrame: In [115]: times = pd.to_datetime(pd.Series(['2014-08-25 21:00:00','2014-08-25 21:04:00', '2014-08-25 22:07:00','2014-08-25 22:09:00'])) locations = ['HK', 'LDN', 'LDN', 'LDN'] event = ['foo', 'bar', 'baz', 'qux'] df = pd.DataFrame({'Location': locations, 'Event': event}, index=times) df Out[115]: Event