Python - Effiziente Methode zum hinzufügen von Zeilen zu dataframe

Aus diesem Frage und andere, die es scheint, dass es nicht empfohlen zu verwenden concat oder append zu bauen, ein pandas dataframe, weil es Kopierens die ganze dataframe jeder Zeit.

Mein Projekt beinhaltet empfangen einer kleinen Menge von Daten, die alle 30 Sekunden. Dies könnte für einen 3-Tages-Wochenende, also könnte jemand einfach erwarten, dass über 8000 Zeilen erstellt werden, eine Zeile zu einem Zeitpunkt. Was wäre die effizienteste Methode zum hinzufügen von Zeilen zu diesem dataframe?

Wenn Sie nur das hinzufügen einer Zeile alle 30 Sekunden, ist es wirklich brauchen, um effizient zu sein?
Gibt es irgendeinen Grund muss es ein DataFrame? Warum nicht einfach schreiben es in eine Datei umwandeln und dann am Ende?
Rauch Gut, ich hatte gehofft, damit meine Proben so nahe zu alle 30 Sekunden wie möglich. Wahrscheinlich falsch, ich Hole die Daten dann, indem es der dataframe dann mit time.sleep(30) bis seine Zeit, um den nächsten Satz von Daten. Meine Sorge war, dass es größer wird, dass die Last der Zeit werden Sie beginnen, zu erweitern, die Zeit zwischen jeder Probe. Von dieser Frage link es scheint, dass bei einer Größe von 6000 dauert es 2.29 Sekunden. Ich möchte wenn möglich halten, dass die Anzahl auf ein minimum.
Wenn Ihre Sorge ist, dass die 30-Sekunden-Schlaf wird ungenau, weil es länger dauert, zum Anhängen Ihrer Daten haben, dann beheben Sie den Schlaf. next_time += 30, time.sleep(next_time-time.time())
Rauch-Oh, das ist eine tolle Idee!

InformationsquelleAutor Jarrod | 2017-01-27

Schreibe einen Kommentar