Wie kann ich verhindern, dass csv.DictWriter() oder writerow() Rundung meiner schwimmt?

Ich habe ein Wörterbuch, das ich schreiben will in eine csv-Datei, aber die schwimmt im Wörterbuch abgerundet sind, wenn ich Sie Schreibe in die Datei. Ich will, dass die maximale Genauigkeit.

Wo kommt die Rundung auftreten, und wie kann ich es verhindern?

, Was ich Tat

Folgte ich dem DictWriter Beispiel hier und ich bin mit Python 2.6.1 auf Mac (10.6 - Snow Leopard).

# my import statements
import sys
import csv

Hier ist, was mein Wörterbuch (d) enthält:

>>> d = runtime.__dict__
>>> d
{'time_final': 1323494016.8556759,
'time_init': 1323493818.0042379,
'time_lapsed': 198.85143804550171}

Die Werte sind in der Tat schwimmt:

>>> type(runtime.time_init)
<type 'float'>

Dann richte ich mein writer und schreiben der header und Werte:

f = open(log_filename,'w')
fieldnames = ('time_init', 'time_final', 'time_lapsed')
myWriter = csv.DictWriter(f, fieldnames=fieldnames)
headers = dict( (n,n) for n in fieldnames )
myWriter.writerow(headers)
myWriter.writerow(d)
f.close()

Aber wenn ich einen Blick in die Ausgabe-Datei, bekomme ich gerundete zahlen (D. H., unbelegt):

time_init,time_final,time_lapsed
1323493818.0,1323494016.86,198.851438046

< EOF >

Nicht Teil des Problems, aber in Python 2.x immer öffnen von csv-Dateien in Binär - Modus ('rb' oder 'wb')
Vielen Dank für das heads-up und für die überprüfung meine Frage. +1

InformationsquelleAutor aDroid | 2011-12-10

6

Sieht es aus wie csv ist mit schweben.__str__ eher als schweben.__repr__:
```
>>> print repr(1323494016.855676)
1323494016.855676
>>> print str(1323494016.855676)
1323494016.86
```
Blick auf die csv-Quelle, das erscheint als ein hardwired Verhalten. Eine Problemumgehung ist die Besetzung aller float-Werte, um Ihre repr bevor csv bekommt es. Verwenden Sie so etwas wie: d = dict((k, repr(v)) for k, v in d.items()).

Hier gearbeitet-Beispiel:
```
import sys, csv

d = {'time_final': 1323494016.8556759,
     'time_init': 1323493818.0042379,
     'time_lapsed': 198.85143804550171
}

d = dict((k, repr(v)) for k, v in d.items())

fieldnames = ('time_init', 'time_final', 'time_lapsed')
myWriter = csv.DictWriter(sys.stdout, fieldnames=fieldnames)
headers = dict( (n,n) for n in fieldnames )
myWriter.writerow(headers)
myWriter.writerow(d)
```
Dieser code erzeugt die folgende Ausgabe:
```
time_init,time_final,time_lapsed
1323493818.0042379,1323494016.8556759,198.85143804550171
```
Einer verfeinerten Ansatz kümmern wird nur Ersatz für Schwimmer:
```
d = dict((k, (repr(v) if isinstance(v, float) else str(v))) for k, v in d.items())
```
Hinweis, ich habe gerade das Problem gelöst für Py2.7.3, also sollte es kein problem sein in der Zukunft. Sehen http://hg.python.org/cpython/rev/bf7329190ca6
- Genial, funktioniert perfekt! Vielen Dank auch für den link zu der Quelle. Ich bin immer noch lernen, wie zu navigieren, die Python docs, ein wenig umständlich zu mir. Ich habe ein datetime-Wörterbuch als auch und es wird geschrieben als "datetime.date(2011, 12, 10)", was von einem erwartet wird, was Sie zur Verfügung gestellt. Ich werde einfach werfen Sie das Datum in den Dateinamen und erhalten es so. Awesome job! +1
- -1 Genial Vorschlaghammer, Werke unvollkommen: "Fixes" schwebt, Wracks datetimes.
- Stimmt, aber ich wollte nicht angeben, datetimes in das ursprüngliche problem, so war es nicht etwas zu prüfen, für die originelle Antwort.
- Genial. Ich weiß nicht, wie oft Fragen hier direkt dazu beitragen, die Quelle, aber für meine erste Frage, ich bin froh, dass ich es gepostet! Python wächst auf mich in den letzten Wochen habe ich daran gearbeitet, und jetzt, dass meine änderungen (d.h., die änderungen, die Sie auf meinen Namen) haben Eingang in die Quelle kann ich jetzt sagen, ich habe schon voll assimiliert vom Python. 🙂 Vielen Dank nochmal.
InformationsquelleAutor Raymond Hettinger
2

Es ist ein bekannter bug^H^H^Hfeature. Nach die docs:

"""... der Wert None ist geschrieben wie eine leere Zeichenfolge. [snip] Alle nicht-string-Daten sind stringified mit str (), bevor Sie geschrieben."""

Verlassen Sie sich nicht auf die Standard-Konvertierungen. Verwenden repr() für Schwimmer. unicode Objekte benötigen eine spezielle Handhabung; siehe Handbuch. Überprüfen Sie, ob der Verbraucher der Datei akzeptieren Sie die Standard-format von datetime.x Objekte für x in (datetime, date, time, timedelta).

Update:

Für float-Objekte "%f" % value ist nicht ein guter Ersatz für repr(value). Das Kriterium ist, ob der Verbraucher kann die Datei reproduzieren der ursprünglichen float-Objekt. repr(value) gewährleistet dies. "%f" % value nicht.
```
# Python 2.6.6
>>> nums = [1323494016.855676, 1323493818.004238, 198.8514380455017, 1.0 / 3]
>>> for v in nums:
...     rv = repr(v)
...     fv = "%f" % v
...     sv = str(v)
...     print rv, float(rv) == v, fv, float(fv) == v, sv, float(sv) == v
...
1323494016.8556759 True 1323494016.855676 True 1323494016.86 False
1323493818.0042379 True 1323493818.004238 True 1323493818.0 False
198.85143804550171 True 198.851438 False 198.851438046 False
0.33333333333333331 True 0.333333 False 0.333333333333 False
```
Beachten Sie, dass in der oben genannten, es erscheint durch Einsicht in die Saiten produziert, dass keiner der %f Fällen gearbeitet. Vor 2.7, Python repr immer verwendet 17 signifikante Dezimalstellen. In 2.7 wurde dies geändert, um mit die minimale Anzahl vor Ziffern an, die noch garantiert float(repr(v)) == v. Der Unterschied ist nicht einem Rundungsfehler.
```
# Python 2.7 output
1323494016.855676 True 1323494016.855676 True 1323494016.86 False
1323493818.004238 True 1323493818.004238 True 1323493818.0 False
198.8514380455017 True 198.851438 False 198.851438046 False
0.3333333333333333 True 0.333333 False 0.333333333333 False
```
Beachten Sie die verbesserte repr() Ergebnisse in der ersten Spalte oben.

Update 2 in Reaktion auf Kommentar """Und vielen Dank für die info auf Python 2.7. Leider bin ich beschränkt auf 2.6.2 (läuft auf dem Ziel-Rechner, die nicht aktualisiert werden kann). Aber ich werde dies im Hinterkopf behalten für zukünftige Skripte. """

Ist es egal. float('0.3333333333333333') == float('0.33333333333333331') produziert True auf allen Versionen von Python. Dies bedeutet, dass Sie schreiben konnte Sie Ihre Datei auf 2,7 und es Lesen würden, die gleich auf 2.6, oder Umgekehrt. Es ist keine änderung in der Genauigkeit, was repr(a_float_object) produziert.
- Danke für den Hinweis, warum dies geschieht. Ich könnte gesehen haben, die "stringified mit str()" aber meine n00bness mit Python nicht hissen einer Flagge w.r.t. str().
- Die OP erklärte, dass er neu ist Python. Funktionierenden code, behebt sein problem ist, was gebraucht wird, vielmehr als ein cavalier, Akademische Antwort.
- Den code in die OP ' s Frage zeigt, dass "neue Python" ist bescheiden; er schien in der Lage zu produzieren code, der die Iteration über ein dict, und aktualisieren Sie Ihre Werte, ohne Händchenhalten.
- Obwohl ich nur in der Lage zu tun, so nach Stunden des Suchens und optimieren, aber letztendlich hat es. Das ist, bis ich lief in das ursprüngliche problem, die 4 Stunden an den Haaren ziehen nicht lösen. Beide Antworten waren hilfreich für die verschiedenen Punkte, die Sie jeder gemacht. Und danke für die info, auf Python 2.7. Leider bin ich beschränkt auf 2.6.2 (läuft auf dem Ziel-Rechner, die nicht aktualisiert werden kann). Aber ich werde dies im Hinterkopf behalten für zukünftige Skripte.
InformationsquelleAutor John Machin
1

Funktioniert es, aber es ist wahrscheinlich nicht die beste/effizienteste Weg:
```
>>> f = StringIO()
>>> w = csv.DictWriter(f,fieldnames=headers)
>>> w.writerow(dict((k,"%f"%d[k]) for k in d.keys()))
>>> f.getvalue()
'1323493818.004238,1323494016.855676,198.851438\r\n'
```
- Sieht aus wie Ihre Schwimmern Runden auch, es sei denn, dass ein Artefakt von getvalue(). Ich werde das prüfen.
- Nichts zu tun mit "getvalue". %f Formatierung verwendet nur 6 Dezimalstellen in einigen Fällen. "Sieht aus wie" ist irreführend; siehe meine aktualisierte Antwort.
InformationsquelleAutor Burhan Khalid

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.