Pandas dataframe umwandeln in Utf-8
Ich habe eine df
aus 100 Zeilen und 24 Spalten. Die Spalte Typ string ist. Es wirft mir die folgende Fehlermeldung, wenn ich versuchte, fügen Sie den Daten-frame zu KDB
UnicodeEncodeError: 'ascii' codec can't encode character '\xd3' in position 9: ordinal not in range(128)
Hier ist ein Beispiel für die erste Zeile in meiner df.
AnnouncementDate AuctionDate BBT \
_id
00000067 2012-12-11T00:00:00.000+00:00 NaN FHLB
CouponDividendRate DaysToSettle \
_id
00000067 0.61 1
Description \
_id
00000067 FHLB 0.61 12/28/16
FirstSettlementDate ISN IsAgency IsWhenIssued \
_id
00000067 2012-12-28T00:00:00.000+00:00 US313381K796 True False
... OnTheRunTreasury OperationalIndicator \
_id ...
00000067 ... NaN False
OriginalAmountOfPrincipal OriginalMaturityDate \
_id
00000067 13000000.0 NaN
PrincipalAmountOutstanding SCSP SMCP \
_id
00000067 0.0 313381K79 76000000
SecurityTypeLevel1 SecurityTypeLevel2 TCK
_id
00000067 US-DOMESTIC NaN NaN
Meine Frage ist, gibt es eine einfache Möglichkeit zu konvertieren, meine df
utf-8-format?
Möglicherweise so etwas wie df = df.encode('utf-8')
Dank
- Irgendwann werden Sie besiedelten das dataframe, wie? Der einfachste Weg, um dieses Problem zu lösen ist, senden Sie die richtigen Werte aus starten. Auch, teilen sich eine kleine Probe mit df.Leiter (in).to_dict().
- Die df ist bevölkert von einem json-Objekt. Es geschieht automatisch mit json_normalize.
- versuchen Sie, diese stackoverflow.com/questions/33699343/..., bevor Sie Sie verwenden json_normalize oder pandas.pydata.org/pandas-docs/stable/generated/... und setzen Sie encoding auf utf8
Du musst angemeldet sein, um einen Kommentar abzugeben.
Es hängt davon ab, wie man die Daten ausgegeben. Wenn Sie einfach nur mithilfe von csv-Dateien, die Sie dann importieren, um KDB, dann können Sie das ganz einfach:
Oder Sie können die Kodierung beim importieren der Daten Pandas, die ursprünglich unter Verwendung der selben syntax.
Wenn Sie sich direkt an KDB mit SQLAlchemy oder ähnliches, sollten Sie versuchen Sie, diese im Anschluss selbst - siehe diese Frage: Ein weiterer UnicodeEncodeError bei der Verwendung von pandas Methode to_sql mit MySQL