Pandas dataframe umwandeln in Utf-8

Ich habe eine df aus 100 Zeilen und 24 Spalten. Die Spalte Typ string ist. Es wirft mir die folgende Fehlermeldung, wenn ich versuchte, fügen Sie den Daten-frame zu KDB

UnicodeEncodeError: 'ascii' codec can't encode character '\xd3' in position 9: ordinal not in range(128)

Hier ist ein Beispiel für die erste Zeile in meiner df.

                        AnnouncementDate AuctionDate    BBT  \
_id
00000067   2012-12-11T00:00:00.000+00:00         NaN   FHLB

           CouponDividendRate DaysToSettle  \
_id
00000067                 0.61            1

                                        Description  \
_id
00000067                         FHLB 0.61 12/28/16

                     FirstSettlementDate           ISN IsAgency IsWhenIssued  \
_id
00000067   2012-12-28T00:00:00.000+00:00  US313381K796     True        False


           ...  OnTheRunTreasury OperationalIndicator  \
_id        ...
00000067   ...               NaN                False


          OriginalAmountOfPrincipal OriginalMaturityDate  \
_id
00000067                 13000000.0                  NaN


          PrincipalAmountOutstanding       SCSP       SMCP  \
_id
00000067                         0.0  313381K79   76000000

           SecurityTypeLevel1 SecurityTypeLevel2   TCK
_id
00000067          US-DOMESTIC                NaN   NaN

Meine Frage ist, gibt es eine einfache Möglichkeit zu konvertieren, meine df utf-8-format?

Möglicherweise so etwas wie df = df.encode('utf-8')

Dank

Irgendwann werden Sie besiedelten das dataframe, wie? Der einfachste Weg, um dieses Problem zu lösen ist, senden Sie die richtigen Werte aus starten. Auch, teilen sich eine kleine Probe mit df.Leiter (in).to_dict().
Die df ist bevölkert von einem json-Objekt. Es geschieht automatisch mit json_normalize.
versuchen Sie, diese stackoverflow.com/questions/33699343/..., bevor Sie Sie verwenden json_normalize oder pandas.pydata.org/pandas-docs/stable/generated/... und setzen Sie encoding auf utf8

InformationsquelleAutor Chris Johnson | 2017-07-31

5

Es hängt davon ab, wie man die Daten ausgegeben. Wenn Sie einfach nur mithilfe von csv-Dateien, die Sie dann importieren, um KDB, dann können Sie das ganz einfach:
```
df.to_csv('df_output.csv', encoding='utf-8')
```
Oder Sie können die Kodierung beim importieren der Daten Pandas, die ursprünglich unter Verwendung der selben syntax.

Wenn Sie sich direkt an KDB mit SQLAlchemy oder ähnliches, sollten Sie versuchen Sie, diese im Anschluss selbst - siehe diese Frage: Ein weiterer UnicodeEncodeError bei der Verwendung von pandas Methode to_sql mit MySQL

InformationsquelleAutor Blodwyn Pig

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.