Pandas dataframe umwandeln in Utf-8

Ich habe eine df aus 100 Zeilen und 24 Spalten. Die Spalte Typ string ist. Es wirft mir die folgende Fehlermeldung, wenn ich versuchte, fügen Sie den Daten-frame zu KDB

UnicodeEncodeError: 'ascii' codec can't encode character '\xd3' in position 9: ordinal not in range(128)

Hier ist ein Beispiel für die erste Zeile in meiner df.

                        AnnouncementDate AuctionDate    BBT  \
_id
00000067   2012-12-11T00:00:00.000+00:00         NaN   FHLB

           CouponDividendRate DaysToSettle  \
_id
00000067                 0.61            1

                                        Description  \
_id
00000067                         FHLB 0.61 12/28/16

                     FirstSettlementDate           ISN IsAgency IsWhenIssued  \
_id
00000067   2012-12-28T00:00:00.000+00:00  US313381K796     True        False


           ...  OnTheRunTreasury OperationalIndicator  \
_id        ...
00000067   ...               NaN                False


          OriginalAmountOfPrincipal OriginalMaturityDate  \
_id
00000067                 13000000.0                  NaN


          PrincipalAmountOutstanding       SCSP       SMCP  \
_id
00000067                         0.0  313381K79   76000000

           SecurityTypeLevel1 SecurityTypeLevel2   TCK
_id
00000067          US-DOMESTIC                NaN   NaN

Meine Frage ist, gibt es eine einfache Möglichkeit zu konvertieren, meine df utf-8-format?

Möglicherweise so etwas wie df = df.encode('utf-8')

Dank

  • Irgendwann werden Sie besiedelten das dataframe, wie? Der einfachste Weg, um dieses Problem zu lösen ist, senden Sie die richtigen Werte aus starten. Auch, teilen sich eine kleine Probe mit df.Leiter (in).to_dict().
  • Die df ist bevölkert von einem json-Objekt. Es geschieht automatisch mit json_normalize.
  • versuchen Sie, diese stackoverflow.com/questions/33699343/..., bevor Sie Sie verwenden json_normalize oder pandas.pydata.org/pandas-docs/stable/generated/... und setzen Sie encoding auf utf8
Schreibe einen Kommentar