Konvertieren Objekt zu string in pandas
Ich habe variable in pandas dataframe mit den Werten, wie unten
print (df.xx)
1 5679558
2 (714) 254
3 0
4 00000000
5 000000000
6 00000000000
7 000000001
8 000000002
9 000000003
10 000000004
11 000000005
print (df.dtypes)
xx object
Bin ich, wie die unten, um zu konvertieren, das als num
try:
print df.xx.apply(str).astype(int)
except ValueError:
pass
Ich wollte versuchen, wie diese
tin.tin = tin.tin.to_string().astype(int)
Aber das gibt mir MemoryError
, als ich mit einer 3M Zeilen.
Können einige Körper mir helfen, in stripping von speziellen Zeichen und die Konvertierung als int64?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Können Sie testen, ob der string
isdigit
und dann mit der boolean-Maske zu konvertieren, diese Zeilen nur in eine vektorisierte Art und Weise und verwendento_numeric
mit paramerrors='coerce'
:Könnten Sie teilen Sie Ihre riesigen dataframe in chunks, zum Beispiel mit dieser Methode können es tun, wo Sie selbst entscheiden kann, was die chunk-Größe:
Haben Sie nach dem Brocken, können Sie Ihre Funktion auf jedes Stück separat.