Wie machen separator pandas read_csv flexibler wrt Leerzeichen?

Brauche ich einen data frame mit Daten in einer Datei gespeichert. Für die, die ich verwenden möchten read_csv Methode. Aber der separator ist nicht sehr regelmäßig. Einige Spalten durch tabs getrennt sind (\t), andere sind durch Leerzeichen getrennt. Darüber hinaus sind einige Spalten können getrennt werden, um 2 oder 3 oder mehr Leerzeichen oder auch durch eine Kombination von Leerzeichen und Tabulatoren (zum Beispiel 3 Räume, zwei tabs und dann 1 Raum).

Gibt es eine Möglichkeit zu sagen, pandas zu behandeln, diese Dateien richtig?

By the way, ich habe nicht dieses problem auf, wenn ich die Python verwenden. Ich benutze:

for line in file(file_name):
   fld = line.split()

Und es funktioniert perfekt. Es kümmert sich nicht, wenn es 2 oder 3 Leerzeichen zwischen den Feldern. Auch Kombinationen von Leerzeichen und Tabulatoren führen nicht zu einem problem. Können pandas das gleiche tun?

InformationsquelleAutor Roman | 2013-02-22
Schreibe einen Kommentar