python-Lesung in der multi-Spalte tsv-Datei mit Zeilennummern
Was ist die sauberste Art und Weise zu Lesen, die in mehreren Spalten die tsv-Datei in den python-Header, aber wo die erste Spalte hat keine überschrift und stattdessen enthält die Zeilennummern für jede Zeile?
Dies ist offenbar ein gemeinsames format von Dateien, die aus R-Daten-frames.
Beispiel:
A B C
1 a1 b1 c1
2 a2 b2 c2
3 a3 b3 c3
Irgendwelche Ideen?
Welche Ausgaben erwarten Sie?
InformationsquelleAutor 719016 | 2014-09-09
Du musst angemeldet sein, um einen Kommentar abzugeben.
Hängt davon ab, was du mit den Daten hinterher (und wenn die Datei wirklich einen tsv mit einem \t-delimiter aus). Wenn Sie nur wollen, dass es in einer Reihe von Listen, die Sie verwenden können, die
csv
Modul etwa so:Allerdings würde ich auch empfehlen, die
DataFrame
Modul auspandas
für alles, was außerhalb der einfachen python-Operationen. Es kann als solches verwendet werden:DataFrames ermöglichen high-level-manipulation von Daten-sets wie das hinzufügen von Spalten finden, Mittelwerte, etc..
InformationsquelleAutor
Wie wäre es mit der folgenden nativen Python-codes:
InformationsquelleAutor skyuuka
df = DataFrame.from_csv("tsv.tsv", sep="\t")
ist veraltetdf.read_csv("tsv.tsv", sep="\t")
ist wahrscheinlich arbeitenInformationsquelleAutor Pil Kwon