Aufteilen von großen text-Datei, die durch ein Trennzeichen in Python
Ich imaging-dies ist eine einfache Aufgabe, aber ich kann nicht finden, was ich Suche, genau in der vorherigen StackOverflow-Fragen hier geht...
Ich haben Sie große text-Dateien in ein proprietry format, das Aussehen comething wie diese:
:Entry
- Name
John Doe
- Date
20/12/1979
:Entry
-Name
Jane Doe
- Date
21/12/1979
Und so weiter.
Text-Dateien in der Größe von 10kb auf 100mb. Ich muss aufteilen, diese Datei von der :Entry
Trennzeichen. Wie könnte ich jede Datei basierend auf :Entry
Blöcke?
- Definieren Sie "groß".
Du musst angemeldet sein, um einen Kommentar abzugeben.
Könnten Sie itertools.groupby Gruppe Linien, die auftreten, nachdem
:Entry
in Listen:Erträge
Oder die Verarbeitung der Gruppen, die Sie nicht wirklich brauchen, um zu konvertieren
group
zu einer Liste:Wenn jeder Eintrag ein block beginnt mit einem Doppelpunkt, können Sie auch einfach geteilt durch das: