Lesen Composite Document File V2 Document (.msg) Dateien in ubuntu
Ich habe einen großen dump von Daten aus einem outlook E-Mail-Konto, dass kommt ganz in .msg-Dateien. Ein kurzer Anruf bei ubuntu die Datei-Methode gezeigt, dass Sie wurden Composite Document File V2-Dokumente (was auch immer das bedeutet). Ich würde wirklich gerne in der Lage sein, diese Dateien zu Lesen als nur-Text. Ist das überhaupt möglich?
Update: Stellt sich heraus, es war nicht ganz möglich das zu tun, was ich wollte, für large scale data-mining-Verfahren auf diese Arten von Dateien, die war eine Enttäuschung. In den Fall, Sie stehen vor der gleichen Frage, die ich aus einer Bibliothek, um dieses Problem zu beheben. https://github.com/Slater-Victoroff/msgReader
Dokumentation ist nicht so toll, aber es ist eine ziemlich kleine Bibliothek, so sollte es selbsterklärend sein.
Im Grunde die gleiche Frage wird beantwortet in der [geeigneter] Super-User-community - superuser.com/questions/99250/opening-a-msg-file-in-ubuntu
InformationsquelleAutor Slater Victoroff | 2013-03-09
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich vor dem gleichen problem, heute morgen. Ich wusste nicht, finden Sie alle Informationen über die Datei-format, aber es war möglich, das extrahieren der erforderlichen Informationen aus der Datei mit strings und grep:
Die-e-l (das ist ein kleines L) konvertiert von UTF-16.
Dies wird nur funktionieren, wenn Sie grep die Daten, die Sie benötigen, aus der Datei (D. H. alle erforderlichen Leitungen enthalten, die einen standard-string oder Muster).
Fand die Dokumentation auf die Datei-format hier: openoffice.org/sc/compdocfileformat.pdf ; ich habe Sie nicht gelesen oder versucht, es zu benutzen, aber es kann nützlich sein.
Große finden! Ich werde Total werden in diesen suchen.
UTF-16, eh? Funktioniert Super; danke!
Dies kann Sie bekommen mehr als Sie erwartet hatte. Wenn Sie z.B. exportieren Sie eine Liste von E-Mail-Adressen, die sich in einer Gruppe zu einem
.msg
- Datei und löschen Sie anschließend eine der Adressenstrings -e l
wird immer noch die gelöschte Adresse, die Besondere stream .msg-Datei, die gelöschte Adresse ist abgeschnitten, aber die tatsächliche Adresse, mit Worten, nicht überschrieben.InformationsquelleAutor Ben Mayhew