Zum analysieren von mehreren, aufeinander folgenden xml-Dateien in einem Dokument?

Ich habe eine große text-Datei, die eine Sequenz von XML-Valide Dokumente, die wie folgt aussieht:

<DOC>
   <TEXT> ... </TEXT>
    ...
</DOC>
<DOC>
    <TEXT> ... </TEXT>
    ...
</DOC>

etc. Es gibt keine <?xml version="1.0">, die <DOC></DOC> trennt jede einzelne xml. Was ist der beste Weg, um zu analysieren, diese in Java und Holen Sie sich die Werte unter <TEXT> in jedem <DOC>?

Wenn ich übergeben Sie die ganze Sache um ein DocumentBuilder, bekomme ich eine Fehlermeldung besagt, dass das Dokument ist nicht wohlgeformt. Gibt es eine bessere Lösung als einfach-Traversierung durch, ein Gebäude, ein string für jeden <DOC>?

InformationsquelleAutor neptune | 2011-05-10
Schreibe einen Kommentar