JAXB - unmarshal OutOfMemory: Java Heap Space

Ich versuche momentan, um JAXB verwenden zu unmarshal XML-Datei, aber es scheint, dass die XML-Datei ist zu groß (~500mb) für die unmarshaller zu handhaben. Ich erhalte java.lang.OutOfMemoryError: Java heap space @

Unmarshaller um = JAXBContext.newInstance("com.sample.xml");
Export e = (Export)um.unmarhsal(new File("SAMPLE.XML"));

Ich vermute, dies ist, weil es versucht, öffnen Sie die große XML-Datei als Objekt, sondern die Datei ist einfach zu groß für die java-heap-space.

Gibt es eine andere, eher "Speicher-effiziente" Methode der Parsen großer XML-Dateien ~ 500mb? Oder vielleicht ein unmarshaller Eigentum, die kann mir helfen, Griff der großen XML-Datei?

Hier ist, was mein XML sieht aus wie

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<!-- -->
<Export xmlns="wwww.foo.com" xmlns:xsi="www.foo1.com" xsi:schemaLocation="www.foo2.com/.xsd">
<!--- --->
<Origin ID="foooo" />
<!---- ---->
<WorkSets>
   <WorkSet>
      <Work>
         .....
      <Work>
         ....
      <Work>
      .....
   </WorkSet>
   <WorkSet>
      ....
   </WorkSet>
</WorkSets>

Möchte ich unmarshal in den WorkSet-Ebene, noch in der Lage zu Lesen, durch all die Arbeit, die für jeden WorkSet.

InformationsquelleAutor TyC | 2011-11-01

10

Was macht Ihr XML Aussehen? In der Regel für große Dokumente, die ich empfehlen Menschen nutzen einen StAX XMLStreamReader, so dass können Sie das Dokument unmarshallt von JAXB in Stücke schneiden.

input.xml

In das Dokument unten gibt es viele Instanzen der person element. Wir können JAXB mit StAX XMLStreamReader zu unmarshal die entsprechenden Person Objekte ein zu einer Zeit zu vermeiden, läuft out of memory.
```
<people>
   <person>
       <name>Jane Doe</name>
       <address>
           ...
       </address>
   </person>
   <person>
       <name>John Smith</name>
       <address>
           ...
       </address>
   </person>
   ....
</people>
```
Demo
```
import java.io.*;
import javax.xml.stream.*;
import javax.xml.bind.*;

public class Demo {

    public static void main(String[] args) throws Exception  {
        XMLInputFactory xif = XMLInputFactory.newInstance();
        XMLStreamReader xsr = xif.createXMLStreamReader(new FileReader("input.xml"));
        xsr.nextTag(); //Advance to statements element

        JAXBContext jc = JAXBContext.newInstance(Person.class);
        Unmarshaller unmarshaller = jc.createUnmarshaller();
        while(xsr.nextTag() == XMLStreamConstants.START_ELEMENT) {
            Person person = (Person) unmarshaller.unmarshal(xsr);
        }
    }

}
```
Person

Statt matching auf das root-element des XML-Dokuments, müssen wir hinzufügen @XmlRootElement Anmerkungen auf dem lokalen root des XML-fragment, das werden wir unmarshalling aus.
```
@XmlRootElement
public class Person {
}
```
- Danke @Blaise das wirklich hilfreich.
- Ich war immer auf Fehler in der letzten Linie und war erforderlich, um (in deinem Beispiel der Fall) cast (Person) unmarshaller.unmarshal(xsr);. Ist das richtig?
- Das ist richtig, ich habe aktualisiert die Beispiel-code.
- Wie funktioniert der XMLStreamReader unterscheiden zwischen start-Elemente? Zum Beispiel macht es zu versuchen, erstellen Sie eine neue Instanz von Person, wenn es um ein start-element?
- ist nur Los, um uns den Zugang zu XML-Ereignisse in depth-first-Ordnung. Der trick ist, wir müssen erkennen, beginnen element Mitgliedstaaten von teilen der XML-wollen wir JAXB zu unmarshal. JAXB wird dann vorab die XMLStreamReader am Ende des Elements. Dann suchen wir das nächste fragment wollen wir unmarshal aus.
- mein Programm ist nicht die Eingabe der while(xsr.nextTag() == XMLStreamConstants.START_ELEMENT). Sobald er bekommt es das Programm gibt null. Ich habe meine aktualisierten XML-oben, ist es, weil Sie auf andere Elemente, bevor Sie auf die WorkSet oder Person in Ihrem Fall?
- Sie müssen spielen mit der Weiterentwicklung der XMLStreamReader um die Dinge einfach schreiben. Sie können Fragen, die XMLStreamReader für den Namen des aktuellen Knotens, um zu sehen, wo Sie in der Traversierung.
InformationsquelleAutor bdoughan
5

Könnte man erhöhen heap space über die -Xmx startup Arguments.

Für große Dateien, SAX-Verarbeitung ist mehr Speicher-effizient, denn es ist ereignisgesteuert, und laden nicht die gesamte Struktur im Speicher.

InformationsquelleAutor Dave Newton
2

Ich habe dabei eine Menge Forschung vor allem mit Blick auf das analysieren sehr große Eingabe-sets bequem. Es ist wahr, dass Sie verbinden könnte, StaX und JaxB selektiv analysieren von XML-Fragmenten, aber es ist nicht immer möglich oder vorzuziehen. Wenn Sie interessiert sind, mehr über das Thema bitte haben Sie einen Blick auf:

http://xml2java.net/documents/XMLParserTechnologyForProcessingHugeXMLfiles.pdf

In diesem Dokument beschreibe ich einen alternativen Ansatz, der sehr geradlinig und bequem zu bedienen. Es analysiert beliebig großen Eingabe-sets, während geben Ihnen Zugriff auf Ihre Daten in javabeans-Mode.
- Link oben funktioniert nicht .......
InformationsquelleAutor Lolke Dijkstra
1

Verwenden SAX oder StAX. Aber wenn das Ziel ist, um eine in-memory-Objekt Repräsentation der Datei, müssen Sie noch viel Speicher zu halten den Inhalt so eine große Datei. In diesem Fall, Ihre einzige Hoffnung ist die Erhöhung der heap-Größe über die -Xmx1024m JVM-option (stellt die max-heap-Größe auf 1024 MB)

InformationsquelleAutor JB Nizet
0

SAX, aber Sie müssen erstellen Sie Ihre Export-Objekt selbst

InformationsquelleAutor Blitzkr1eg
0

Können Sie versuchen, diese zu dies ist keine gute Praxis
aber seine arbeiten 🙂 wer kümmert sich

http://amitsavm.blogspot.in/2015/02/partially-parsing-xml-using-jaxb-by.html

Andere Weise verwenden, STAX oder SAX, oder was Blaise Doughan sagt, ist auch gut und kann man sagen, ein standard Weg, Aber wenn Sie mit komplexen XML-Struktur, und Sie wollen nicht, um Anmerkungen in Ihren Klassen manuell und mit XJC-tool.

In diesem Fall hilfreich sein könnten.
- Während dieser Zusammenhang kann eine Antwort auf die Frage, ist es besser, die wesentlichen Teile der Antwort hier und den link zur Referenz. Link-nur Antworten können ungültig werden, wenn die verlinkten Seite ändert
InformationsquelleAutor JustTry

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.