Konvertieren von XML-Datei in CSV-Format in java

@Vor Es werden wahrscheinlich einige doppelte Fragen, Anregungen, ich glaube nicht, dass das der Fall ist, vielleicht Lesen Sie dies zuerst, ich werde versuchen es so kurz wie möglich. Titel gibt die grundlegende Idee.

Hier ist ein Beispiel-XML(Fall 1) :

<root>
      <Item>
        <ItemID>4504216603</ItemID>
        <ListingDetails>
          <StartTime>10:00:10.000Z</StartTime>
          <EndTime>10:00:30.000Z</EndTime>
          <ViewItemURL>http://url</ViewItemURL>
            ....
           </item>

Hier ist ein Beispiel-XML(Fall 2) :

          <Item>
            <ItemID>4504216604</ItemID>
            <ListingDetails>
              <StartTime>10:30:10.000Z</StartTime>
              <!-- Start difference from case 1 -->
              <averages>
              <AverageTime>value1</AverageTime>
              <category type="TX">9823</category>
              <category type="TY">9112</category>
              <AveragePrice>value2</AveragePrice>
              </averages>
              <!-- End difference from case 1 -->
              <EndTime>11:00:10.000Z</EndTime>
              <ViewItemURL>http://url</ViewItemURL>
                ....
               </item>
                </root>

Ich lieh mir dieses XML von google sowieso meine Objekte sind nicht immer gleich, manchmal gibt es zusätzliche Elemente, wie in case2. Jetzt würde ich gerne produzieren CSV-wie dies von beiden Fällen:

ItemID,StartTime,EndTime,ViewItemURL,AverageTime,AveragePrice
4504216603,10:00:10.000Z,10:00:30.000Z,http://url
4504216604,10:30:10.000Z,11:00:10.000Z,http://url,value1,value2

Diese 1. Zeile ist Kopfzeile sollte es auch aufgenommen werden im csv-Format. Ich habe einige nützliche links zu stax habe ich heute nicht wirklich weiß nicht, was ist der richtige/optimale Konzept für diese, ich bin mit diesen zu kämpfen, für 3 Tage jetzt, nicht wirklich aufgeben noch.

Sagen Sie mir, was Sie denken, wie würden Sie dies lösen,

Ich vergaß zu erwähnen, dies ist sehr großen xml-Datei bis zu 1gb

BOUNTY UPDATE :

Ich bin auf der Suche nach mehr Generischen Ansatz, was bedeutet, dass diese Arbeit sollte für eine beliebige Anzahl von Knoten mit beliebiger Tiefe, und manchmal, wie im Beispiel-xml ist, kann es passieren, dass man item Objekt hat eine größere Anzahl von Knoten als die nächste/vorhergehende, so sollte es auch den Fall(also alle Spalten und Werte entsprechen in CSV).

Außerdem kann es passieren, daß Knoten, die den gleichen Namen haben/localName, aber unterschiedliche Werte und Attribute, wenn das der Fall ist, dann neue Spalte angezeigt werden soll in CSV mit den entsprechenden Wert. (Ich fügte hinzu, Beispiel diesem Fall innerhalb <averages> tag aufgerufen category)

Sind die Werte Wert1, ... , wertn immer sofort Kinder der <averages/> element? Ist averages das einzige element, das erscheinen könnte? Oder tun, Sie müssen flexibler sein, über das, was dort erscheint?
Ich aktualisiert meine Frage
über Ihr "update": wenn nicht das erste element ist die mit den meisten Spalten, als Sie gerade zwei Pässe/Schritte für die transformation: in Schritt eins, die Sie nur sammeln Sie alle Spalten, die in Schritt 2 Verfahren Sie wie beschrieben. Wenn kein Wert Knoten zu einem bestimmten Knoten zu finden ist, als können Sie einen Wert ein, den Sie wünschen (null oder leer oder was auch immer-Konvention, die Sie mögen - siehe meine Beschreibung in die Antwort). Es ist nicht ein problem, dass die Knoten Ineinander verschachtelt sind, da für CSV-werden Sie rot flach.
Ionescu danke für deine Antwort, ich denke ich habe genug gesammelt algorithmen für die Lösung, ich habe sogar ein implementiert(funktioniert nicht richtig), aber jetzt ich bin auf der Suche nach etwas code, damit Sie das Kopfgeld.

InformationsquelleAutor ant | 2010-07-20

Den code bereitgestellt werden, sollte erwogen werden, eine Skizze eher als der definitive Artikel. Ich bin kein Experte auf SAX und die Umsetzung könnte noch verbessert werden für eine bessere performance, einfachere code etc. Das sagte SAX sollten in der Lage sein zu bewältigen, das streaming von großen XML-Dateien.

Ich würde nähern dieses problem mit 2 Pässen mit dem SAX-parser. (Übrigens, ich würde auch ein CSV erzeugen-Bibliothek, um die Ausgabe zu erstellen, dies würde sich mit all den vertrackten Charakter der Flucht, die CSV beinhaltet, aber das habe ich noch nicht implementiert, das in meiner Skizze).

Ersten Durchgang:
Etablieren Anzahl der header-Spalten

Zweiten Durchgang:
Ausgabe CSV -

Ich gehe davon aus, dass die XML-Datei wohlgeformt ist. Ich gehe davon aus, dass wir nicht in ein Schema/DTD-mit einer vorgegebenen Reihenfolge.

Im ersten Durchgang habe ich angenommen, dass Sie eine CSV-Spalte Hinzugefügt wird für jedes XML-element mit text-Inhalt oder für jedes Attribut (ich habe angenommen Attribute enthalten etwas!).

Den zweiten Durchgang, nachdem festgestellt wurde, die Anzahl der Ziel-Spalten, wird die CSV-Ausgabe.

Basierend auf deinem Beispiel-XML-mein-code-Skizze erzeugen würde:

ItemID,StartTime,EndTime,ViewItemURL,AverageTime,category,category,type,type,AveragePrice
4504216603,10:00:10.000Z,10:00:30.000Z,http://url,,,,,,
4504216604,10:30:10.000Z,11:00:10.000Z,http://url,value1,9823,9112,TX,TY,value2

Bitte beachten Sie ich habe die google-Sammlungen LinkedHashMultimap als dies ist hilfreich bei der Zuordnung mehrerer Werte mit einem einzigen Schlüssel. Ich hoffe, Sie finden diese nützlich!

import com.google.common.collect.LinkedHashMultimap;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.LinkedHashMap;
import java.util.Map.Entry;
import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
import org.xml.sax.helpers.XMLReaderFactory;

public class App {

    public static void main(String[] args) throws SAXException, FileNotFoundException, IOException {
        //First pass - to determine headers
        XMLReader xr = XMLReaderFactory.createXMLReader();
        HeaderHandler handler = new HeaderHandler();
        xr.setContentHandler(handler);
        xr.setErrorHandler(handler);
        FileReader r = new FileReader("test1.xml");
        xr.parse(new InputSource(r));

        LinkedHashMap<String, Integer> headers = handler.getHeaders();
        int totalnumberofcolumns = 0;
        for (int headercount : headers.values()) {
            totalnumberofcolumns += headercount;
        }
        String[] columnheaders = new String[totalnumberofcolumns];
        int i = 0;
        for (Entry<String, Integer> entry : headers.entrySet()) {
            for (int j = 0; j < entry.getValue(); j++) {
                columnheaders[i] = entry.getKey();
                i++;
            }
        }
        StringBuilder sb = new StringBuilder();
        for (String h : columnheaders) {
            sb.append(h);
            sb.append(',');
        }
        System.out.println(sb.substring(0, sb.length() - 1));

        //Second pass - collect and output data

        xr = XMLReaderFactory.createXMLReader();

        DataHandler datahandler = new DataHandler();
        datahandler.setHeaderArray(columnheaders);

        xr.setContentHandler(datahandler);
        xr.setErrorHandler(datahandler);
        r = new FileReader("test1.xml");
        xr.parse(new InputSource(r));
    }

    public static class HeaderHandler extends DefaultHandler {

        private String content;
        private String currentElement;
        private boolean insideElement = false;
        private Attributes attribs;
        private LinkedHashMap<String, Integer> itemHeader;
        private LinkedHashMap<String, Integer> accumulativeHeader = new LinkedHashMap<String, Integer>();

        public HeaderHandler() {
            super();
        }

        private LinkedHashMap<String, Integer> getHeaders() {
            return accumulativeHeader;
        }

        private void addItemHeader(String headerName) {
            if (itemHeader.containsKey(headerName)) {
                itemHeader.put(headerName, itemHeader.get(headerName) + 1);
            } else {
                itemHeader.put(headerName, 1);
            }
        }

        @Override
        public void startElement(String uri, String name,
                String qName, Attributes atts) {
            if ("item".equalsIgnoreCase(qName)) {
                itemHeader = new LinkedHashMap<String, Integer>();
            }
            currentElement = qName;
            content = null;
            insideElement = true;
            attribs = atts;
        }

        @Override
        public void endElement(String uri, String name, String qName) {
            if (!"item".equalsIgnoreCase(qName) && !"root".equalsIgnoreCase(qName)) {
                if (content != null && qName.equals(currentElement) && content.trim().length() > 0) {
                    addItemHeader(qName);
                }
                if (attribs != null) {
                    int attsLength = attribs.getLength();
                    if (attsLength > 0) {
                        for (int i = 0; i < attsLength; i++) {
                            String attName = attribs.getLocalName(i);
                            addItemHeader(attName);
                        }
                    }
                }
            }
            if ("item".equalsIgnoreCase(qName)) {
                for (Entry<String, Integer> entry : itemHeader.entrySet()) {
                    String headerName = entry.getKey();
                    Integer count = entry.getValue();
                    //System.out.println(entry.getKey() + ":" + entry.getValue());
                    if (accumulativeHeader.containsKey(headerName)) {
                        if (count > accumulativeHeader.get(headerName)) {
                            accumulativeHeader.put(headerName, count);
                        }
                    } else {
                        accumulativeHeader.put(headerName, count);
                    }
                }
            }
            insideElement = false;
            currentElement = null;
            attribs = null;
        }

        @Override
        public void characters(char ch[], int start, int length) {
            if (insideElement) {
                content = new String(ch, start, length);
            }
        }
    }

    public static class DataHandler extends DefaultHandler {

        private String content;
        private String currentElement;
        private boolean insideElement = false;
        private Attributes attribs;
        private LinkedHashMultimap dataMap;
        private String[] headerArray;

        public DataHandler() {
            super();
        }

        @Override
        public void startElement(String uri, String name,
                String qName, Attributes atts) {
            if ("item".equalsIgnoreCase(qName)) {
                dataMap = LinkedHashMultimap.create();
            }
            currentElement = qName;
            content = null;
            insideElement = true;
            attribs = atts;
        }

        @Override
        public void endElement(String uri, String name, String qName) {
            if (!"item".equalsIgnoreCase(qName) && !"root".equalsIgnoreCase(qName)) {
                if (content != null && qName.equals(currentElement) && content.trim().length() > 0) {
                    dataMap.put(qName, content);
                }
                if (attribs != null) {
                    int attsLength = attribs.getLength();
                    if (attsLength > 0) {
                        for (int i = 0; i < attsLength; i++) {
                            String attName = attribs.getLocalName(i);
                            dataMap.put(attName, attribs.getValue(i));
                        }
                    }
                }
            }
            if ("item".equalsIgnoreCase(qName)) {
                String data[] = new String[headerArray.length];
                int i = 0;
                for (String h : headerArray) {
                    if (dataMap.containsKey(h)) {
                        Object[] values = dataMap.get(h).toArray();
                        data[i] = (String) values[0];
                        if (values.length > 1) {
                            dataMap.removeAll(h);
                            for (int j = 1; j < values.length; j++) {
                                dataMap.put(h, values[j]);
                            }
                        } else {
                            dataMap.removeAll(h);
                        }
                    } else {
                        data[i] = "";
                    }
                    i++;
                }
                StringBuilder sb = new StringBuilder();
                for (String d : data) {
                    sb.append(d);
                    sb.append(',');
                }
                System.out.println(sb.substring(0, sb.length() - 1));
            }
            insideElement = false;
            currentElement = null;
            attribs = null;
        }

        @Override
        public void characters(char ch[], int start, int length) {
            if (insideElement) {
                content = new String(ch, start, length);
            }
        }

        public void setHeaderArray(String[] headerArray) {
            this.headerArray = headerArray;
        }
    }
}

Wissen Sie, wie Sie machen es ein wenig mehr Arbeit allgemein ohne explizite Definition von 'Element' und 'root'? dh. ohne Linien wie !"posten".equalsIgnoreCase(qName) && !"Wurzel"
Hi @toop Sie konnte immer tun, es basiert auf Baum-Tiefe, siehe z.B.: stackoverflow.com/questions/6248322/...

InformationsquelleAutor

8

Dieser sieht aus wie ein guter Fall für den Einsatz von XSL. Angesichts Ihrer grundlegenden Anforderungen kann es einfacher sein, um den rechten Knoten mit XSL-im Vergleich zu custom-Parser oder serialisierungsprogramme. Der Vorteil wäre, dass das XSL-Ziel könnte "//Item//AverageTime" oder was auch immer Knoten, die Sie benötigen, ohne sich Gedanken über die knotentiefe.

UPDATE: das folgende ist Die xslt ich warf zusammen, um sicherzustellen, das wie erwartet funktionierte.
```
<?xml version="1.0"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" />
<xsl:template match="/">
ItemID,StartTime,EndTime,ViewItemURL,AverageTime,AveragePrice
<xsl:for-each select="//Item">
<xsl:value-of select="ItemID"/><xsl:text>,</xsl:text><xsl:value-of select="//StartTime"/><xsl:text>,</xsl:text><xsl:value-of select="//EndTime"/><xsl:text>,</xsl:text><xsl:value-of select="//ViewItemURL"/><xsl:text>,</xsl:text><xsl:value-of select="//AverageTime"/><xsl:text>,</xsl:text><xsl:value-of select="//AveragePrice"/><xsl:text>
</xsl:text>
</xsl:for-each>
</xsl:template>

</xsl:stylesheet>
```
Escpecially das Erfordernis eines "beliebigen Zahl von Knoten mit Tiefe" zwingen sollte, seine Gedanken in Richtung XSL "//Item".
XSL wäre die perfekte Wahl, wenn das war eine kleine Datei, aber der DOM für eine 1gb Datei nehmen könnte, eine riesige Menge an Speicher. Also ich könnte mir vorstellen eine Art von spezialisierten streaming-XSL angewandt werden müsste (in diesem thread bereits erwähnt Saxonica und VTD-XML) Siehe auch: stackoverflow.com/questions/2301926/xml-process-large-data
Das ist einige interessante Informationen. In diesem Fall, ein streaming-xsl-tech sinnvoll wäre. Danke für den link Daneben.

InformationsquelleAutor
5

Ich bin mir nicht sicher, ob ich verstehe, wie die generische Lösung sein soll. Wollen Sie wirklich zu analysieren, eine 1 GB Datei zweimal für eine generische Lösung? Und wenn Sie wollen, etwas generisch, warum hast du übersprungen <category> element in deinem Beispiel? Wie viel anderen format benötigen Sie zu handhaben? Tun Sie wirklich nicht wissen, was das format kann (auch wenn einige element kann weggelassen werden)? Können Sie das klären?

Meiner Erfahrung ist es generell sinnvoller zu analysieren, bestimmte Dateien in einer bestimmten Art und Weise (dies schließt nicht die Verwendung eines generischen API). Meine Antwort in diese Richtung zu gehen (und ich werde es zu aktualisieren, nach der Klärung).

Wenn Sie sich nicht wohl fühlen mit XML, könnten Sie erwägen, einige der bestehenden (kommerziellen) Bibliotheken, zum Beispiel Ricebridge XML-Manager und CSV-Manager. Sehen Wie konvertieren von CSV in XML und XML in CSV mit Hilfe von Java für ein vollständiges Beispiel. Der Ansatz ist Recht einfach: Sie definieren die Daten, die Felder mithilfe von XPath-Ausdrücken (die perfekt ist in Ihrem Fall, da können Sie "extra" - Elemente), das Parsen der Datei und übergeben Sie das Ergebnis List zu der CSV-Komponente zum generieren der CSV-Datei. Die API sieht einfach, den code getestet (den Quellcode Ihrer Testfälle steht unter einer BSD-style license), Sie behaupten, die Unterstützung von gigabyte-großen Dateien.

Erhalten Sie eine Entwickler-Lizenz für $170, die ist nicht sehr teuer im Vergleich zu Entwickler täglich Preisen.

Bieten Sie 30 Tage trial-Versionen, haben einen Blick.

Andere Möglichkeit wäre die Verwendung von Spring Batch. Spring batch bietet alles, was erforderlich ist, um XML-Dateien als Eingang oder Ausgabe (mit StAX und die XML-binding-framework Ihrer Wahl) und Flatfiles als Eingang oder Ausgabe. Siehe:
- die Spring Batch Dokumentation
- die Proben (vor allem die Handel Probe)
- Einen ersten Blick auf die Spring-Batch, Teil 2
Könnten Sie auch Smooks zu tun, XML -, CSV -Transformationen. Siehe auch:
- Strukturierte Ereignis-Streaming mit Smooks
Eine andere option wäre, Rollen Sie Ihre eigene Lösung mit einem StAX-parser oder, warum nicht, mit VTD-XML und XPath. Haben Sie einen Blick auf:
- Einführung in die VTD - XML
- Schemaless Java-XML Data Binding mit VTD-XML
InformationsquelleAutor
2

Der beste Weg, um code, basierend auf Ihrer beschriebenen Anforderung ist die Verwendung der easy-Funktion von FreeMarker und XML-Verarbeitung. Siehe die Dokumentation.

In diesem Fall brauchen Sie nur die Vorlage, erzeugt eine CSV-Datei.

Eine alternative dazu ist XMLGen, aber sehr ähnlich in der Herangehensweise. Schauen Sie das Diagramm und Beispiele, und anstelle von SQL-Anweisungen wird die Ausgangs-CSV.

Diese zwei ähnliche Ansätze werden nicht "herkömmlich", aber die Arbeit machen, die sehr schnell für Ihre situation, und Sie müssen nicht lernen, XSL (ziemlich schwer zu meistern wie ich finde).

InformationsquelleAutor

Hier einige code, der implementiert die Umwandlung von XML nach CSV mit StAX. Obwohl die XML-Ausgabe gab, ist nur ein Beispiel, ich hoffe, dass dies zeigt, Sie zu behandeln, wie die optionalen Elemente.

import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.XMLStreamException;
import javax.xml.stream.XMLStreamReader;
import java.io.*;

public class App 
{
    public static void main( String[] args ) throws XMLStreamException, FileNotFoundException
    {
        new App().convertXMLToCSV(new BufferedInputStream(new FileInputStream(args[0])), new BufferedOutputStream(new FileOutputStream(args[1])));
    }

    static public final String ROOT = "root";
    static public final String ITEM = "Item";
    static public final String ITEM_ID = "ItemID";
    static public final String ITEM_DETAILS = "ListingDetails";
    static public final String START_TIME = "StartTime";
    static public final String END_TIME = "EndTime";
    static public final String ITEM_URL = "ViewItemURL";
    static public final String AVERAGES = "averages";
    static public final String AVERAGE_TIME = "AverageTime";
    static public final String AVERAGE_PRICE = "AveragePrice";
    static public final String SEPARATOR = ",";

    public void convertXMLToCSV(InputStream in, OutputStream out) throws XMLStreamException
    {
        PrintWriter writer = new PrintWriter(out);
        XMLStreamReader xmlStreamReader = XMLInputFactory.newInstance().createXMLStreamReader(in);
        convertXMLToCSV(xmlStreamReader, writer);
    }

    public void convertXMLToCSV(XMLStreamReader xmlStreamReader, PrintWriter writer) throws XMLStreamException {
        writer.println("ItemID,StartTime,EndTime,ViewItemURL,AverageTime,AveragePrice");
        xmlStreamReader.nextTag();
        xmlStreamReader.require(XMLStreamConstants.START_ELEMENT, null, ROOT);

        while (xmlStreamReader.hasNext()) {
            xmlStreamReader.nextTag();
            if (xmlStreamReader.isEndElement())
                break;

            xmlStreamReader.require(XMLStreamConstants.START_ELEMENT, null, ITEM);
            String itemID = nextValue(xmlStreamReader, ITEM_ID);
            xmlStreamReader.nextTag(); xmlStreamReader.require(XMLStreamConstants.START_ELEMENT, null, ITEM_DETAILS);
            String startTime = nextValue(xmlStreamReader, START_TIME);
            xmlStreamReader.nextTag();
            String averageTime = null;
            String averagePrice = null;

            if (xmlStreamReader.getLocalName().equals(AVERAGES))
            {
                averageTime = nextValue(xmlStreamReader, AVERAGE_TIME);
                averagePrice = nextValue(xmlStreamReader, AVERAGE_PRICE);
                xmlStreamReader.nextTag();
                xmlStreamReader.require(XMLStreamConstants.END_ELEMENT, null, AVERAGES);
                xmlStreamReader.nextTag();
            }
            String endTime = currentValue(xmlStreamReader, END_TIME);
            String url = nextValue(xmlStreamReader,ITEM_URL);
            xmlStreamReader.nextTag(); xmlStreamReader.require(XMLStreamConstants.END_ELEMENT, null, ITEM_DETAILS);
            xmlStreamReader.nextTag(); xmlStreamReader.require(XMLStreamConstants.END_ELEMENT, null, ITEM);

            writer.append(esc(itemID)).append(SEPARATOR)
                    .append(esc(startTime)).append(SEPARATOR)
                    .append(esc(endTime)).append(SEPARATOR)
                    .append(esc(url));
            if (averageTime!=null)
                writer.append(SEPARATOR).append(esc(averageTime)).append(SEPARATOR)
                        .append(esc(averagePrice));
            writer.println();                        
        }

        xmlStreamReader.require(XMLStreamConstants.END_ELEMENT, null, ROOT);
        writer.close();

    }

    private String esc(String string) {
        if (string.indexOf(',')!=-1)
            string = '"'+string+'"';
        return string;
    }

    private String nextValue(XMLStreamReader xmlStreamReader, String name) throws XMLStreamException {
        xmlStreamReader.nextTag();
        return currentValue(xmlStreamReader, name);
    }

    private String currentValue(XMLStreamReader xmlStreamReader, String name) throws XMLStreamException {
        xmlStreamReader.require(XMLStreamConstants.START_ELEMENT, null, name);
        String value = "";
        for (;;) {
            int next = xmlStreamReader.next();
            if (next==XMLStreamConstants.CDATA||next==XMLStreamConstants.SPACE||next==XMLStreamConstants.CHARACTERS)
                value += xmlStreamReader.getText();
            else if (next==XMLStreamConstants.END_ELEMENT)
                break;
            //ignore comments, PIs, attributes
        }
        xmlStreamReader.require(XMLStreamConstants.END_ELEMENT, null, name);
        return value.trim();
    }    
}

Danke für Ihre Antwort, ich bin auf der Suche nach mehr Generischen Ansatz, d.h. es sollte funktionieren für eine beliebige Anzahl von Knoten mit beliebiger Tiefe, und manchmal, wie im Beispiel-xml ist, kann es passieren, dass ein Element-Objekt hat eine größere Anzahl von Knoten als der nächste, so sollte es auch sein Fall. Auch kann es passieren, dass Knoten haben den gleichen Namen aber unterschiedliche Werte und Attribute, ist der Fall für die neue Spalte in der CSV-wie auch.

InformationsquelleAutor

1

Ich bin nicht davon überzeugt, dass SAX ist der beste Ansatz für Sie.
Es gibt verschiedene Möglichkeiten, die Sie nutzen könnten SAX hier, obwohl.

Wenn element-Reihenfolge ist nicht garantiert, innerhalb bestimmter Elemente, wie ListingDetails, dann müssen Sie proaktiv zu sein.

Wenn man ein ListingDetails, initialisieren einer Karte als eine member-variable an die Prozedur übergeben. In jedem Unterelement, legen Sie den entsprechenden Schlüssel-Wert dieser Karte. Wenn Sie fertig sind eine ListingDetails, untersuchen Sie die Karte und explizit mock Werte wie null-Werte für die fehlenden Elemente. Vorausgesetzt, Sie haben ein ListingDetails pro Element, speichern Sie es auf eine member-variable in der Prozedur.

Nun, wenn deine item-element ist über, eine Funktion haben, das schreibt die Zeile Wird basierend auf der Karte in der Reihenfolge, die Sie wollte.

Die Gefahr mit diesem ist wenn Sie haben beschädigte XML. Ich würde stark darüber nachdenken, die Einstellung aller dieser Variablen auf null, wenn ein Element beginnt, und dann die überprüfung für Fehler und kündigt Ihnen, wenn das Element endet.

InformationsquelleAutor
1

Beachten Sie, dass dies ein hervorragendes Beispiel für eine Verwendung von XSLT-außer, dass die meisten XSLT-Prozessoren Lesen die ganze XML-Datei in den Speicher, das ist nicht eine option, da es zu groß ist. Beachten Sie jedoch, dass die enterprise-version von Saxon können streaming-XSLT-Verarbeitung (wenn der XSLT-Skript hält sich an die Einschränkungen).

Möglicherweise möchten Sie auch auf die Verwendung eines externen XSLT-Prozessor außerhalb Ihrer JVM statt, falls zutreffend. Dies eröffnet mehrere Optionen.

Streaming in Saxon-EE: http://www.saxonica.com/documentation/sourcedocs/serial.html

Es ist auch Joost/STX joost.sourceforge.net, die eine XSLT-ähnliche Sprache, mit einigen zusätzlichen Einschränkungen für das streaming. Da dieses problem nur erfordert die sequentielle Verarbeitung der Eingabe, sollte es passen gut in dieses Modell.
Warum nur XSLT-wie statt eines XSLT-Teilmenge?

InformationsquelleAutor
0

Könnten Sie XStream (http://x-stream.github.io/) oder JOX (http://www.wutka.com/jox.html) zu erkennen, xml und konvertieren Sie Sie dann in einer Java-Bean. Ich denke, Sie können konvertieren Sie die Bohnen in das CSV automatisch, sobald man die Bohne.

InformationsquelleAutor

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.