Erhaltung entity-Referenzen beim transformieren von XML mit XSLT?

Wie kann ich die preserve-entity-Referenzen beim transformieren von XML mit XSLT (2.0)? Mit allen Prozessoren, die ich habe versucht, die Einheit wird standardmäßig aufgelöst. Ich kann verwenden xsl:character-map zu handhaben, die Zeichen-Entitäten, aber was ist mit text-Entitäten?

Beispielsweise das XML:

<!DOCTYPE doc [
<!ENTITY so "stackoverflow">
<!ENTITY question "How can I preserve the entity reference when transforming with XSLT??">
]>
<doc>
  <text>Hello &so;!</text>
  <text>&question;</text>
</doc>

verwandelt sich in die folgenden XSLT:

<xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:output indent="yes"/>
  <xsl:strip-space elements="*"/>

  <xsl:template match="node()|@*">
    <xsl:copy>
      <xsl:apply-templates select="node()|@*"/>
    </xsl:copy>
  </xsl:template>

</xsl:stylesheet>

erzeugt die folgende Ausgabe:

<doc>
   <text>Hello stackoverflow!</text>
   <text>How can I preserve the entity reference when transforming with XSLT??</text>
</doc>

Die Ausgabe sollte so Aussehen wie die Eingabe (ohne die doctype-Deklaration für jetzt):

<doc>
  <text>Hello &so;!</text>
  <text>&question;</text>
</doc>

Ich bin Hoffnung, dass ich nicht auf pre-Prozess die Eingabe durch den Austausch aller kaufmännisches mit & (wie &question;) und dann post-Prozess die Ausgabe durch den Austausch aller & mit &.

Vielleicht ist das Prozessor-spezifisch ist? Ich bin mit Saxon 9.

Dank!

Gute Frage, +1. Die angeforderte Verarbeitung ist fast unmöglich zu tun mit XSLT und ich würde nicht empfehlen, mit meiner Antwort Häufig.

InformationsquelleAutor Daniel Haley | 2011-05-12

Wenn Sie wissen, welche Einheiten werden verwendet und wie sind Sie definiert haben, können Sie die folgenden (ziemlich primitiv und fehleranfällig, aber immer noch besser als nichts):

<xsl:stylesheet version="2.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
 xmlns:xs="http://www.w3.org/2001/XMLSchema"
 xmlns:my="my:my">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>

 <xsl:character-map name="mapEntities">
  <xsl:output-character character="&amp;" string="&amp;"/>
 </xsl:character-map>

 <xsl:variable name="vEntities" select=
 "'stackoverflow',
 'How can I preserve the entity reference when transforming with XSLT\?\?'
 "/>

 <xsl:variable name="vReplacements" select=
 "'&amp;so;', '&amp;question;'"/>

 <xsl:template match="node()|@*">
  <xsl:copy>
   <xsl:apply-templates select="node()|@*"/>
  </xsl:copy>
 </xsl:template>

 <xsl:template match="/">
  <xsl:text disable-output-escaping="yes"><![CDATA[<!DOCTYPE doc [ <!ENTITY so "stackoverflow">
<!ENTITY question
"How can I preserve the entity reference when transforming with XSLT??"> ]>
]]>
  </xsl:text>

  <xsl:apply-templates/>
 </xsl:template>

 <xsl:template match="text()">
  <xsl:value-of select=
  "my:multiReplace(.,
                   $vEntities,
                   $vReplacements,
                   count($vEntities)
                   )
  " disable-output-escaping="yes"/>
 </xsl:template>

 <xsl:function name="my:multiReplace">
  <xsl:param name="pText" as="xs:string"/>
  <xsl:param name="pEnts" as="xs:string*"/>
  <xsl:param name="pReps" as="xs:string*"/>
  <xsl:param name="pCount" as="xs:integer"/>

  <xsl:sequence select=
  "if($pCount > 0)
     then
      my:multiReplace(replace($pText,
                              $pEnts[1],
                              $pReps[1]
                              ),
                      subsequence($pEnts,2),
                      subsequence($pReps,2),
                      $pCount -1
                      )
      else
       $pText
  "/>
 </xsl:function>
</xsl:stylesheet>

, wenn angewandt auf das XML-Dokument:

<!DOCTYPE doc [ <!ENTITY so "stackoverflow">
<!ENTITY question
"How can I preserve the entity reference when transforming with XSLT??"> ]>
<doc>
    <text>Hello &so;!</text>
    <text>&question;</text>
</doc>

das erwartete Ergebnis produziert wird:

<!DOCTYPE doc [ <!ENTITY so "stackoverflow">
<!ENTITY question
"How can I preserve the entity reference when transforming with XSLT??"> ]>

  <doc>
      <text>Hello &so;!</text>
      <text>&question;</text>
</doc>

Tun, beachten Sie:

Den besonderen (RegEx) - Zeichen in den Ersetzungen, die geschützt werden müssen.
Mussten wir auflösen, um DOE, die nicht empfohlen wird, weil es gegen die Grundsätze der XSLT-Architektur und-Verarbeitung Modell-in anderen Worten diese Lösung ist ein ekliger hack.

Vielen Dank Dimitre. Ich hatte Angst vor diesem. Leider kann ich nicht wissen, was entities verwendet werden. Ich denke, ich werde stick zu OmniMark für dieses Projekt. Deine Antwort ist sehr hilfreich, wenn ich die Zeit schätzen. +1 und Antwort akzeptiert
Sie sind herzlich willkommen.

InformationsquelleAutor Dimitre Novatchev

3

Dies kann eine besonders lästige Problem, wenn Sie mit so etwas wie S1000D. Es nutzt Entitäten und @boardno Attribute link-zu zahlen. Es ist eine Reminiszenz an seine SGML-Wurzeln.

Weil diese automatische Einheit erweitert Verhalten, das ist richtig, aber undesireable, habe ich oft zu drop zurück zu tools wie sed, awk und batch-Skripten, die zur Verwaltung bestimmter Daten-Analyse-Aufgaben bei der Verwendung von S1000D als Eingabe.

IMHO, wäre dies eine große änderung Vorschlag für eine der kommenden XSLT-Spezifikationen, dass ein kompatibler Prozessor akzeptieren eine runtime-parameter, die das ein-und ausschalten Konzern auszuführen Erweiterungen.
- Ich großteils mit ATA iSpec 2200 und gearbeitet haben, mit S1000D einige, so weiß ich genau, was du meinst.
InformationsquelleAutor James D. Noyes
1

Wenn Sie eine Java-Implementierung des XSLT 2.0-Prozessor (wie Saxon 9 Java), möchten Sie vielleicht zu prüfen, ob http://andrewjwelch.com/lexev/ hilft, können Sie Vorverarbeiten Ihre XML-Daten mit entity-und character-Referenzen, die Art und Weise, um Sie zu bekommen markiert als XML-Elemente können Sie dann verwandeln, wie es notwendig ist.

InformationsquelleAutor Martin Honnen
1

Ich diese Lösung verwenden und es funktioniert gut :
```
<xsl:variable name="prolog" select="substring-before(unparsed-text(document-uri(.)),'&lt;root')"/>

<xsl:template match="/">
    <xsl:value-of select="$prolog" disable-output-escaping="yes"/>
  <xsl:apply-templates/>
</xsl:template>
```
- Ich habe noch nicht ausprobiert, aber es sieht aus wie es würde nur die Erhaltung der prolog; entity-Referenzen wäre noch erweitert werden. Ich konnte sehen, mit xsl:analyze-string zu analysieren, den prolog und den Aufbau einer Struktur (oder eine Karte, die in 3.0) von Schlüssel/Wert-Paare und dann ersetzen Sie Sie während der Verarbeitung. Ich kann versuchen, dass eines Tages (+1 für die Idee). Tatsächlich lösen dieses Problem/Frage, ich landete schreiben Sie eine Omnimark-Programm, ähnlich wie die "lexev" java-Programm erwähnt in einer anderen Antwort.
InformationsquelleAutor Nico
0

Sie halten können EntityReference-Knoten in die Dokument mit einem DOM-LS-parser mit "Entitäten" - parameter auf true festgelegt.
http://docs.oracle.com/javase/6/docs/api/org/w3c/dom/DOMConfiguration.html

Die Spezifikation sagt, dass der default-Wert ist true, aber je nach parser, könnte es falsch sein, bewusst sein, dass.

Laden Xerces :
```
DOMImplementationLS domImpl = new org.apache.xerces.dom.CoreDOMImplementationImpl();
```
Können Sie die Registrierung verwenden, wie unten auch, aber personnaly, würde ich eher fest die Umsetzung ich möchte wie oben:
```
DOMImplementationRegistry registry = DOMImplementationRegistry.newInstance();
DOMImplementationLS domImpl = (DOMImplementationLS) registry.getDOMImplementation("XML 3.0 LS 3.0"); 
```
Dann laden Sie Ihre Dokument :
```
//XML parser with XSD schema 
LSParser parser = domImpl.createLSParser(DOMImplementationLS.MODE_SYNCHRONOUS, "http://www.w3.org/2001/XMLSchema");
DOMConfiguration config = parser.getDomConfig();
config.setParameter("entities", true);
LSInput input = impl.createLSInput();
Document lDoc = parser.parse(your XML stream);
```
Dann Ihre XML-Entitäten, die nicht erweitert werden, in der DOM.

Dann, weil SÄCHSISCHEN behandelt nicht die Personen nicht erweitert werden ('nicht unterstützter Knotentyp in der DOM! 5' - Fehler), die Sie nicht verwenden können net.sf.saxon.xpath.XPathFactoryImpl Sie haben, um den Standard-XPathFactory von Xerces mit XPathFactory.newInstance()
- Ich habe versucht, mit diesem Ansatz, aber wenn das Dokument als DOM-Quelle, die Sie bekommen würde [Fatal Error] :xxx:yyy: Character reference "&#
- Können Sie uns mehr details mit source-code, XML-Eingänge ?
- Ich habe es nicht mehr eigentlich ich fand eine alternative Möglichkeit, mit meiner Forderung, die hielten die Entität, die Daten in einem Attribut, die nicht übersetzt werden.
InformationsquelleAutor jguiraud

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.