Extrahieren von text aus XML mit python
Ich habe diese Beispiel-xml-Datei
<page>
<title>Chapter 1</title>
<content>Welcome to Chapter 1</content>
</page>
<page>
<title>Chapter 2</title>
<content>Welcome to Chapter 2</content>
</page>
Ich gerne extrahieren Sie den Inhalt des Titel-tags und content-tags.
Welche Methode ist gut um die Daten zu extrahieren, mit pattern-matching oder mit xml-Modul. Oder gibt es eine bessere Möglichkeit um die Daten zu extrahieren.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Gibt es bereits einen integrierten XML-Bibliothek, insbesondere
ElementTree
. Zum Beispiel:root[0][1][0]...
, sowie einen iterator von beliebigen Knoten, gehe alle Kind-Knoten!list( root[0][1].itertext() )
Super praktisch!Ich persönlich bevorzuge Analyse mit
xml.dom.minidom
etwa so:Können Sie auch versuchen, diesen code zu extrahieren, Texte:
Ausgabe: