XPath für alle Knoten erhalten
gibt es eine Bibliothek, die mir XPATH alle Knoten, die in HTML-Seite ?
InformationsquelleAutor der Frage user583726 | 2011-04-13
Du musst angemeldet sein, um einen Kommentar abzugeben.
gibt es eine Bibliothek, die mir XPATH alle Knoten, die in HTML-Seite ?
InformationsquelleAutor der Frage user583726 | 2011-04-13
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ja, wenn diese HTML-Seite ist ein wohlgeformtes XML-Dokument.
Je nachdem, was Sie verstehen von "Knoten"...
wählt alle Elemente im Dokument.
wählt alle Elemente, Textknoten, Verarbeitungsanweisungen, kommentarknoten, und der root-Knoten
/
.selektiert alle text-Knoten in das Dokument.
wählt alle kommentarknoten im Dokument.
selektiert alle processing instructions im Dokument.
wählt alle Attribut-Knoten in die Dokument.
wählt alle namespace-Knoten in die Dokument.
Schließlich können Sie kombinieren alle der oben genannten Ausdrücke mit der union (
|
) - operator.So, ich glaube, dass der folgende Ausdruck wirklich selektiert "alle Knoten" von einem XML-Dokument:
InformationsquelleAutor der Antwort Dimitre Novatchev
In diesem Fall ist hilfreich für jemanden, wenn Sie mit python/lxml, müssen Sie zuerst den Baum, und dann Abfrage, Baum-mit XPATH-Pfade, Dimitre Listen oben.
Um den Baum:
In der letzten Zeile, ersetzen Sie "//* ' mit xpath-was auch immer Sie wollen.
all_xpaths
ist jetzt eine Liste die wie folgt aussieht:InformationsquelleAutor der Antwort tegan