Analysieren gebrochen HTML mit golang
Ich brauche zu finden, Elemente in eine HTML-Zeichenfolge. Leider ist der HTML-Code ist ziemlich viel kaputt (z.B. schließende tags ohne öffnung-pair-Mädchen).
Versuchte ich, mithilfe von XPath-mit launchpad.net/xmlpath aber man kann es nicht Parsen einer HTML-Datei so verdammt buggy.
Wie kann ich Elemente in einer gebrochenen HTML mit golang? Ich würde lieber mit XPath, aber ich bin offen für andere Lösungen auch, wenn ich es verwenden können, zu suchen von tags mit einer bestimmten id oder class.
- Für diesen Stolperstein zu diesem Thema, beachten Sie, dass die xmlpath Projekt bewegt hat (und verbessert), um gopkg.in/xmlpath.v1 .
Du musst angemeldet sein, um einen Kommentar abzugeben.
Scheint es net/html macht den job.
Also das ist, was ich jetzt mache:
Node
s, die mit einem bestimmten XPath? Danke.