Analysieren gebrochen HTML mit golang

Ich brauche zu finden, Elemente in eine HTML-Zeichenfolge. Leider ist der HTML-Code ist ziemlich viel kaputt (z.B. schließende tags ohne öffnung-pair-Mädchen).

Versuchte ich, mithilfe von XPath-mit launchpad.net/xmlpath aber man kann es nicht Parsen einer HTML-Datei so verdammt buggy.

Wie kann ich Elemente in einer gebrochenen HTML mit golang? Ich würde lieber mit XPath, aber ich bin offen für andere Lösungen auch, wenn ich es verwenden können, zu suchen von tags mit einer bestimmten id oder class.

  • Für diesen Stolperstein zu diesem Thema, beachten Sie, dass die xmlpath Projekt bewegt hat (und verbessert), um gopkg.in/xmlpath.v1 .
InformationsquelleAutor mimrock | 2014-06-07
Schreibe einen Kommentar