Wie wollen Sie parse HTML in vb.net
Ich würde gerne wissen, ob es gibt eine einfache Methode zum Parsen von HTML in vb.net.
Ich weiß, dass HTML nicht sctrict Untermenge von XML ist, aber es wäre schön, wenn es behandelt werden könnte, Weg. Gibt es etwas gibt, das würde ich parse HTML in eine XML-ähnliche Art und Weise in VB.net?
InformationsquelleAutor der Frage tooleb | 2009-02-05
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich mag Html-Agility-pack - es ist sehr developer friendly, kostenloser und source-code verfügbar ist.
InformationsquelleAutor der Antwort TcKs
'add prog ref: Microsoft.mshtml
'dann auf der Seite:
Als gefunden hier:
InformationsquelleAutor der Antwort TripleHelix Tech
Wenn Ihr HTML-folgt von XHTML-standards, können Sie eine Menge tun, die Analyse und Verarbeitung mit dem System.XML namespace-Klassen.
Wenn auf der anderen Seite,, wenn Sie Analyse, ist das, was der web-Entwickler zu beziehen, wie "tag-Suppe", müssen Sie ein Drittanbieter-parser wie HTML-Agility-Pack.
Kann dies nur eine partielle Lösung für Ihr problem, wenn Sie versuchen, um herauszufinden, wie ein browser interpretieren die HTML-da jeder browser parst tag Suppe etwas anders.
InformationsquelleAutor der Antwort Yes - that Jake.
Nicht verwenden-agility-pack, nutzen Sie einfach mshtml-Bibliothek Zugriff auf das dom, das ist, was der ie verwendet und ist ideal für den Gang durch HTML-Elemente.
Agility pack ist böse und unnötig hackie, wenn Sie mich Fragen, mshtml ist der Weg zu gehen. Schauen Sie sich auf der msdn-Website.
InformationsquelleAutor der Antwort Erx_VB.NExT.Coder
Ist es gut gebildet? Wenn der HTML-Code wird in der Tat gut gebildet, dann kann es analysiert werden, wie XML. Wenn es ist tag der Suppe und es gibt nicht geschlossene Elemente und solche würde ich denken, würden Sie auf die Jagd rund um für eine Drittanbieter-Lösung.
InformationsquelleAutor der Antwort Andrew Hare