C#: HtmlDocument-Objekt hat keinen Konstruktor?
Was es damit auf sich? Es scheint der einzige Weg, um eine Arbeit HtmlDocument-Objekt ist das kopieren der Document-Eigenschaft des mshtml - /webbrowser-Steuerelement. Aber laichen, die sloooooooooooow. Ich möchte vermeiden, Schreibe meine eigenen HTML-parser und HtmlAgilityPack ist copyleft.
Gibt es andere Quellen, ein instanziiert HtmlDocument, dass ich dump HTML-Code aus einem string in?
Oder gibt es eine Möglichkeit zum überschreiben HtmlElement die lästige Angewohnheit, werfen Sie einen halt beim verwenden von InnerHtml - /OuterHtml mit img-tags und tr-Elemente?
Edit: ich beziehe mich auf "System".Windows.Formen.HtmlDocument. Meine Entschuldigung, ich bin noch neu in C# und .Net und sehr wenig wissen über COM und einige der anderen Dinge, die dieses Thema bringt.
- würde es helfen, wenn Sie sagen, die HtmlDocument Sie verwenden, indem Sie den namespace oder den name der Bibliothek.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Es keinen Konstruktor hat, weil es nur eine wrapper-Klasse um ein nicht verwaltetes Objekt.
Referenz: http://msdn.microsoft.com/en-us/library/system.windows.forms.htmldocument.aspx
Je nachdem, was Sie wollen es für Sie, möchten Sie vielleicht zu schauen, SGMLReader oder der up-to-date der community-version.
Robuste Programmierung?
Wenn mit dem DOM, die durch das WebBrowser-Steuerelement, sollten Sie immer warten, bis das DocumentCompleted-Ereignis tritt auf, bevor Sie versuchen, Zugriff auf die Document-Eigenschaft des WebBrowser-Steuerelement. Das DocumentCompleted-Ereignis wird ausgelöst, nachdem das gesamte Dokument geladen wurde; wenn Sie den DOM, bevor Sie dann das Risiko verursachen eine Laufzeit-Ausnahme in der Anwendung.
http://msdn.microsoft.com/en-us/library/ms171712.aspx