C#: HtmlDocument-Objekt hat keinen Konstruktor?

Was es damit auf sich? Es scheint der einzige Weg, um eine Arbeit HtmlDocument-Objekt ist das kopieren der Document-Eigenschaft des mshtml - /webbrowser-Steuerelement. Aber laichen, die sloooooooooooow. Ich möchte vermeiden, Schreibe meine eigenen HTML-parser und HtmlAgilityPack ist copyleft.

Gibt es andere Quellen, ein instanziiert HtmlDocument, dass ich dump HTML-Code aus einem string in?

Oder gibt es eine Möglichkeit zum überschreiben HtmlElement die lästige Angewohnheit, werfen Sie einen halt beim verwenden von InnerHtml - /OuterHtml mit img-tags und tr-Elemente?

Edit: ich beziehe mich auf "System".Windows.Formen.HtmlDocument. Meine Entschuldigung, ich bin noch neu in C# und .Net und sehr wenig wissen über COM und einige der anderen Dinge, die dieses Thema bringt.

würde es helfen, wenn Sie sagen, die HtmlDocument Sie verwenden, indem Sie den namespace oder den name der Bibliothek.

InformationsquelleAutor Tom Corelis | 2009-03-27

c#dom parsing

7

Es keinen Konstruktor hat, weil es nur eine wrapper-Klasse um ein nicht verwaltetes Objekt.

Referenz: http://msdn.microsoft.com/en-us/library/system.windows.forms.htmldocument.aspx

HtmlDocument bietet eine verwaltete
wrapper für Internet Explorer
document-Objekt, auch bekannt als die
HTML Document Object Model (DOM). Sie
erhalten Sie eine Instanz von HtmlDocument
durch die Document-Eigenschaft des
WebBrowser-Steuerelement.

Je nachdem, was Sie wollen es für Sie, möchten Sie vielleicht zu schauen, SGMLReader oder der up-to-date der community-version.
- Danke für den Tipp auf SGMLReader. Ich war in der Lage, dies zu umgehen, durch das Lesen meines HTML-Code in SGMLReader, die Konvertierung in ein XML-Dokument, und dann die Injektion, die code in der mshtml.HTMLDocument. Danke!!!
InformationsquelleAutor tvanfosson
4

Robuste Programmierung?

Wenn mit dem DOM, die durch das WebBrowser-Steuerelement, sollten Sie immer warten, bis das DocumentCompleted-Ereignis tritt auf, bevor Sie versuchen, Zugriff auf die Document-Eigenschaft des WebBrowser-Steuerelement. Das DocumentCompleted-Ereignis wird ausgelöst, nachdem das gesamte Dokument geladen wurde; wenn Sie den DOM, bevor Sie dann das Risiko verursachen eine Laufzeit-Ausnahme in der Anwendung.

http://msdn.microsoft.com/en-us/library/ms171712.aspx

InformationsquelleAutor Jungchan

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.