Wie zu Lesen, die Inhalte der Website in c#?

Möchte ich auf der website Lesen text ohne html-tags und Header. ich brauche nur den text, der angezeigt wird im web-browser.

ich nicht brauchen, wie diese

<html>
<body>
bla bla </td><td>
bla bla 
<body>
<html>

ich brauche nur den text "bla bla bla bla".

Habe ich verwendet der webclient und httpwebrequest-Methoden zum abrufen des HTML-Inhalts und zum aufteilen der empfangenen Daten, aber es ist nicht möglich, denn wenn ich die website die tags ändern kann.

Also gibt es eine Möglichkeit um nur den angezeigten text in die website anagrammatically?

  • Ich denke, du brauchst einen HTML-parser und-wenn Sie haben die Kontrolle der Quelltext der Seite, zum hinzufügen einer id zu dem element, das Sie möchten, zu bekommen, damit man es mit einer Methode wie getElementById ist der parser.
  • haben Sie eine link Beispiel für ein HTML-parser?
InformationsquelleAutor Azeem Akram | 2012-05-14
Schreibe einen Kommentar