Bekommen Sie text von einer URL in ASP.NET

Ich bin auf der Suche nach einer zuverlässigen Methode der Extraktion von text gegeben, die web-Adresse, in ASP.NET/C#. Kann mir jemand zeigen Sie mir die richtige Richtung?

Auch, die web-Adresse könnte sagen, eine news-Website, die möglicherweise haben eine Menge von anzeigen und Menüs etc. Ich brauche einige intelligente Weise extrahiert nur die relevanten Inhalte. Nicht sicher, wie das getan werden könnte, wie würde ich definieren, was von Relevanz ist?

Sollte ich vielleicht Lesen Sie aus einem RSS-feed? Irgendwelche Gedanken dazu?

BEARBEITEN
Ich Habe ein Kopfgeld. Ich bin auf der Suche nach extrahieren "relevanten" text von einer URL. Von "relevant" meine ich, es soll ausschließen, dass die text-ads (und andere irrelevante info). Die Eingabe wird ähnlich einer news-Website. Ich brauche zu extrahieren nur die news info und loszuwerden, die überflüssigen text

  • HTML-Agility-Pack hilft hier?
InformationsquelleAutor Nick | 2010-02-13
Schreibe einen Kommentar