Tag: html-agility-pack
HTML-Agility-Pack ist ein open-source-HTML-parser baut einen lese/schreib-DOM und unterstützt Linq, einfachen XPATH oder XSLT).
2
Antworten
Ich habe zwei Knoten, die innere HTML geht so etwas wie dieses: Node1: <p>some text</p> <p>some more text</p> Node2: <p>some text</p> <p>some more text</p> <div><p>lots of more paragraphs here</p></div> Ich versuche zu schauen Knoten 1 im Knoten
2
Antworten
Ich bin mit einem CMS-system für eine website. Meine Autoren haben einige sehr heftige Bilder in das system und haben dann den Weg auf, um die Größe ändern Sie im cms, so dass Sie geeignet sind für
2
Antworten
Habe ich die html-Struktur wie: <div class="class1"> <div class="class2"> <a href="test" title="professional and enthusiast programmers">Stack Overflow</a> </div> <div class="class2"> </div> <div class="class2"> </div> <div class="class2"> </div> </div> <div class="class1"> <div class="class2"> <a href="test" title="professional and enthusiast programmers">Stack
2
Antworten
Ich versuche zu konvertieren HTML zu PDF mit iTextSharp in einem ASP.NET web-Anwendung, die sowohl MVC, und web-Formulare. Die <img> und <a> Elemente haben absolut und relative URLs, und einige der <img> Elemente sind base64. Typische Antworten
1
Antworten
Ich habe den folgenden code zum Parsen der HTML-Dokumente & speichern Sie es als CSV-Datei. string actuald=null; string data1 = File.ReadAllText("E://text.html"); HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(data1); HtmlNodeCollection col = doc.DocumentNode.SelectNodes("//pre"); foreach (HtmlNode node in col) {
4
Antworten
Ich bin erstellen Sie ein HTML-Dokument mit HTML-agility-pack. Ich lade eine template-Datei, dann fügen Sie Inhalt hinzu. Das ganze funktioniert, aber wenn ich die Ausgabe Datei, die Sie entfernt das schließende tag aus meinem <br/> tags zu
3
Antworten
Ich versuche, zu extrahieren alle input-Elemente, die von einem Formular. Wenn ich parse die folgende form: <form> <input name='test1' type='text'> <input name='test2' type='text'> <input name='test3' type='text'> </form> alles war perfekt, HTML-Agility-Pack war in der Lage zu erkennen,
1
Antworten
Ich bin mit html-agility-pack zum analysieren von html - tabellarische Informationen. Nun gibt es einige html-Inhalt mit fehlenden Ende-tags oder von einer solchen Seite wegen der fehlenden Ende-tags html-agility-pack nicht analysieren, Informationen richtig.So möchte ich zum Ende-tags
2
Antworten
Gut mit dem Weg unten es ist das extrahieren nur die Referrer-url wie diese die Extraktion code : foreach (HtmlNode link in hdDoc.DocumentNode.SelectNodes("//a[@href]")) { lsLinks.Add(link.Attributes["href"].Value.ToString()); } Den url code <a href="Login.aspx">Login</a> Den extrahierten url Login.aspx Aber ich
2
Antworten
Ich versuche, wählen Sie Knoten mit Ausnahme der von der Skript-Knoten und eine ul, dass ist eine Klasse namens 'relativeNav'. Kann jemand bitte leiten mich auf den richtigen Weg? Ich war auf der Suche nach diesem für
1
Antworten
Beispiel auf codeplex ist diese : HtmlDocument doc = new HtmlDocument(); doc.Load("file.htm"); foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"]) { HtmlAttribute att = link["href"]; att.Value = FixLink(att); } doc.Save("file.htm"); Die erste Ausgabe ist HtmlDocument.DocumentElement existiert nicht!!! Was existiert, ist HtmlDocument.DocumentNode
3
Antworten
Suchte ich diese Frage aber nicht finden, alles, was, die ich suchte, im Grunde möchte ich einen proxy verwenden mit htmlagilitypack, hatte ich den code, es zu tun, aber bevor es verloren, hier ist der code habe
2
Antworten
Ich brauche zum analysieren von Html-code. Genauer gesagt, zu analysieren jede Zelle alle Zeilen in allen Tabellen. Jede Zeile, die ein einzelnes Objekt und jede Zelle repräsentieren unterschiedliche Eigenschaften. Ich möchte analysieren, um in der Lage sein,
1
Antworten
Ich versuche zu finden Sie niedrigsten Preis auf Amazon-Seiten. Lassen Sie uns verwenden Sie diese url als Beispiel: http://www.amazon.com/s/ref=nb_sb_noss?url=search-alias%3Daps&field-keywords=9963BB#/ref=nb_sb_noss?url=search-alias%3Daps&field-keywords=E999-4701&rh=i%3Aaps%2Ck%3AE999-4701 Ich möchten, finden Sie den niedrigsten Preis ... die Zahl auf der rechten Seite "neu ab". Hier ist
5
Antworten
Habe ich einige Probleme mit dem HTML Agility Pack. Bekomme ich eine null-Verweis-Ausnahme, wenn ich diese Methode verwenden, werden die HTML nicht mit dem bestimmten Knoten. Es funktionierte auf den ersten, aber dann es aufgehört zu arbeiten.
2
Antworten
Derzeit mit einem Problem, wo ich nicht bekommen kann C# die Ausgabe meiner Liste in etwas, das lesbar ist, was bedeutet, ich kann nicht wirklich sehen, ob die webscraping tatsächlich funktioniert, oder ziehen falsche Informationen. Jemand eine
1
Antworten
Möchte ich alle Kinder auswählen ich.e Bilder, deren Eltern div mit id ist testRoot. Die Struktur ist unbekannt. Ich habe vereinfacht es hier für das Verständnis der Zweck. Wenn es XPath-Ausdruck, wird es großartig sein. <div id="testRoot">
2
Antworten
Bin ich mit dem html-agility-pack zu Lesen, der Inhalt meiner html-Dokument in einen string, etc.. Nachdem dies geschehen ist, würde ich gerne entfernen bestimmter Elemente im Inhalt von Ihrer Klasse, aber ich bin stolpern auf ein problem.
1
Antworten
Bin ich mit dem HTML-Agility-Pack zu manipulieren und Bearbeiten eines HTML-Dokuments. Ich möchte den text ändern, der im Feld wie diesem: <div id="Div1"><b>Some text here.</b><br></div> Ich bin auf der Suche zu aktualisieren, wird der text in diesem
1
Antworten
Brauche ich wählen Sie alle untergeordneten Knoten (option-tag) aus dieser html-Datei: <select name="akt-miest" id="onoffaci"> <option value="a_0">Všetci</option> <option value="a_1">Iba prihlásení</option> <option value="a_5" selected="selected">Teraz na Pokeci</option> <optgroup label="Hlavné miestnosti"> <option value="m_13"> Bez záväzkov</option> <option value="m_9"> Do pohody</option> <option value="m_39"> Dámsky klub</option> </optgroup>
1
Antworten
Ich versuche scape ein kompliziertes HTMl. Ich brauche, um text aus div ' s mit der bestimmten Klasse. Was ich versuche zu tun haben, ist der html-agility-pack, die gehen über die ganze html und finden alle divs
5
Antworten
Will ich mit dem HTML agility pack Parsen Bild-und href-links aus einer HTML-Seite,aber ich weiß einfach nicht viel über XML oder XPath.Obwohl mit suchen helfen, Dokumente in vielen web-sites,ich kann das problem nicht lösen.Zusätzlich benutze ich C#
1
Antworten
Ich habe mit HtmlAgilityPack in den letzten 2 Monaten in ein Web-Crawler Anwendung ohne Probleme laden einer Webseite. Wenn ich jetzt versuche zu laden, auf dieses spezielle Webseite, das Dokument OuterHtml leer ist, also dieser test fehlschlägt,
3
Antworten
Kann ich Html-Agility-Pack, um die Ausgabe Aussehen schön eingerückt, unnötige Leerzeichen beraubt? was Ausgang? Von wo aus? etwas mehr details vielleicht? (Referenz) htmlagilitypack.codeplex.com/Wikipage output = html-code-Ausgabe InformationsquelleAutor Jan | 2010-04-07
1
Antworten
Ich bin mit HTML Agility Pack Parsen und Transformation eine HTML-Datei, aber ich bekomme eine Ausnahme "Element wurde bereits Hinzugefügt." beim Versuch, erstellen Sie eine neue HTMLNode, weil der index-parameter. HtmlNode node1 = new HtmlNode(HtmlNodeType.Element, doc, 0);
3
Antworten
Ich diesen code verwenden, um login: CookieCollection cookies = new CookieCollection(); HttpWebRequest request = (HttpWebRequest)WebRequest.Create("example.com"); request.CookieContainer = new CookieContainer(); request.CookieContainer.Add(cookies); HttpWebResponse response = (HttpWebResponse)request.GetResponse(); cookies = response.Cookies; string getUrl = "example.com"; string postData = String.Format("my parameters"); HttpWebRequest
4
Antworten
In meinem code möchte ich entfernen des img-Tags, die nicht über src-Wert. Ich bin mit HTMLAgilitypack ist HtmlDocument Objekt. Ich finde die img, die nicht über src-Wert und versucht, es zu entfernen.. aber es gibt mir eine
1
Antworten
möchte ich Durchlaufen aller Knoten in einem documnet mit HtmlAgilityPack wird foreach (HtmlNode node in myhtml.DocumentNode.SelectNodes("//@")) tun? InformationsquelleAutor kiki | 2012-02-02
1
Antworten
Ich versuche zu finden, eine Methode für den Zugriff auf Daten zwischen den tags, die von einem server zurückgegeben ich bin das HTTP-Anforderungen auf. Das Dokument enthält mehrere tags, aber nur eines der tags, JavaScript-code zwischen ihm,
2
Antworten
Ich bin mit HtmlAgilityPack HtmlNode und ich will mich <select> and <option> and all other html tags. Derzeit HtmlNode analysieren nur html, table, div,... - tags. Wie bekomme ich die option, und wählen Sie tag auch. Mein
2
Antworten
Habe ich den folgenden XPath-Ausdruck zu match-Attribute der Klasse Spannweite: //span[@class='amount'] Möchte ich übereinstimmen, alle Elemente mit dem class-Attribut "Menge", sondern kann auch haben andere Klassen auch. Ich dachte, ich könnte dies tun: //span[@class='*amount*'] aber das funktioniert
4
Antworten
Ich versuche zu analysieren, diesem Gebiet, aber kann es nicht erhalten, um zu arbeiten. Aktueller Versuch: var name = doc.DocumentNode.SelectSingleNode("//*[@id='my_name']").InnerHtml; <h1 class="bla" id="my_name">namehere</h1> Fehler: der Objektverweis nicht auf eine Instanz eines Objekts. Jede Hilfe dankbar. @John -
1
Antworten
Ich versuche, zu extrahieren, Bild vom link gepostet und der erste Scheck, den ich tun ist, um zu sehen, wenn der link zu einem einfachen Bild wie dieses : HttpWebRequest request; WebResponse webresponse; request = (HttpWebRequest)HttpWebRequest.Create(url); webresponse
2
Antworten
Brauchen ein bisschen Hilfe mit dem HTML-Agility-Pack! Grundsätzlich möchte ich zu greifen plain-text innerhalb der body-Knoten des HTML. Bisher habe ich versucht, diese in vb.net und es nicht zurück innertext Bedeutung keine änderung gesehen, gut atleast von
3
Antworten
Ich habe ein HTML-Dokument und ich parse es mit XPath. Ich möchte den Wert des Elements input, aber es hat nicht funktioniert. Mein Html: <tbody> <tr> <td> <input type="text" name="item" value="10743" readonly="readonly" size="10"/> </td> </tr> </tbody> Mein
3
Antworten
Möchte ich eine Webseite erstellen scrapper Anwendung, und ich möchte es mit webbrowser-Steuerelement, htmlagilitypack und xpath. Recht, jetzt habe ich es geschafft, zu erstellen xpath-generator(ich verwendete webbrowser, die für diesen Zweck), welche gut funktioniert, aber manchmal kann
8
Antworten
Brauche ich zum konvertieren von HTML-Zeichenfolge text (vorzugsweise mit HTML-Agility-pack). Mit der richtigen white-Räume und, vor allem, richtige Zeilenumbrüche. Sowie durch die "richtige Zeilenumbrüche" ich meine, dass dieser code: <div> <div> <div> line1 </div> </div> </div> <div>line2</div>
1
Antworten
Heruntergeladen habe ich HTML-Agility-pack, und nach dem entpacken kann ich sehen, dass es sub-Ordner mit dem Namen NETTO 20 NETTO 40 NETTO 40 Client, NET 45, sl3-wp, sl4-windowsphone71, sl5, winrt45. Habe ich heruntergeladen Microsoft Visual 2010. Leider
6
Antworten
Ich versuche zum abrufen eines bestimmten Bildes aus einer html-Dokument mit html-agility-pack und das xpath: //div[@id='topslot']/a/img/@src Soweit ich sehen kann, findet das src-Attribut, aber es gibt das img-tag. Warum ist das so? Ich würde erwarten, dass die
3
Antworten
Benutze ich htmlagility um Webseiten-Daten, aber ich habe alles versucht mit der Seite mit www.cloudflare.com Schutz für ddos. Die redirect-Seite ist nicht möglich Griff in htmlagility, weil Sie nicht mit meta-redirect noch js ich glaube, Sie prüfen,
1
Antworten
Habe ich HTML-Code, sieht wie folgt aus: <body class="style_0"> <div> <div class="style_1">Pending Test List</div> <table style=" width: 100%;" id="AUTOGENBOOKMARK_4365445353431356880"> <col> <col> <tbody> <tr> <td style="vertical-align: baseline;"> <div class="style_4">Pending Test List</div> </td> <td style="vertical-align: baseline;"> <div class="style_5">SOME AGENCY
1
Antworten
Ich arbeite seit einer Weile mit einem Knoten in C#/html agility pack, und durch Versuch und Irrtum ich habe eine Liste von Knoten, die ich Durchlaufen möchten, bekommen den Kind-Knoten von jedem der Knoten aus der Schleife.
1
Antworten
Ich bin laden von HTML übergeben als string in HTMLAgilityPack Dokument wie folgt. HtmlDocument html = new HtmlDocument(); html.OptionOutputAsXml = true; html.LoadHtml(htmlText); HtmlNode document = html.DocumentNode; Nachdem das Dokument geladen wurde.InnerHtml zeigt sich mit "(Beispiel unten) für
3
Antworten
Derzeit brauche ich zum extrahieren von Daten aus Webseiten. Ich habe versucht, mit HTML-Agility-Pack, die verwendet XPATH um Daten zu extrahieren. Gibt es ein tool zur Verfügung, welches automatisiert schreiben von XPATH, so dass auch eine naive
2
Antworten
Ich versuche, die download-web-Seite: string remoteUri = "http://whois.domaintools.com/94.100.179.159"; WebClient myWebClient = new WebClient(); byte myDataBuffer = myWebClient.DownloadData(remoteUri); string download = Encoding.ASCII.GetString(myDataBuffer); HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(download); doc.Save("file1.htm"); Habe einen Fehler webexception wurde nicht behandelte: (403) Verboten.
5
Antworten
Ich versuche, alle divs, die Ihre Klasse enthält, die ein bestimmtes Wort: <div class="hello mike">content1</div> <div class="hello jeff>content2</div> <div class="john">content3</div> Ich brauchen, um alle divs, die Ihre Klasse enthält das Wort "Hallo". So etwas wie dieses: resultContent.DocumentNode.SelectNodes("//div[@class='hello']"))
3
Antworten
Ich versuche, HtmlAgilityPack für die Analyse einer web-Seite Informationen. Das ist mein code: using System; using HtmlAgilityPack; namespace htmparsing { class MainClass { public static void Main (string args) { string url = "https://bugs.eclipse.org"; HtmlWeb web =
1
Antworten
ich wählen Sie die Tabelle mit class-Namen "Liste". Ich benutze diese xpath-Abfrage zu wählen Knoten im Htmlagilitypack //table[@class="list"]/td/a[@href] konnte aber nicht die richtige Ausgabe. Was ist Los mit meinem xpath-code-block? Dies ist die Tabelle, die ich will
9
Antworten
Kann ich Sie leicht entfernen Sie das element nur durch Hinweis.Remove() lik: HtmlDocument html = new HtmlDocument(); html.Load(Server.MapPath(@"~\Site\themes\default\index.cshtml")); foreach (var item in html.DocumentNode.SelectNodes("//removeMe")) { item.Remove(); } Aber das entfernt die innerHtml-als auch. Was ist, wenn ich nur
1
Antworten
Hallo ich HttpWebResponse und die HtmlPage-mit allen Daten, die ich brauche zum Beispiel Tabelle mit aktuellen Infos, die ich brauche, um Sie zu speichern der array-Liste und speichern Sie die xml-Datei Beispiel der html-Seite <table> <tr> <td