Einfache libxml2 HTML-parsing-Beispiel mit Objective-c, Xcode, und HTMLparser.h
Bitte kann jemand mir ein einfaches Beispiel analysieren einige HTML mit libxml.
#import <libxml2/libxml/HTMLparser.h>
NSString *html = @"<ul>"
"<li><input type=\"image\" name=\"input1\" value=\"string1value\" /></li>"
"<li><input type=\"image\" name=\"input2\" value=\"string2value\" /></li>"
"</ul>"
"<span class=\"spantext\"><b>Hello World 1</b></span>"
"<span class=\"spantext\"><b>Hello World 2</b></span>";
1) Sagen, ich möchte zum Parsen der Wert der Eingabe, deren name = input2.
Ausgeben sollte "string2value".
2) Sagen, ich möchte zu analysieren, den inneren Inhalt der einzelnen span-tag mit class = spantext.
Sollte die Ausgabe: "Hello World 1" und "Hallo Welt 2".
- libxml ist für xml-Analyse und für die, die Sie brauchen, um zu sehen, TouchXML.
- Obwohl ich mit HTMLparser.h? Ich werde werfen Sie einen Blick auf TouchXML Dank.
- libxml2 unterstützt HTML4 analysieren. Aus den spärlichen Unterlagen der TouchXML, es scheint nicht, es ist also nicht zweckmäßig, in diesem Fall.
- touchXML enthält CXMLDocumentTidyHTML Eigenschaft in Ihre CXMLDocument.h-Datei, herzuleiten aus, dass dieses problem gelöst werden könnte, mit touchXML auch Sie können sehen, KissXML, die inspiriert ist von touchXML. Für Reine HTML-parser, ich habe gerade einen link touchtank.wordpress.com/element-parser, .. sehen, ob es passt für Ihre Bedürfnisse
- github.com/zootreeves/Objective-C-HMTL-Parser Tat, was ich wollte, Dank v Dank für Ihre Hilfe.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich verwendet, Ben Reeves' HTML-Parser zu erreichen, was ich wollte:
Wie Vladimir sagte, für den zweiten Punkt ist es wichtig zu ersetzen, rawContents mit Inhalt. rawContents drucken wird die komplette raw-text-Knoten, d.h.: