Parsen von html mit SAX-parser

Ich versuche zu analysieren, die normale html-Datei mit SAX-parser.

SAXBuilder builder2 = new SAXBuilder();
         try {
            Document sdoc = (Document)builder2.build(readFile);
            NodeList nl=sdoc.getElementsByTagName("body");
            System.out.println("nodelist>>>>>>>>>>>"+nl.getLength());

        } catch (JDOMException e1) {
            e1.printStackTrace();
        }

aber ich bin immer die Ausnahme

Open quote is expected for attribute "{1}" associated with an  element type  "class".

kann jemand bitte sagen Sie mir, warum bin ich immer diese exception, das html-Dokument ist wohlgeformt und es hat alle die öffnen und schließen-tags richtig.

Vielen Dank im Voraus.

Gibt es einen bestimmten Grund, warum Sie dies tun wollen, die mit SAX?
Nein, wollen einfach nur zu Holen den Inhalt aus der html-Datei, Also benutzte ich es. Gibt es irgendeine andere Lösung?
Mit dem SAX könntest du Parsen von XHTML, aber ich bin mir nicht sicher, ob es auch parse HTML (zumindest die meisten XML-parser nicht). HTML nicht haben, um ein wohlgeformtes XML.

InformationsquelleAutor user972590 | 2011-10-19

Schreibe einen Kommentar