Wie validieren von HTML-Code aus Java?
Was ist eine schnelle und einfache Möglichkeit zur Validierung von HTML, von Java? Ich bin auf der Suche nach einer open-source/PD-Klasse (oder Klassen) , beschreibt die verschiedenen Eigenschaften des 100-ungerade HTML-tags, wie:
- Ist der tag, optional? Leer? Ist es legal, weglassen das schließende tag?
- Die anderen tags können diese Tags enthalten (wenn überhaupt)?
- Welche Attribute sind legal für diesen tag, und was sind Ihre Typen? (nicht erforderlich, aber nice to have)
Dank!
BEARBEITEN
Ich bin auf der Suche zu tun, um ein tag-für-tag-Analyse eines HTML-Dokuments, also ich bin weniger daran interessiert, ob das Dokument als ganzes gültig ist, sondern wie sich die spezifischen Anforderungen sind für jede Art von tag.
Ich könnte Kodieren der Regeln basiert auf der W3C-spec, wollte aber sehen, welche fertige Lösungen verfügbar sind, ersten.
InformationsquelleAutor Tony the Pony | 2010-12-08
Du musst angemeldet sein, um einen Kommentar abzugeben.
Wenn Sie möchten, um zu überprüfen, bestimmten tags Folgen bestimmten Vorgaben, es scheint kein Ende von Java-basierten HTML-Parser:
Open Source HTML Parsers in Java
In anderen Worten, man könnte analysieren Sie HTML, und überprüfen Sie dann das resultierende Dokument für die tags, die Sie gesucht haben, und bestimmen, ob Sie den Spezifikationen entsprechen, die Sie benötigen. Wenn Sie nicht dann könnten Sie nur werfen eine Fehlermeldung.
Ich glaube nicht, dass finden Sie ein HTML-Analyse-tool, das geschrieben wurde, die genau mit Ihre Anforderungen im Auge behalten, vor allem, weil es diese Anforderungen noch nicht geäußert und werden wohl ein bisschen nebulös.
Wenn der parser macht nicht, was Sie wollen, out of the box, zumindest dieser Liste ist open source, so können Sie hack der parser, solange Sie veröffentlichen Sie Ihre änderungen.
InformationsquelleAutor Edwin Buck
Überprüfen JTidy (http://jtidy.sourceforge.net/) und VietSpider HTMLParser ( http://sourceforge.net/projects/binhgiang/ ) beide sind Java-HTML-parser und syntax-Prüfung-Fähigkeiten. Einige eclipse-basierten HTML-editor-plugin verwenden JTidy (oder Hafen von Tidy) für die syntax-überprüfung. Oder wie David Sagte,, senden Sie die Seite an w3c.org
InformationsquelleAutor Favonius