Sagen SAX-Parser ignorieren ungültige Zeichen?

SAX hält im sterben auf die folgende Ausnahme:

Invalid byte 2 of 3-byte UTF-8 sequence

Das problem ist meistens korrekt UTF-8 kodiert, aber es gibt ein paar Fehler drin. Wir können nicht eine neue version der Datei haben wir diese Datei verwenden.

So, wie wir sagen, SAX zu ignorieren ungültiges Zeichen-Sequenzen, oder reinigen Sie die UTF-8-Datei, so dass Sie nicht haben, ungültige UTF-8-Sequenzen?

InformationsquelleAutor corydoras | 2009-10-19
Schreibe einen Kommentar