Unicode-Problem mit einem HTML-Title, Fragezeichen? 65533;

Ich versuche zu analysieren, der Titel der folgenden Webseite: http://kid37.blogger.de/stories/1670573/

Wenn ich den apache.Unterhaus.lang StringEscapeUtils.escapeHTML Methode, die auf das title-element bekomme ich die folgende

Das hermetische Caf�: Rock & Wrestling 2010

wenn ich mir jedoch angezeigt, dass in meiner Webseite mit utf-8-Codierung es zeigt nur ein Fragezeichen.

Verwenden Sie den folgenden code:

String title = StringEscapeUtils.escapeHtml(myTitle);

Wenn ich die Titel über diese website: http://tools.devshed.com/?option=com_mechtools&tool=27 ich bekomme die folgende Ausgabe, die scheint richtig

TITEL:

<title>Das hermetische Café: Rock &amp; Wrestling 2010</title>

WIRD (was ich erwartet hatte, die Methode escapeHtml zu tun):

<title>Das hermetische Caf&eacute;: Rock &amp; Wrestling 2010</title>

irgendwelche Ideen? Dank

InformationsquelleAutor James | 2010-08-19
Schreibe einen Kommentar