Konvertieren Sie die internationale Zeichenkette in Java
Wie kann ich umwandeln einer internationalen (z.B. Russisch) String \u
Zahl (unicode-Zahl)
z.B. \u041e\u041a
für OK
?
InformationsquelleAutor der Frage ehsun7b | 2011-06-03
Du musst angemeldet sein, um einen Kommentar abzugeben.
Falls Sie dies benötigen, schreiben Sie eine
.properties
- Datei können Sie einfach fügen Sie die Strings in ein Properties-Objekt und speichern es in einer Datei. Es kümmert sich für die Konvertierung.InformationsquelleAutor der Antwort x4u
es ist ein JDK-tools ausgeführt über die Kommandozeile wie folgt :
Beispiel :
src.txt
output.txt
Wenn Sie es verwenden möchten, in Ihre Java-Anwendung, können Sie wickeln Sie diesen in der Befehlszeile von :
Dann Lesen Inhalt der neuen Datei.
InformationsquelleAutor der Antwort Abdennour TOUMI
Könnten Sie
escapeJavaStyleString
ausorg.apache.commons.lang.StringEscapeUtils
.InformationsquelleAutor der Antwort sorin
Hatte ich auch dieses problem. Ich hatte einige Portugiesische text mit bestimmten Zeichen, aber diese Zeichen, wo bereits im unicode-format (BSP.:
\u00e3
).So, ich möchte konvertieren
S\u00e3o
zuSão
.Habe ich es mit dem apache-commons -StringEscapeUtils. @Sorin-sbarnea sagte. Heruntergeladen werden kann hier.
Verwenden Sie die Methode
unescapeJava
wie diese:(Es gibt auch die Methode
escapeJava
aber diese legt man die unicode-Zeichen in der Zeichenfolge.)Wenn einer weiß eine Lösung auf Java basiert, sagen Sie es uns.
InformationsquelleAutor der Antwort Derzu
Hier ist eine verbesserte version von ArtB Antwort:
Diese version entweicht alle nicht-ASCII-chars und funktioniert low Unicode-Codepunkte wie
Ä
.InformationsquelleAutor der Antwort mik01aj
Es gibt drei Teile, um die Antwort
Bekommen jedes Zeichen, das Sie Durchlaufen können den String mit den
charAt()
odertoCharArray()
Methoden.Den Wert der char den Unicode-Wert.
Den Kyrillische Unicode Zeichen sind alle Zeichen der folgenden Bereiche:
Wenn es in diesem Bereich ist es Kyrillisch. Nur durchführen, wenn der check. Wenn es im Bereich Nutzung
Integer.toHexString()
und voranstellen"\\u"
. Zusammen sollte es so Aussehen:Edit: sollte wohl den check -
c < 128
- und reverse-dieif
und dieelse
Körper; Sie wahrscheinlich entweichen sollte alles, was nicht ASCII ist. Ich war wohl zu literal in meine Lektüre Ihrer Frage.InformationsquelleAutor der Antwort ArtB
Gibt es ein Kommandozeilen-tool, die im Lieferumfang von java genannt native2ascii. Dieser wandelt unicode-Dateien zu ASCII-Escape-Dateien. Ich habe festgestellt, dass dies ein notwendiger Schritt für die Generierung .properties-Dateien für die Lokalisierung.
InformationsquelleAutor der Antwort Sam Barnum
Apache commons
StringEscapeUtils.escapeEcmaScript(String)
gibt einen string mit unicode-Zeichen escaped, indem der\u
notation.InformationsquelleAutor der Antwort davidofmorris
Wahrscheinlich könnte man hacken, wenn aus dieser JavaScript-code:
Quelle: iCompile - Noch ein Anderes JavaScript-Unicode Codieren/Decodieren
InformationsquelleAutor der Antwort
Nur einige grundlegende Methoden (inspiriert von native2ascii-tool):
InformationsquelleAutor der Antwort larsilus