Entfernen von nicht-ASCII-Zeichen, nicht druckbare Zeichen aus einem String

Bekomme ich Benutzereingaben, einschließlich nicht-ASCII-Zeichen und nicht druckbare Zeichen, wie

\xc2d
\xa0
\xe7
\xc3\ufffdd
\xc3\ufffdd
\xc2\xa0
\xc3\xa7
\xa0\xa0

Beispiel:

email : abc@gmail.com\xa0\xa0
street : 123 Main St.\xc2\xa0

gewünschte Ausgabe:

  email : abc@gmail.com
  street : 123 Main St.

Was ist der beste Weg, um entfernen Sie Sie mit Java?

Ich habe Folgendes versucht, aber scheint nicht zu funktionieren

public static void main(String args[]) throws UnsupportedEncodingException {
        String s = "abc@gmail\\xe9.com";
        String email = "[email protected]\\xa0\\xa0";

        System.out.println(s.replaceAll("\\P{Print}", ""));
        System.out.println(email.replaceAll("\\P{Print}", ""));
    }

Ausgabe

abc@gmail\xe9.com
abc@gmail.com\xa0\xa0
  • warum willst du Sie entfernen?
  • Mongo schlägt zu serialisieren diese Werte
  • benötigt] \xc2d ist eine gültige Unicode-Zeichen. Wenn MongoDB verwendet UTF-8 ist, sollte in der Lage sein zu serialisieren. Vielleicht haben Sie ein XY-Problem hier? Wie sind Sie mit der Serialisierung Ihren text?
InformationsquelleAutor daydreamer | 2012-06-13
Schreibe einen Kommentar