Was ist der {L} Unicode-Kategorie?
Stieß ich auf einige reguläre Ausdrücke enthalten [^\\p{L}]
. Ich verstehe, dass dies mit irgendeiner form von Unicode-Kategorie ist, aber wenn ich überprüft die Dokumentation, ich fand nur die folgende "L" Kategorien:
Lu Uppercase letter UPPERCASE_LETTER
Ll Lowercase letter LOWERCASE_LETTER
Lt Titlecase letter TITLECASE_LETTER
Lm Modifier letter MODIFIER_LETTER
Lo Other letter OTHER_LETTER
Was ist L
in diesem Zusammenhang?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Entnommen aus diesem link: http://www.regular-expressions.info/unicode.html
Überprüfen Sie die
Unicode Character Properties
Abschnitt.Sehe ich keine explizite Erwähnung, aber ein Beispiel auf auf dieser Seite zeigt an, dass
\\p{L}
bedeutet jeden Brief:String.replaceAll("[^\\p{L}]", " ")
^\\p{L}
. Also, wenn ich so etwas tun"Test akd ^^%!~+_)".replaceAll("[^\\p{L}]", " ")
dann wird es ausgegeben wirdTest akd
. Im Gegenteil, wenn Sie so etwas tun"Test akd ^^%!~+_)".replaceAll("[\\p{L}]", " ");
dann wird die Ausgabe` ^^%!~+_)`^%!~+_
sind nicht als Buchstaben? (Ich bin im Grunde auf der Suche, um zu ersetzen Sie alle nicht-Buchstaben (außer Apostroph'
wie inwasn't
) mit einem Raum, jeder Vorschlag?)[^(\\p{L}')]