Einfachste Weg, um eine vollständige Liste der alle UTF-8-Leerzeichen in PHP
In PHP, was ist der eleganteste Weg, um die komplette Liste (array von strings) aller Unicode -whitespace-Zeichen, in utf8 kodiert?
Ich brauche das zum generieren von Testdaten.
- Wenn Sie wollen, dass das ersetzen in einen string, werfen Sie einen Blick in
\p{Z}
innerhalb der regulären Ausdrücke: regular-expressions.info/unicode.html
Du musst angemeldet sein, um einen Kommentar abzugeben.
Diese E-Mail enthält eine Liste aller Unicode-whitespace-Zeichen codiert in UTF-8, UTF-16 und HTML.
Bearbeiten
Ursprünglich antwortete Feb 9 '10 (!). Wirklich Jungs, wenn die Informationen veraltet sind, können Sie fügen Sie Ihre eigenen Antwort, anstatt sich zu beklagen. Google einfach die URL bereits in meiner Antwort, und verdienen einige rep:
Die E-mail archiviert wurde hier (mir dauerte Sekunden), und der Leerraum Tabelle ist auch in der Einleitung erwähnt
"\u{00A0}"
anstelle von UTF-8"\xc2\xa0"
direkt.Jahre später, diese Frage hat noch top-Ergebnisse auf Google bei der Suche nach unicode-whitespace-Zeichen. devio s Antwort ist Super, aber unvollständig. Dies Schreibe (Oktober 2017) Wikipedia hat eine Liste von whitespace-Zeichen hier: https://en.wikipedia.org/wiki/Whitespace_character
Dieser Liste hat, gibt 25 code-Punkte, in der Erwägung, dass die derzeit akzeptierte Antwort-Listen 18. Einschließlich der sieben anderen code-Punkte, die Liste ist:
http://en.wikipedia.org/wiki/Space_%28punctuation%29#Spaces_in_Unicode
Leider nicht geben, UTF-8, aber es hat das Zeichen auf der web-Seite, so können Sie Ausschneiden und einfügen in deinen editor (wenn es speichert im UTF-8). Alternativ http://www.fileformat.info/info/unicode/char/180E/index.htm gibt UTF-8 (ersetzen Sie "180E" mit dem hex UTF-16 Wert, den Sie nachschlagen).
Dieser gibt auch ein paar zusätzliche Zeichen, dass @devio ausgezeichnete Antwort findet.