2
Antworten
Scheint es, dass die roten Herz-emoji (❤️) "\u2764\uFE0F" erfordert zwei Unicode-codepoints, die speziell Heavy-Schwarz-Herz gefolgt von einem Variation Selector. Allerdings blau ?, grün ?, gelb ?, und lila ? haben jeweils Ihre eigene single-codepoint. Warum ist red
2
Antworten
In C++, es ist möglich erstellen Sie einen UTF-8 string, der mit dieser Art von notation: "\uD840\uDC50". Aber das funktioniert nicht in PHP. Gibt es eine ähnliche Schreibweise? Wenn nicht, gibt es eine integrierte Möglichkeit zum erstellen
3
Antworten
Ich bin auf der Suche nach Beispiel 1-byte, 2-byte 3-byte 4-byte 5-byte 6-byte-unicode-Zeichen. Alle links auf irgendeine Art von Referenz, all die verschiedenen unicode-Zeichen gibt und wie groß Sie sind (byte-Weise) wäre sehr dankbar. Ich hoffe, dieser
5
Antworten
In der Python-API ist es, einen Weg zu extrahieren, der unicode code point des Zeichens? Edit: falls es eine Rolle spielt, ich verwende Python 2.7. +1.. Hatte keine Ahnung, was die unicode-Codepunkte wurden, bevor Sie dies Lesen
4
Antworten
Warum Unicode-code-points erscheinen als U+<codepoint>? Beispielsweise U+2202 repräsentiert den Charakter ∂. Warum nicht U- (Bindestrich oder Bindestrich-Zeichen) oder etwas anderes? InformationsquelleAutor |
6
Antworten
Ich habe den folgenden regulären Ausdruck : Ich dachte, die meisten der Teil, wie folgt : ValidationExpression="^[\u0020\u0027\u002C\u002D\u0030-\u0039\u0041-\u005A\u005F\u0061-\u007A\u00C0-\u00FF°./]{1,256}$" u0020 : RAUM u0027 : APOSTROPH u002C : KOMMA u002D : BINDESTRICH /MINUS u0030-\u0039\ : 0-9 u0041-\u005A : A -
1
Antworten
Den hex-string '\xd3' können auch dargestellt werden als: Ó. Der einfachste Weg, die ich gefunden habe, um die Charakter-Darstellung der hex-string in der Konsole ist: print unichr(ord('\xd3')) Oder in Englisch, konvertieren des hex-string in eine Zahl, dann
4
Antworten
Ich versuche, Ausgabe unicode-string in das RTF-format. (Verwendung von c# und winforms) Aus wikipedia: Wenn eine Unicode-escape erforderlich, das control word \u verwendet wird, gefolgt von einer 16-bit-Dezimalwert mit Vorzeichen ganze Zahl, die den Unicode-codepoint-Nummer. Für den
3
Antworten
Kürzlich lief ich in codePointAt - Methode von String in Java. Ich fand auch ein paar andere codePoint Methoden: codePointBeforecodePointCount etc. Sie haben definitiv etwas zu tun mit Unicode aber ich verstehe es nicht. Nun Frage ich
3
Antworten
In Ihrer Erfahrung, die Unicode-Zeichen, zeichenelemente, Bereiche außerhalb der BMP (Basic Multilingual Plane) sind die häufigsten bisher? Diese sind diejenigen, die benötigen 4 bytes in UTF-8 oder Surrogate, die in UTF-16. Ich hätte gedacht, dass die Antwort