Unicode-text-Datei zum testen für Unicode-Probleme?
Ich bin auf der Suche nach einer Beispiel-text unicode-Datei (UTF-8), die verwendet werden können für das testen der verschiedenen Probleme im Zusammenhang mit der text-Codierung und-Decodierung, einschließlich:
- niedrige ascii-Zeichen verwenden, wie die ersten 32 codes
- Zeichen außerhalb der BMP
- NFC Verwandte Themen
- XML encoding/decoding-Probleme
Vor allem möchte ich kopieren den text in die Zwischenablage, fügen es in einen HTML-text-Bereich der Anwendung, und in der Lage sein, um es aus eine Seite nach.
Dies würde es ermöglichen, zu identifizieren verschiedenen Unicode-Probleme, die auftreten könnten, bei der Decodierung, Codierung oder auch Datenbank-Ebene.
Kanonische Darstellung: Vergleich von gleich-aber andere Saiten: "-" = u-Zirkumflex oder "û" = Brief-u + Kombination diakritischer-Zirkumflex. XML 1.1 mit Sonderzeichen in den tags.
In diesem moment muss ich, um eine test-Datei, die für einige Jungs, so dass Sie testen, was Sie fügen Sie erreichen die Datenbank und später Ihren browser auch so Unicode-Vergleiche sind nicht in den Anwendungsbereich der Frage.
In diesem moment muss ich, um eine test-Datei, die für einige Jungs, so dass Sie testen, was Sie fügen Sie erreichen die Datenbank und später Ihren browser auch so Unicode-Vergleiche sind nicht in den Anwendungsbereich der Frage.
InformationsquelleAutor sorin | 2013-05-13
Du musst angemeldet sein, um einen Kommentar abzugeben.
Diese Seite wurde verwendet, um zu testen, web-Browser, mit Texten in mehreren scripts: http://www.columbia.edu/~fdc/utf8/index.html
Den Gothic-Eintrag für "ich kann Essen, Glas" ist es, insbesondere außerhalb der BMP: ??? ???? ????, ?? ??? ?? ???? ???????.
Normalization forms und XML-Verarbeitung sind in der Regel nicht problematisch, wenn das verschieben von Daten um, so gibt es keine gemeinsamen Proben, testen Sie diese zwei insbesondere.
InformationsquelleAutor Joni