Unicode-text-Datei zum testen für Unicode-Probleme?

Ich bin auf der Suche nach einer Beispiel-text unicode-Datei (UTF-8), die verwendet werden können für das testen der verschiedenen Probleme im Zusammenhang mit der text-Codierung und-Decodierung, einschließlich:

  • niedrige ascii-Zeichen verwenden, wie die ersten 32 codes
  • Zeichen außerhalb der BMP
  • NFC Verwandte Themen
  • XML encoding/decoding-Probleme

Vor allem möchte ich kopieren den text in die Zwischenablage, fügen es in einen HTML-text-Bereich der Anwendung, und in der Lage sein, um es aus eine Seite nach.

Dies würde es ermöglichen, zu identifizieren verschiedenen Unicode-Probleme, die auftreten könnten, bei der Decodierung, Codierung oder auch Datenbank-Ebene.

Kanonische Darstellung: Vergleich von gleich-aber andere Saiten: "-" = u-Zirkumflex oder "û" = Brief-u + Kombination diakritischer-Zirkumflex. XML 1.1 mit Sonderzeichen in den tags.
In diesem moment muss ich, um eine test-Datei, die für einige Jungs, so dass Sie testen, was Sie fügen Sie erreichen die Datenbank und später Ihren browser auch so Unicode-Vergleiche sind nicht in den Anwendungsbereich der Frage.

InformationsquelleAutor sorin | 2013-05-13

Schreibe einen Kommentar