Tag: unicode-normalization
Unicode-Normalisierung bezieht sich auf die Standardisierung des Unicode-Zeichenfolgen. Normalisierungsformen entfernen Sie die Unterschiede in der binären Darstellung der identischen Unicode-Zeichenfolgen.
2
Antworten
Den Unicode-Normalization-FAQ enthält den folgenden Absatz: Programme sollten immer vergleichen canonical-entspricht Unicode-Zeichenfolgen als gleich ... Der Unicode-Standard bietet eine gut definierte Normalisierungsformen, die HIERFÜR genutzt werden können: NFC, NFD. ... und weiter... Die Wahl, welche zu verwenden,
5
Antworten
Gibt es standalonenish Lösungen für die Normalisierung der internationalen unicode-text, um die sichere ids und Dateinamen in Python? E. g. drehen Sie My International Text: åäö zu my-international-text-aao plone.i18n macht wirklich gute Arbeit, aber leider kommt es
3
Antworten
Ich versuche, laden Sie einige Inhalte aus einer Wörterbuch-Website wie http://dictionary.reference.com/browse/apple?s=t Das problem das ich habe ist, dass der ursprüngliche Absatz hat alle diese schnörkeligen Linien und Rückwärtsgang Briefe, und so, wenn ich die lokalen Dateien, die
7
Antworten
betrachten Sie diese einfachen code: echo iconv('UTF-8', 'ASCII//TRANSLIT', 'è'); druckt es `e statt nur e weißt du, was ich falsch mache? nichts geändert, nach dem hinzufügen von setlocale setlocale(LC_COLLATE, 'en_US.utf8'); echo iconv('UTF-8', 'ASCII//TRANSLIT', 'è'); Erste, dies ist
3
Antworten
Wieder, ich bin sehr verwirrt mit einem unicode-Frage. Ich kann nicht herausfinden, wie man erfolgreich nutzen unicodedata.normalisieren zum konvertieren von nicht-ASCII-Zeichen wie erwartet. Zum Beispiel, ich möchte um konvertieren Sie die Zeichenfolge u"Cœur" Zu u"Coeur" Ich bin
4
Antworten
Ich bin unter dem Eindruck, dass der JavaScript-interpreter wird davon ausgegangen, dass der source-code ist die Interpretation hat sich bereits normalisiert wurde. Was genau bedeutet das normalisieren? Es kann nicht der text-editor, sonst wird die plaintext-Darstellung der
4
Antworten
Möchte ich zum vergleichen von zwei strings in JavaScript, dass sind die gleichen, und doch ist der Gleichheits-operator == gibt false zurück. Ein string enthält Sie ein Sonderzeichen (zB. die Dänische å). JavaScript-code: var filenameFromJS = "Designhåndbog.pdf";
1
Antworten
Auf die API-doc, http://docs.python.org/2/library/unicodedata.html#unicodedata.normalize. Es sagt Rückkehr der normalen form form für die Unicode-Zeichenfolge unistr. Gültige Werte für form sind 'NFC', 'NFKC', 'NFD' und 'NFKD'.` Die Dokumentation ist eher vage, kann jemand erklären die valid values mit
1
Antworten
Ich bin auf der Suche nach einer Beispiel-text unicode-Datei (UTF-8), die verwendet werden können für das testen der verschiedenen Probleme im Zusammenhang mit der text-Codierung und-Decodierung, einschließlich: niedrige ascii-Zeichen verwenden, wie die ersten 32 codes Zeichen außerhalb
2
Antworten
Während ich versucht hatte, Sie zu überprüfen meine Website(http://dvartora.com/DvarTora/) bekomme ich die folgende Fehlermeldung: Text wird nicht in Unicode Normalization Form C Einen: Was bedeutet es? B: Kann ich dieses Problem beheben Sie mit notepad++ und wie?
7
Antworten
Den ICU-Projekts (die nun auch eine PHP-Bibliothek) enthält die benötigten Klassen zu helfen, normalisieren von UTF-8-strings, um es einfacher, um Werte zu vergleichen, bei der Suche. Jedoch, ich versuche, herauszufinden, was dies bedeutet für Anwendungen. Zum Beispiel,
1
Antworten
Also auf die API-doc, http://docs.python.org/2/library/unicodedata.html#unicodedata.normalize. Es sagt Rückkehr der normalen form form für die Unicode-Zeichenfolge unistr. Gültige Werte für form sind 'NFC', 'NFKC', 'NFD' und 'NFKD'.` Die Dokumentation ist eher vage, kann jemand erklären die valid values