Tag: unicode-normalization

Unicode-Normalisierung bezieht sich auf die Standardisierung des Unicode-Zeichenfolgen. Normalisierungsformen entfernen Sie die Unterschiede in der binären Darstellung der identischen Unicode-Zeichenfolgen.

Wenn für die Verwendung der Unicode-normalisierungsformulare NFC, NFD?

Anzahl der Antworten 2 Antworten
Den Unicode-Normalization-FAQ enthält den folgenden Absatz: Programme sollten immer vergleichen canonical-entspricht Unicode-Zeichenfolgen als gleich ... Der Unicode-Standard bietet eine gut definierte Normalisierungsformen, die HIERFÜR genutzt werden können: NFC, NFD. ... und weiter... Die Wahl, welche zu verwenden,

Die Normalisierung von unicode-text, Dateinamen, etc. in Python

Anzahl der Antworten 5 Antworten
Gibt es standalonenish Lösungen für die Normalisierung der internationalen unicode-text, um die sichere ids und Dateinamen in Python? E. g. drehen Sie My International Text: åäö zu my-international-text-aao plone.i18n macht wirklich gute Arbeit, aber leider kommt es

Wie konvertieren von unicode-Zeichen mit Akzent, um reinen ascii-Text ohne Akzente?

Anzahl der Antworten 3 Antworten
Ich versuche, laden Sie einige Inhalte aus einer Wörterbuch-Website wie http://dictionary.reference.com/browse/apple?s=t Das problem das ich habe ist, dass der ursprüngliche Absatz hat alle diese schnörkeligen Linien und Rückwärtsgang Briefe, und so, wenn ich die lokalen Dateien, die

php iconv translit für das entfernen von Akzenten: nicht so funktioniert, wie unter VORBEHALT?

Anzahl der Antworten 7 Antworten
betrachten Sie diese einfachen code: echo iconv('UTF-8', 'ASCII//TRANSLIT', 'è'); druckt es `e statt nur e weißt du, was ich falsch mache? nichts geändert, nach dem hinzufügen von setlocale setlocale(LC_COLLATE, 'en_US.utf8'); echo iconv('UTF-8', 'ASCII//TRANSLIT', 'è'); Erste, dies ist

Mit unicodedata.normalisieren in Python 2.7

Anzahl der Antworten 3 Antworten
Wieder, ich bin sehr verwirrt mit einem unicode-Frage. Ich kann nicht herausfinden, wie man erfolgreich nutzen unicodedata.normalisieren zum konvertieren von nicht-ASCII-Zeichen wie erwartet. Zum Beispiel, ich möchte um konvertieren Sie die Zeichenfolge u"Cœur" Zu u"Coeur" Ich bin

JavaScript Unicode-Normalisierung

Anzahl der Antworten 4 Antworten
Ich bin unter dem Eindruck, dass der JavaScript-interpreter wird davon ausgegangen, dass der source-code ist die Interpretation hat sich bereits normalisiert wurde. Was genau bedeutet das normalisieren? Es kann nicht der text-editor, sonst wird die plaintext-Darstellung der

Javascript string Vergleich fehlschlägt beim Vergleich von unicode-Zeichen

Anzahl der Antworten 4 Antworten
Möchte ich zum vergleichen von zwei strings in JavaScript, dass sind die gleichen, und doch ist der Gleichheits-operator == gibt false zurück. Ein string enthält Sie ein Sonderzeichen (zB. die Dänische å). JavaScript-code: var filenameFromJS = "Designhåndbog.pdf";

Wie funktioniert unicodedata.normalisieren(form, unistr) arbeiten?

Anzahl der Antworten 1 Antworten
Auf die API-doc, http://docs.python.org/2/library/unicodedata.html#unicodedata.normalize. Es sagt Rückkehr der normalen form form für die Unicode-Zeichenfolge unistr. Gültige Werte für form sind 'NFC', 'NFKC', 'NFD' und 'NFKD'.` Die Dokumentation ist eher vage, kann jemand erklären die valid values mit

Unicode-text-Datei zum testen für Unicode-Probleme?

Anzahl der Antworten 1 Antworten
Ich bin auf der Suche nach einer Beispiel-text unicode-Datei (UTF-8), die verwendet werden können für das testen der verschiedenen Probleme im Zusammenhang mit der text-Codierung und-Decodierung, einschließlich: niedrige ascii-Zeichen verwenden, wie die ersten 32 codes Zeichen außerhalb

Text wird nicht in Unicode Normalization Form C

Anzahl der Antworten 2 Antworten
Während ich versucht hatte, Sie zu überprüfen meine Website(http://dvartora.com/DvarTora/) bekomme ich die folgende Fehlermeldung: Text wird nicht in Unicode Normalization Form C Einen: Was bedeutet es? B: Kann ich dieses Problem beheben Sie mit notepad++ und wie?

Was ist normalisiert UTF-8?

Anzahl der Antworten 7 Antworten
Den ICU-Projekts (die nun auch eine PHP-Bibliothek) enthält die benötigten Klassen zu helfen, normalisieren von UTF-8-strings, um es einfacher, um Werte zu vergleichen, bei der Suche. Jedoch, ich versuche, herauszufinden, was dies bedeutet für Anwendungen. Zum Beispiel,

Kann jemand erklären, wie unicodedata.normalize (form, unistr) mit Beispielen arbeitet?

Anzahl der Antworten 1 Antworten
Also auf die API-doc, http://docs.python.org/2/library/unicodedata.html#unicodedata.normalize. Es sagt Rückkehr der normalen form form für die Unicode-Zeichenfolge unistr. Gültige Werte für form sind 'NFC', 'NFKC', 'NFD' und 'NFKD'.` Die Dokumentation ist eher vage, kann jemand erklären die valid values