Wie konvertiert ein UTF-string mit skandinavischen Zeichen in ASCII?

Ich würde gerne konvertieren Sie diese Zeichenfolge

foo_utf = u'nästy chäräctörs with å and co.' # unicode

in diesem

foo_ascii = 'nästy chäräctörs with å and co.' # ASCII

.

Irgendeine Idee, wie man dies in Python (2.6)? Ich fand unicodedata Modul aber ich habe keine Ahnung, wie die transformation.

  • ascii nicht å ä ö und andere, wollen Sie etwas anderes, z.B. iso 8859-1(latin-1) oder utf-8 ?
  • Wahrscheinlich habe ich die Frage neu zu formulieren, ein bisschen. Ich lief in das Thema während der Entwicklung einer template-tag für Django. Ich bemerkte es funktioniert gut, wenn mit reguläre Zeichenfolgen, aber scheitert, während genau die gleichen unicode-string.
  • Ihre top-string ist nicht jede form von UTF. UTF unicode-Codierungen, das heißt, Sie sind Sequenzen von bytes, die unicode-Zeichen darstellen. Was Sie haben, ist eine unicode-Zeichenfolge, die eine Folge von Zeichen. Die Anzahl der bytes in jedem ist irrelevant, und es ist unmöglich zu bestimmen, von in python. Die Unterscheidung ist nicht bloße Pedanterie. Zu verstehen, was python macht mit Ihrem text wird Ihnen helfen, vermeiden Sie die lästigen Unicode{En,De}codeError s.
Schreibe einen Kommentar