Gewusst wie: entfernen extended ascii mit python?

In versuchen zu beheben bis eine PML (Palm Markup Language) Datei, es scheint, als ob meine test-Datei nicht-ASCII-Zeichen, die verursacht MakeBook zu beschweren. Die Lösung wäre entfernen Sie alle nicht-ASCII-chars in der PML.

So, in dem Versuch, dies zu beheben, in python habe ich

import unicodedata, fileinput

for line in fileinput.input():
    print unicodedata.normalize('NFKD', line).encode('ascii','ignore')

Allerdings führt dies zu einer Fehlermeldung, die Zeile muss "unicode, nicht str". Hier ein Datei-fragment.

\B1a\B \tintense, disordered and often destructive rage†.†.†.\t

Nicht ganz sicher, wie Sie Sie richtig zu pass-line-in verarbeitet werden, an dieser Stelle.

  • Wollen Sie heraus zu filtern und alle Zeichen, deren ASCII-Wert größer als 255?
  • Streng genommen gibt es keine solche Sache wie Erweiterte ASCII. ASCII definiert Werte von 0 bis 127. Alles, was höher als die können nur interpretiert werden, willkürlich. Vielleicht sollte man den Begriff nicht-ASCII-Zeichen.
  • Verwandte: Safe escape-Funktion für terminal-Ausgabe stackoverflow.com/questions/437476/...
InformationsquelleAutor Jauder Ho | 2009-11-06
Schreibe einen Kommentar