Python erkennt String-Byte-Codierung

Habe ich über 1000 Dateinamen Lesen, die von os.listdir()
einige von Ihnen sind codiert, 'utf-8' und einige 'cp1252'.

Ich entschlüsseln will, alle von Ihnen zu unicode für die weitere Verarbeitung in meinem Skript. Gibt es einen Weg, um die Quell-Codierung korrekt zu Dekodieren, die in unicode?

Beispiel:

for item in os.listdir(rootPath):

    #Convert to Unicode
    if isinstance(item, str):
        item = item.decode('cp1252')  # or item = item.decode('utf-8')
    print item

InformationsquelleAutor der Frage Phil | 2013-04-10

Schreibe einen Kommentar