Prüfung auf gültige utf-8-string in Python

Ich lese Dateinamen aus dem Datei-system und ich möchte Ihnen als JSON-kodiertes array. Das problem ist, dass die Dateien auf dem Dateisystem gespeichert werden können ungültige Codierung, und ich brauche, um mit dieser situation umzugehen weglassen Ungültiger Dateinamen vor der übergabe an json.dump, sonst wird es scheitern.

Gibt es eine Möglichkeit zu überprüfen, ob meine string (Dateiname) enthält gültige utf-8-chars?

  • Mich schockieren. Warum würde die Dateien, die keine gültigen UTF-8-Dateinamen?
  • es ist der name der Datei, die nicht in utf-8 codiert oder ist es die Daten in der Datei ?? ich m verwechselt.
  • Wie über fehlerhafte software, die erstellt Dateinamen basierend auf ID3-tags ohne Prüfung der Kodierung? Oder Montage (mit den falschen Optionen) eine alte Dateisystem verwendet, eine sonderbare Zeichen-Kodierung für die Dateinamen?
  • Ungültige Kodierung kann man große problem beim verschieben von Daten von alten (nicht utf-8) Anlagen (wie WinXP mit non-US/EN locale) und vor allem-Dateien in .Reißverschluss und .rar-Archiv-Dateien erstellt, die auf diesen Systemen
  • da das mit dem Namen/Dateisystem könnte beschädigt werden.
InformationsquelleAutor troex | 2011-03-10
Schreibe einen Kommentar