Konvertiert null-gepolsterte bytes in UTF-8-string

Ich bin Auspacken mehrere Strukturen enthalten " s " - Typ-Felder von C. enthalten Die Felder mit Nullen aufgefüllt UTF-8-Zeichenfolgen behandelt strncpy in den C-code (Hinweis: diese Funktion ist verkümmert Verhalten). Wenn ich decode bytes bekomme ich einen unicode-string mit vielen NUL Zeichen am Ende.

>>> b'hiya\0\0\0'.decode('utf8')
'hiya\x00\x00\x00'

War ich unter dem Eindruck, dass nachgestellte null-bytes wurden Teil von UTF-8 und wäre automatisch gelöscht.

Was ist der richtige Weg, um die drop null bytes?

InformationsquelleAutor der Frage Matt Joiner | 2011-02-22

Schreibe einen Kommentar