Wie das Lesen von Dateien mit unterschiedlichen Kodierungen mit Awk?
Wie kann ich korrekt Lesen Dateien andere Kodierungen als UTF-8 in Awk?
Ich habe eine Datei in Hebräisch/Windows-1255-Codierung.
Ein einfaches {print $0} awk druckt Sachen wie �.
wie kann ich es machen das richtig gelesen?
- Das ist durchaus möglich habe gerade so viel zu tun mit dem terminal als mit awk.
Du musst angemeldet sein, um einen Kommentar abzugeben.
awk selbst keine Unterstützung für den Umgang mit verschiedenen Zeichencodierungen. Es wird zu Ehren der angegebene locale in der Umgebung, aber Ihre beste Wette ist, um umkodieren des input-auf die richtige Codierung vor der übergabe es zu awk.
-f ist das format, das Sie konvertieren möchten, aus, -t ist das Ziel-format, und -c überspringt alle ungültigen Zeichen, die vorzeitig kündigen "iconv" - Funktion. Natürlich --help gibt mehr details.