Gewusst wie: ersetzen von Unicode-Zeichen mit ASCII

Habe ich den folgenden Befehl zum ersetzen von Unicode-Zeichen mit ASCII-ones.

sed -i 's/Ã/A/g'

Das problem ist à nicht erkannt durch den sed-Befehl in meinem Unix-Umgebung, so würde ich annehmen, Sie ersetzen Sie es mit Ihrem hexadezimalen Wert. Wie würde der syntax Aussehen, wenn ich Gebrauch C3 statt?

Ich bin mit diesem Befehl als Vorlage für die anderen Charaktere würde ich gerne ersetzen mit Leerzeichen wie:

sed -i 's/©//g'

meinst du wie diese? stackoverflow.com/questions/22450563/...
Welcher Zeichensatz hat Ihr terminal verwenden? Und mit welchem encoding funktioniert die Eingabe von text verwenden? Ã in UTF-8 ist 0xC3 0x83, und Charakter 0x83 ist ein Kontroll-code, ISO 8859-1, so dass könnte ein problem sein. Ich nehme an, Sie können nicht nur festlegen LANG=en_US.UTF-8 auf Ihrem system.
"sed" wird die Arbeit machen. Bitte siehe meine Antwort.

InformationsquelleAutor Sandeep Johal | 2014-11-21

Schreibe einen Kommentar