So konvertieren Sie eine Datei von ASCII nach UTF-8?

Ich versuche mit transcode ein Haufen Dateien von ASCII zu UTF-8.

Dafür, ich habe versucht, mit iconv:

iconv -f US-ASCII -t UTF-8 infile > outfile

-f ENCODING die Kodierung der Eingabe

-t ENCODING die Codierung der Ausgabe

Immer noch, dass die Datei nicht konvertieren zu UTF-8. Es ist eine .dat-Datei.

Bevor dieses posting, ich suchte in Google und finden Sie Informationen wie:

ASCII eine Teilmenge von UTF-8, also alle ASCII-Dateien sind bereits in UTF-8 codiert. Die bytes in ASCII-Datei und die bytes, die sich aus "encoding es sich um UTF-8" wäre genau der gleichen bytes. Es gibt keinen Unterschied zwischen Ihnen.

Kraft codieren von US-ASCII auf UTF-8 (iconv)

Beste Weg, um text zu konvertieren, Dateien zwischen verschiedenen Zeichensätzen?

Immer noch die links oben, hat auch nicht geholfen.

Obwohl es in ASCII unterstützt wird UTF-8 als UTF-8 ist ein super set, der anderen Partei, die Sie erhalten die Dateien von mir braucht-Datei die Kodierung UTF-8. Er brauche nur Datei-format als UTF-8.

Irgendwelche Vorschläge bitte.

  • Es ist überhaupt nicht klar, was das problem ist - nur geben die person, die den ursprünglichen ASCII-Dateien. Wenn Sie echte ASCII -, Sie sind bereits UTF-8, so dass Sie sollten in Ordnung sein. Was ist eigentlich schief gehen?
  • Skeet Der anderen Partei zu erwarten, die Datei-format als UTF-8, Wenn ich versuchte, mit dem Befehl Datei-ich outfile es zurückgeben von ascii -, aber Sie wollen es als utf-8 strictily. Obwohl ascii ist Teilmenge von utf-8.
  • Es ist "UTF-8 streng", wenn es wirklich ASCII. Basierend auf Ihren Kommentar, es klingt wie die andere Partei ist grundsätzlich gebrochen, wenn Sie die Ablehnung von ASCII-Dateien, weil der Ausgang von file. Sie sollten akzeptieren, dass ASCII-Dateien sind UTF-8 Dateien, und einfach weiter zu verarbeiten ist es sowieso.
  • In der Abwesenheit von zusätzlichen details, ich wäre geneigt, dem zuzustimmen. Es wäre wahrscheinlich Wert, was darauf hindeutet und Sie zu ermutigen, zu akzeptieren, beide Antworten von 'file'. Ihre API ist flexibler und robuster, und Sie werden sich selbst retten müssen, haben diese genaue Diskussion über und über mit anderen über Sie. Wenn Sie nicht in der Lage oder nicht Willens, dies zu tun, dann zumindest eine sehr explizite Angabe in Ihrer Dokumentation, dass die Stückliste ist in der input-Datei verwenden, die präzise Sprache, würde wohl auch gehen einen langen Weg.
InformationsquelleAutor Ram | 2015-02-07
Schreibe einen Kommentar