Beste Möglichkeit, Textdateien zwischen Zeichensätzen zu konvertieren?
Was ist der Schnellste, einfachste tool oder Methode um text zu konvertieren, Dateien zwischen verschiedenen Zeichensätzen?
Speziell, ich brauche zum konvertieren von UTF-8 auf ISO-8859-15 und Umgekehrt.
Alles geht: Einzeiler in Ihrem Lieblings-scripting-Sprache, Kommandozeilen-Werkzeuge oder andere utilities für OS, web-sites, etc.
Besten Lösungen so weit:
Unter Linux/UNIX/OS X/cygwin:
- Gnu iconv vorgeschlagen Troels Arvin wird am besten verwendet, als filter. Es scheint universell verfügbar. Beispiel:
$ iconv -f UTF-8 -t ISO-8859-15 in.txt > out.txt
Wie bereits von Benes ist ein online-Konverter mit iconv.
- Gnu recode (Handbuch) vorgeschlagen, durch Cheekysoft konvertieren eine oder mehrere Dateien in-place -. Beispiel:
$ recode UTF8..ISO-8859-15 in.txt
Diese verwendet man kürzere Aliase:
$ recode utf8..l9 in.txt
Recode unterstützt auch Oberflächendie verwendet werden können, zu konvertieren zwischen verschiedenen Zeilenende-Typen und Codierungen:
Konvertieren Zeilenumbruch von LF (Unix) CR-LF (DOS):
$ recode ../CR-LF in.txt
Base64 encode file:
$ recode ../Base64 in.txt
Können Sie auch kombinieren.
Konvertieren, die eine Base64-codierte UTF8-Datei mit Unix-Zeilenenden in Base64-Codierung Latin-1-Datei mit Dos-Zeilenenden:
$ recode utf8/Base64..l1/CR-LF/Base64 file.txt
Unter Windows mit Powershell (Jay Bazuzi):
PS C:\> gc -en utf8 in.txt | Out-File -en ascii out.txt
(Keine ISO-8859-15 unterstützt, obwohl; es sagt, dass die unterstützten Zeichensätze unicode, utf7, utf8, utf32", "ascii " bigendianunicode", "Standard" und "oem".)
Bearbeiten
Meinst du iso-8859-1 unterstützt? Mit "String" wird dieses z.B. für den vice versa
gc -en string in.txt | Out-File -en utf8 out.txt
Hinweis: Die möglichen Enumerationswerte sind "Unbekannt, String, Unicode, Byte, BigEndianUnicode, UTF8, UTF7", "Ascii".
- CsCvt - Kalytta Zeichensatz-Konverter ist ein weiterer großer Kommandozeilen-basierten Konvertierungs-Werkzeug für Windows.
InformationsquelleAutor der Frage |
Du musst angemeldet sein, um einen Kommentar abzugeben.
Stand-alone-Dienstprogramm Ansatz
InformationsquelleAutor der Antwort Troels Arvin
Versuchen, VIM
Wenn Sie
vim
diese:Nicht getestet, für jede Codierung.
Das kühle Teil über dieses ist, dass Sie nicht haben, um zu wissen, die Quell-Codierung
Sich bewusst sein, dass dieser Befehl direkt ändern, die Datei
Erklärung Teil!
+
: Wird von vim, um direkt geben Sie Befehl, wenn Sie eine Datei öffnen. In der Regel verwendet, um öffnen Sie eine Datei an einer bestimmten Zeile:vim +14 file.txt
|
: Trennzeichen für mehrere Befehle (wie;
in der bash)set nobomb
: keine utf-8-BOMset fenc=utf8
: Neue Codierung auf utf-8 doc-linkx
: Speichern und schließen Sie die Dateifilename.txt
: Pfad zu der Datei"
: qotes sind hier wegen der Rohre. (sonst bash verwenden Sie als bash-pipe)InformationsquelleAutor der Antwort
Unter Linux können Sie das sehr leistungsfähige recode Befehl, um zu versuchen und die Konvertierung zwischen verschiedenen Zeichensätzen sowie jedem Zeilenende Probleme. recode -l zeigen Ihnen alle Formate und Codierungen, die das tool können Sie konvertieren zwischen. Es ist wahrscheinlich eine SEHR lange Liste.
InformationsquelleAutor der Antwort Cheekysoft
Die kürzeste version, wenn man davon ausgehen kann, dass die Eingabe der Stückliste ist richtig:
InformationsquelleAutor der Antwort Jay Bazuzi
iconv(1)
Außerdem gibt es in der iconv-basierten tools in vielen Sprachen.
InformationsquelleAutor der Antwort Daniel Papasian
Versuchen iconv Bash-Funktion
Ich habe diese in
.bashrc
:..um in der Lage sein, um Dateien zu konvertieren, etwa so:
InformationsquelleAutor der Antwort
Versuchen Notepad++
Unter Windows konnte ich mit Notepad++, um die Konvertierung von ISO-8859-1 zu UTF-8. Klicken Sie auf
"Encoding"
und dann"Convert to UTF-8"
.InformationsquelleAutor der Antwort
Oneliner Verwendung finden, mit automatischer Erkennung
Die Zeichenkodierung alle passenden text-Dateien wird automatisch erkannt und alle text-Dateien konvertiert werden, um
utf-8
Codierung:Diese Schritte auszuführen, wird eine sub-shell
sh
mit-exec
läuft ein Einzeiler mit der-c
fahne und übergibt den Dateinamen als die positionelle argument"$1"
mit-- {}
. In zwischen, dieutf-8
Ausgabe-Datei ist vorübergehend namensconverted
.Wobei
- Datei -bi
bedeutet:-b, --kurze
Nicht Hänge den Dateinamen an die Ausgabe-Leitungen (kurz-Modus).
-i, --mime
Bewirkt, dass die Datei-Befehl zur Ausgabe mime-Typ Zeichenfolgen anstelle der traditionellen human-readable lieben. Also er kann sagen, 'text/plain; charset=us-ascii" ist, sondern als "ASCII-text".
Den
find
Befehl ist sehr nützlich für eine solche Datei-management-Automatisierung.Klicken Sie hier für mehr
in Hülle und fülle.
InformationsquelleAutor der Antwort
PHP iconv()
iconv("UTF-8", "ISO-8859-15", $input);
InformationsquelleAutor der Antwort user15096
DOS/Windows: verwenden Sie Codepage
Befehl
chcp
können verwendet werden, um die code-Seite ändern. Codepage 65001 ist die Microsoft-Bezeichnung für UTF-8. Nach der Einstellung code-Seite, die Ausgabe, die generiert wird, indem Sie die folgenden Befehle werden von der code-Seite festgelegt.InformationsquelleAutor der Antwort
Yudit editor unterstützt und konvertiert zwischen vielen verschiedenen text-Codierungen, läuft auf linux, windows, mac, etc.
-Adam
InformationsquelleAutor der Antwort Adam Davis
schreiben properties-Datei (Java -) normalerweise benutze ich unter linux (mint und ubuntu-Distributionen):
Beispiel:
PS: ich writed Ausführung Anzahl ein - /zwei-in portugues zu zwingen Sonderzeichen.
In meinem Fall, in der ersten Ausführung erhielt ich diese Nachricht:
Installiert als ich die erste option (gcj-5-jdk) war das problem beendet.
Ich hoffe, dies hilft jemand.
InformationsquelleAutor der Antwort
Wie beschrieben auf Wie kann ich die richtige Zeichenkodierung einer Datei? Synalyze! können Sie leicht umwandeln, die auf OS X zwischen alle Kodierungen unterstützt durch die ICU-Bibliothek.
Zusätzlich können Sie die Anzeige einige bytes einer Datei übersetzt Unicode von allen Codierungen sehen Sie sofort, welche ist die richtige für Ihre Datei.
InformationsquelleAutor der Antwort