Konvertieren von "unknown-8bit" charset auf UTF-8
Helfe ich einen Freund hinzufügen von Inhalt zu einer älteren website, das ist geschrieben in so etwas wie FrontPage. Allerdings habe ich ein html-Dokument codiert mit "unknown-8bit" charset. Klammern.io, dass ich arbeiten bin, in nur UTF-8 unterstützt, damit kann ich nicht öffnen und neu speichern Sie das Dokument auf die richtige Kodierung.
Wie würde ich mich über diese Datei konvertieren in UTF-8, so dass ich dann in Klammern.io?
Ich bin mit OS X 10.10 Yosemite, so bin ich ein bisschen mehr begrenzt, als wenn ich saß auf Windows (mit Notepad++ die Federn in den Sinn).
Nachdem google ' Ing einige habe ich versucht Folgendes im terminal, aber "unknown-8bit" ist nicht.
iconv -f unknown-8bit -t utf-8 filename.html > newfilename.html
unknown-8it
ist nicht so viel eine Codierung wie ein Hinweis darauf, dass die encoding-Detektor gab: Es ist relativ sicher, es ist ein 8-bit-Codierung (wie fast alle), aber es fehlt an Indikatoren, um festzustellen, welche. Versuchen Sie einen anderen Detektor. Sie könnten sogar verwenden Sie Ihren browser und ändern Sie die Codierung, bis es richtig aussieht.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Können Sie
enca
oderchardet
,enca
wird wahrscheinlich erfolgreicher sein.Wenn Sie wissen, in welcher Sprache das Dokument geschrieben wurde, können Sie erraten, die Codierung und versuchen Sie, konvertieren Sie, bis Sie die richtigen Ergebnisse:
Englisch, Französisch, Deutsch, Spanisch... – in der Regel Windows-1252
Russisch, Ukrainisch,... – in der Regel Windows-1251
Polnisch, Tschechisch, Ungarisch... – in der Regel Windows-1250 oder ISO-8859-2
Japanisch – in der Regel Shift-JIS
und so weiter.
Es gibt auch eine Brackets-Erweiterung, um Dateien zu konvertieren, auf UTF-8-Codierung, so dass Sie nicht haben, verlassen Sie den editor. Aber wenn die anderen tools haben Probleme bei der Erkennung/Konvertierung der original-Datei das encoding, ich vermute, dass diese Erweiterung das gleiche problem haben.