Notepad++ erkennen kann-Codierung?
Erstellt habe ich die Datei mit UTF-8-codierte Inhalte (mit PHP fputcsv).
Wenn ich öffnen Sie diese Datei in Notepad++ - Zeichen falsch sind (Notepad++ startet mit ANSI-Codierung).
Wenn ich bei Format->"Encode in UTF-8" aus dem Menü - alles ist in Ordnung.
Im Gedanken, dass Notepad++ erkennen kann-Codierung irgendwie, und vielleicht etwas falsch mit meiner Datei erstellt mit fputcsv
? Erste byte oder so?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Automatisch erkennen, eine Codierung ist nicht etwas, das getan werden kann, genau. Es ist ziemlich wichtig, dass das encoding explizit angegeben werden. Es kann erraten werden, in einigen Fällen aber auch dann nicht mit 100% iger Sicherheit.
Dieser Dokumentation (Codierung) erklärt die situation in Bezug auf Notepad++.
Sie weisen auch darauf hin, dass die Schwierigkeit ergibt sich insbesondere, wenn die Datei noch nicht gespeichert wurde mit einem Byte Order Mark (BOM).
Gegeben, dass Ihre Datei korrekt angezeigt wird, sobald Sie manuell die Codierung, ich würde sagen, es ist nichts falsch mit, wie Sie generieren und speichern Sie die Datei. Die einzige Sache, die Sie überprüfen können ob es einen BOM gespeichert, die möglicherweise verbessern die Chancen von Notepad++ zu können, ermitteln automatisch die Codierung.
Es ist erwähnenswert, dass, obwohl es kann helfen, Editoren wie Notepad++ Angabe der Codierung genauer, gemäß Dem Unicode-Standard-Dokument, wird die Stückliste nicht empfohlen.
Müssen Sie überprüfen Sie die untere Rechte Ecke des Notepad++ - GUI zu sehen, die tatsächliche enconding, der verwendet wird. Das problem es ist nicht so, dass Notepad++ spezifische weil zu erraten, die richtige Codierung ist ein großes problem ohne wirkliche Lösung, so ist es besser, lassen Sie den Benutzer entscheiden, welche ist die am besten geeignete Codierung in jedem einzelnen Fall.
Wenn Sie möchten, zu reflektieren, die Kodierung der text-Datei in ein Java-Programm, die Sie haben zu prüfen, zwei thnigs: - Kodierung und Zeichensatz. Wenn Sie eine Textdatei öffnen, sehen Sie die Codierung unter "Encoding" - Menü. Zusätzlich Blick auf das Zeichensatz-Menü-Punkt. Unter "Osteuropa" finden Sie "ISO 8859-2", und unter mitteleuropäischen "Windows-1250". Sie können entsprechende Codierung in das Java-Programm
wenn Sie nach oben schauen in der Tabelle:
https://docs.oracle.com/javase/8/docs/technotes/guides/intl/encoding.doc.html
Zum Beispiel, für Cenntral europäischen Zeichensatz "Windows-1250" die Tabelle vorschlagen, Java-Codierung "Cp1250". Setzt die Kodierung und sehen Sie die Zeichen in das Programm ordnungsgemäß.