Notepad++ erkennen kann-Codierung?

Erstellt habe ich die Datei mit UTF-8-codierte Inhalte (mit PHP fputcsv).

Wenn ich öffnen Sie diese Datei in Notepad++ - Zeichen falsch sind (Notepad++ startet mit ANSI-Codierung).

Wenn ich bei Format->"Encode in UTF-8" aus dem Menü - alles ist in Ordnung.

Im Gedanken, dass Notepad++ erkennen kann-Codierung irgendwie, und vielleicht etwas falsch mit meiner Datei erstellt mit fputcsv? Erste byte oder so?

InformationsquelleAutor Kamil | 2013-01-09

encoding notepad++text-files

16

Automatisch erkennen, eine Codierung ist nicht etwas, das getan werden kann, genau. Es ist ziemlich wichtig, dass das encoding explizit angegeben werden. Es kann erraten werden, in einigen Fällen aber auch dann nicht mit 100% iger Sicherheit.

Dieser Dokumentation (Codierung) erklärt die situation in Bezug auf Notepad++.
Sie weisen auch darauf hin, dass die Schwierigkeit ergibt sich insbesondere, wenn die Datei noch nicht gespeichert wurde mit einem Byte Order Mark (BOM).

Gegeben, dass Ihre Datei korrekt angezeigt wird, sobald Sie manuell die Codierung, ich würde sagen, es ist nichts falsch mit, wie Sie generieren und speichern Sie die Datei. Die einzige Sache, die Sie überprüfen können ob es einen BOM gespeichert, die möglicherweise verbessern die Chancen von Notepad++ zu können, ermitteln automatisch die Codierung.

Es ist erwähnenswert, dass, obwohl es kann helfen, Editoren wie Notepad++ Angabe der Codierung genauer, gemäß Dem Unicode-Standard-Dokument, wird die Stückliste nicht empfohlen.
- Gibt es eine Möglichkeit zu kontrollieren, Byte-Order Mark) in PHP?
- Ich fürchte, ich bin kein PHP-Mensch, aber ich habe die Erfahrung gemacht das die vielleicht helfen: php.net/manual/en/function.utf8-encode.php#68211. Beachten Sie, dass die Stückliste ist nicht notwendig (und in der Tat ist nicht zu empfehlen in Den Unicode-Standard-Dokument)
- Danke @chamila_c. Das ist alles, was ich wissen wollte.
- Dein link (Codierung) nicht mehr funktioniert.
- Geändert link zum internet-Archiv-link, damit die Seite noch einmal gelesen werden kann!
InformationsquelleAutor Chamila Chulatunga
11

Müssen Sie überprüfen Sie die untere Rechte Ecke des Notepad++ - GUI zu sehen, die tatsächliche enconding, der verwendet wird. Das problem es ist nicht so, dass Notepad++ spezifische weil zu erraten, die richtige Codierung ist ein großes problem ohne wirkliche Lösung, so ist es besser, lassen Sie den Benutzer entscheiden, welche ist die am besten geeignete Codierung in jedem einzelnen Fall.

InformationsquelleAutor user1824407
0

Wenn Sie möchten, zu reflektieren, die Kodierung der text-Datei in ein Java-Programm, die Sie haben zu prüfen, zwei thnigs: - Kodierung und Zeichensatz. Wenn Sie eine Textdatei öffnen, sehen Sie die Codierung unter "Encoding" - Menü. Zusätzlich Blick auf das Zeichensatz-Menü-Punkt. Unter "Osteuropa" finden Sie "ISO 8859-2", und unter mitteleuropäischen "Windows-1250". Sie können entsprechende Codierung in das Java-Programm
wenn Sie nach oben schauen in der Tabelle:
https://docs.oracle.com/javase/8/docs/technotes/guides/intl/encoding.doc.html
Zum Beispiel, für Cenntral europäischen Zeichensatz "Windows-1250" die Tabelle vorschlagen, Java-Codierung "Cp1250". Setzt die Kodierung und sehen Sie die Zeichen in das Programm ordnungsgemäß.
- Welche Frage werden Sie beantworten? Die eigentliche Frage hat nichts zu tun mit java.
- Ich Antworte Frage in Bezug auf die Zeichen-Kodierung in Notepad++.
InformationsquelleAutor Andrushenko Alexander

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.