Konvertierung in ASCII mit Notepad++beschränkt
ES ist eng hier, aber ich versuche, herauszufinden, ob es gibt einen Weg, um eine standard-XML-oder HTML-Datei und konvertieren Sie alle Zeichen mit nur Notepad++. Wenn ich es tun kann, ohne ein plugin, das wäre Klasse.
Ich sehen, ändern kann ich die Codierung auf ANSI, aber ich sehe nicht, eine option für ASCII, und ich glaube nicht, Sie sind genau die gleiche Sache, sind Sie? Die XML - /HTML-gehen auf einen server, und der Einnahme Zeug, das wir verwenden nicht gerne Sonderzeichen wie Apostrophe, die nicht zu passen scheinen.
Ich vermute, da HTTP-Server wie ASCII. Im Grunde eine Menge Zeit vergeudet wird, indem techs jetzt manuell Gießen über jeden und jede Datei für diesen vermaledeiten Zeichen, das verursacht eine Menge eyebleed. Die Kodierung der Dateien standardmäßig glaube ich, ist UTF-8, wenn Sie generiert.
- Sie wollen also die Zeichen entfernt werden, wenn Sie die Codierungen ändern? Wenn man bedenkt, dass, das wäre destruktiv für die Datei (ich weiß, Sie wollen, aber andere Menschen vielleicht nicht) ich glaube nicht, dass es möglich ist. Ehrlich, Sie konnte nur schreiben Sie eine kurze Python-Skript zu entfernen/zu ersetzen bestimmter Zeichen in den Dateien.
- Auch ein Apostroph ist ein ASCII-Zeichen. Sind Sie Zeichen entfernen oder ersetzen Sie Sie mit einem ASCII-Zeichen?
- Sicherlich, einige grundlegende powershell-sollte in der Lage sein, was Sie brauchen. Aber, bitte klären Sie das problem. HTTP-Server behandeln payload als Byte, so ist es wahrscheinlich nicht die server per se, das ist Probleme.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich vermute, der Grund, ASCII-Liste nicht aufgeführt ist, weil ASCII unterstützt nicht alle byte-Werte. ASCII hat nur bytes
0x00 - 0x7F
. UTF-8 ist ein "super-set" von ASCII, in, dass die ersten 128 bytes sind die gleichen, aber es unterstützt auch0x80 - 0xFF
.Siehe UTF-8-codepage-layout
Grundsätzlich, wenn es einen bestimmten Grund, dass Sie nicht verwenden können, UTF-8 (wie du gehst, um es für ein Programm, das nur ASCII unterstützt wird, wie Sie nicht möchten, dass alle bytes
0x80 - 0xFF
) einfach UTF-8 verwenden, und stellen Sie sicher, dass die bytes nicht enthalten sind in Ihrem Programm.Beachten Sie, dass für den gleichen Grund, wie oben aufgeführt, können Sie auch verwenden, ANSI, das ist auch ein super-set von ASCII. Siehe diese Erklärung SO.