HTML Zeichen-Entitäten und die Zeichenkodierung festgelegt
Wenn einschließlich HTML-entities in einem HTML-Dokument tun die Personen müssen aus der gleichen Zeichencodierung festlegen, dass das Dokument angegeben ist, zu verwenden?
Wenn ich zum Beispiel bin mit dem copyright-Zeichen in einem HTML-Dokument angegeben wird, wie UTF-8
, ist es nötig, verwenden Sie die Unicode-HTML-entity (©
) oder ist es in Ordnung, zu verwenden andere Organisationen, wie die ASCII
HTML-entity (©
)?
Bitte erläutern Sie Ihre Antwort. Ich bin mir bewusst, dass es "funktioniert", aber es ist ein Fall, wo es nicht funktioniert?
Dank!
- ASCII nicht enthalten ein copyright-symbol in den Satz von Zeichen codiert.
- Er hat wohl nur gemeint, ISO-8859-1 (ISO Latin 1). Ich habe gehört, viele Menschen verwenden Sie die ASCII-austauschbar mit, dass die Kodierung und während es sich technisch gesehen nicht um die gleiche Sache, die ich einfach annehmen, dass Sie meinen Latin-1.
- Eigentlich war ich von einer Tabelle wie dieser: ascii.cl/htmlcodes.htm ich davon ausgegangen, dass, da die Tabelle zeigt die ASCII-Spalte für das copyright-symbol, dass es in der Codierung.
- Aber, ich kann sehen, dass auch dies: ascii.cl beinhaltet nicht das copyright-symbol. Was bedeutet "ASCII" beziehen sich auf die im vorherigen link dann?
- die Menschen sind sehr sehr Locker mit dem Begriff ASCII in diesen Tagen. Sie fast immer, dass ISO-Latin-1. Sehen: en.wikipedia.org/wiki/Extended_ASCII
Du musst angemeldet sein, um einen Kommentar abzugeben.
©
und©
geben Sie den gleichen Zeichen - 169 entspricht hexadezimal-A9. Diese beide geben Sie einen copyright-symbol. Zeichen-entities in HTML beziehen sich immer auf den Unicode-Codepunkten, dies ist in der HTML-4-Standard. Also, auch wenn Ihr Zeichensatz verändert sich, deine Einheiten immer noch auf die gleichen Charaktere.Dies bedeutet auch, dass können Sie Kodieren von Zeichen, die eigentlich gar nicht in Ihrem Zeichensatz der Wahl. Ich habe gerade ein Dokument erstellt in das ISO-8859-1-Zeichensatz, enthält jedoch eine Griechische lambda. Auch ASCII ist nicht in der Lage, direkt codieren eines copyright-symbol, aber es kann durch Zeichen-Entitäten.
Edit: Lesen Sie die Kommentare zu den anderen Antworten, möchte ich dies genauer erklären. Wenn Sie UTF-8 als Zeichencodierung für das Dokument, können Sie innerhalb der rohen HTML Quellcode schreiben Sie einen copyright-symbol ist einfach wie Sie ist. (Sie müssen einen Weg finden, geben Sie ihn, natürlich: kopieren-einfügen als üblich.) UTF-8 ermöglicht es Ihnen, direkt codieren jedes symbol, das Sie wollen. ISO-8859-1 ist viel mehr beschränkt, und ASCII-sogar noch mehr. Zum Beispiel, in meinem HTML -, wenn mein Dokument ist UTF-8-Dokument, das ich tun kann:
oder:
oder:
Die erste ist nur gültig, wenn der Zeichensatz unterstützt "©". Die anderen beiden sind immer gültig, aber weniger lesbar. Was auch immer text-editor Sie verwenden, wenn Sie es Wert ist Ihr Gewicht, sollte in der Lage sein, Ihnen zu sagen, welcher Zeichensatz es wird die Codierung des Dokuments in.
Wenn Sie dies tun, müssen Sie sicherstellen, dass Ihre web-server informiert den client über den korrekten Zeichensatz, oder, dass Ihr Dokument erklärt es mit etwas wie:
Habe ich verwendet UTF-8 gibt es als ein Beispiel. XHTML sollte der Zeichensatz, in die öffnung
<?xml ... ?>
tag.©
): zunächst würde ich empfehlen die Verwendung von UTF-8 und nur zu schreiben, das Zeichen buchstäblich, also, einfach gesagt © oder ähnliche, in Ihrer Quelle, da es dann direkt lesbar durch einen menschlichen (RibaldEddie Antwort). Ansonsten, die Anzahl wird nur der Unicode-Codepunkt ist. shapecatcher.com lassen Sie beim zeichnen der Zeichen, das Sie benötigen,Die Schönheit der UTF-8-Kodierung ist, dass Sie tatsächlich nur die binären Zeichen. Sie brauchen nicht verschlüsseln, als eine Einheit überhaupt. Wasserverbrauch: ©
Oh, Sie wollen einfach nur, um zu wissen, den Unterschied zwischen den beiden Entitäten? Es gibt keine. Beschreibt die byte in Hex und die anderen in dezimal.