HTML Zeichen-Entitäten und die Zeichenkodierung festgelegt

Wenn einschließlich HTML-entities in einem HTML-Dokument tun die Personen müssen aus der gleichen Zeichencodierung festlegen, dass das Dokument angegeben ist, zu verwenden?

Wenn ich zum Beispiel bin mit dem copyright-Zeichen in einem HTML-Dokument angegeben wird, wie UTF-8, ist es nötig, verwenden Sie die Unicode-HTML-entity (©) oder ist es in Ordnung, zu verwenden andere Organisationen, wie die ASCII HTML-entity (©)?

Bitte erläutern Sie Ihre Antwort. Ich bin mir bewusst, dass es "funktioniert", aber es ist ein Fall, wo es nicht funktioniert?

Dank!

ASCII nicht enthalten ein copyright-symbol in den Satz von Zeichen codiert.
Er hat wohl nur gemeint, ISO-8859-1 (ISO Latin 1). Ich habe gehört, viele Menschen verwenden Sie die ASCII-austauschbar mit, dass die Kodierung und während es sich technisch gesehen nicht um die gleiche Sache, die ich einfach annehmen, dass Sie meinen Latin-1.
Eigentlich war ich von einer Tabelle wie dieser: ascii.cl/htmlcodes.htm ich davon ausgegangen, dass, da die Tabelle zeigt die ASCII-Spalte für das copyright-symbol, dass es in der Codierung.
Aber, ich kann sehen, dass auch dies: ascii.cl beinhaltet nicht das copyright-symbol. Was bedeutet "ASCII" beziehen sich auf die im vorherigen link dann?
die Menschen sind sehr sehr Locker mit dem Begriff ASCII in diesen Tagen. Sie fast immer, dass ISO-Latin-1. Sehen: en.wikipedia.org/wiki/Extended_ASCII

InformationsquelleAutor Mike Moore | 2010-08-29

10

© und © geben Sie den gleichen Zeichen - 169 entspricht hexadezimal-A9. Diese beide geben Sie einen copyright-symbol. Zeichen-entities in HTML beziehen sich immer auf den Unicode-Codepunkten, dies ist in der HTML-4-Standard. Also, auch wenn Ihr Zeichensatz verändert sich, deine Einheiten immer noch auf die gleichen Charaktere.

Dies bedeutet auch, dass können Sie Kodieren von Zeichen, die eigentlich gar nicht in Ihrem Zeichensatz der Wahl. Ich habe gerade ein Dokument erstellt in das ISO-8859-1-Zeichensatz, enthält jedoch eine Griechische lambda. Auch ASCII ist nicht in der Lage, direkt codieren eines copyright-symbol, aber es kann durch Zeichen-Entitäten.

Edit: Lesen Sie die Kommentare zu den anderen Antworten, möchte ich dies genauer erklären. Wenn Sie UTF-8 als Zeichencodierung für das Dokument, können Sie innerhalb der rohen HTML Quellcode schreiben Sie einen copyright-symbol ist einfach wie Sie ist. (Sie müssen einen Weg finden, geben Sie ihn, natürlich: kopieren-einfügen als üblich.) UTF-8 ermöglicht es Ihnen, direkt codieren jedes symbol, das Sie wollen. ISO-8859-1 ist viel mehr beschränkt, und ASCII-sogar noch mehr. Zum Beispiel, in meinem HTML -, wenn mein Dokument ist UTF-8-Dokument, das ich tun kann:
```
Hi there. This document is ©2010. Good day!
```
oder:
```
Hi there. This document is &#xA9;2010. Good day!
```
oder:
```
Hi there. This document is &copy;2010. Good day!
```
Die erste ist nur gültig, wenn der Zeichensatz unterstützt "©". Die anderen beiden sind immer gültig, aber weniger lesbar. Was auch immer text-editor Sie verwenden, wenn Sie es Wert ist Ihr Gewicht, sollte in der Lage sein, Ihnen zu sagen, welcher Zeichensatz es wird die Codierung des Dokuments in.

Wenn Sie dies tun, müssen Sie sicherstellen, dass Ihre web-server informiert den client über den korrekten Zeichensatz, oder, dass Ihr Dokument erklärt es mit etwas wie:
```
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
```
Habe ich verwendet UTF-8 gibt es als ein Beispiel. XHTML sollte der Zeichensatz, in die öffnung <?xml ... ?> tag.
- Richtig, also, wenn Sie aus irgendeinem Grund zu verwenden, weder Latein noch 1 Unicode als Ihren Dokument-Zeichensatz, können Sie immer noch den copyright-symbol mit diesen Entitäten.
- Wo ist die maßgebliche Quelle für diese information? Ich mache die Arbeit, der mehr abdeckt, als dieser use-case erhalten und möchte einige weitere details. Danke.
- Was ein Teil derjenigen, die post sind Sie auf der Suche nach einer Quelle auf? Codieren Entitäten zitiert in der post, aber heute würde ich den link zum HTML5-standard (aber ich glaube nicht, dass HTML5 ändert dieser Aspekt). Wenn Sie gerade auf der Suche für die Anzahl (z.B., wie das zu übersetzen © in ©): zunächst würde ich empfehlen die Verwendung von UTF-8 und nur zu schreiben, das Zeichen buchstäblich, also, einfach gesagt © oder ähnliche, in Ihrer Quelle, da es dann direkt lesbar durch einen menschlichen (RibaldEddie Antwort). Ansonsten, die Anzahl wird nur der Unicode-Codepunkt ist. shapecatcher.com lassen Sie beim zeichnen der Zeichen, das Sie benötigen,
- ...unicode.org Diagramme, Googeln "unicode <Beschreibung von Ihrem Charakter>" in der Regel funktioniert, z.B., "unicode copyright".
- Ich bezog mich auf die Anleitung zur Auswahl der Zeichen-entities zu Kodieren, und die Eingabe ist.
InformationsquelleAutor Thanatos
4

Die Schönheit der UTF-8-Kodierung ist, dass Sie tatsächlich nur die binären Zeichen. Sie brauchen nicht verschlüsseln, als eine Einheit überhaupt. Wasserverbrauch: ©

Oh, Sie wollen einfach nur, um zu wissen, den Unterschied zwischen den beiden Entitäten? Es gibt keine. Beschreibt die byte in Hex und die anderen in dezimal.
- Durch die "binären Charakter", meinst du, die könnte ich einfach kopieren Sie das symbol aus deiner Antwort, und fügen Sie es in mein HTML-Dokument (D. H. es wird Aussehen wie das symbol in der "code") und, solange es UTF-8, es ist okay??
- Diese. Was ist der Punkt, UTF-8, wenn du gehst zu codieren alles in Entitäten? Dies ist, was Unicode ist für!
- Richtig. Einige Zeichen müssen noch Entität codiert werden, sondern nur diejenigen, die semantische Bedeutung in HTML, wie weniger als und größer als. Aber das copyright-Zeichen funktioniert (tm).
- Meine Absicht ist nicht, "Kodieren in Entitäten", sondern erstellen Sie ein HTML-Dokument, das der "richtige" ist. Wenn UTF-8 erlaubt für nicht-Codierung, dann werde ich das nicht codieren. Auch, was meinst du mit "Das".
- Danke!
- Sorry, das sollte Einfach Funktioniert™.
- Während Ihre Antwort ist hilfreich, es ist nicht konkret meine Frage beantworten. Ich hätte mehr spezifisch. Könnten Sie kommentieren, ob die wirkliche Einheit verwendet wird, ist wichtig, wenn eine Codierung zu verwenden, etwas anderes als UTF-8? Ich bin interessiert in einer mehr Allgemeinen Art und Weise.
- Das copyright-symbol erscheint in der ISO-8859-1 zu. WENN Sie korrekt deklarieren der verwendeten Codierung Ihres HTML-Dokuments so, dass der Browser richtig anzeigen den text, Sie würde nicht verwenden müssen Personen entweder für ISO-8859-1. Da ISO-8859-1 und UTF-8 haben den gleichen Charakter-Karte für das erste byte, in dem Sie das copyright-symbol angezeigt wird, es ist eine ziemlich sichere symbol für die Anzeige in HTML ohne Verwendung einer Entität. Andere Zeichen, die anzeigen, um mehrere bytes verwenden müssen die Unternehmen, wenn das HTML-Dokument wurden ausgeschrieben, um den browser als ISO-8859-1 document. Wenn keine Entität existiert, die für einen multibyte-char...
- ... dann müssen Sie verwenden eine andere Kodierung, die meisten sinnvoll das wäre UTF-8.
InformationsquelleAutor RibaldEddie

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.