SMS-Nachrichten, die nicht-ASCII-Zeichen-Kodierung

Ich habe ein Nokia N900 Handy, und wenn das senden einer SMS, das widget zeigt die Anzahl der verbleibenden Zeichen in der Nachricht (und die Zahl der tatsächlichen kurz-Nachrichten senden mussten, wird die gesamte Nachricht).

Ich Lebe in Frankreich, wo mir Folgendes aufgefallen sonderbare Sache, wenn das schreiben von Nachrichten mit nicht-ASCII-Zeichen:

  • einige nicht-ASCII-Zeichen sind codiert auf einem char/byte , z.B. "é", "è", "à", "ù"
  • die Anwesenheit von nicht-ASCII-chars wie z.B. "ç", "ê", "ô" verbraucht ein Betrag von 90 char/bytes + 1 byte pro Zeichen
  • die Anwesenheit eines zweiten "ç", "ê", etc. verbraucht nur 1 zusätzliches byte.

So Frage ich mich, wie die Nachrichten kodiert sind, denn ich kann nicht sehen die obigen Schema-matching der traditionellen Codierungen die ich kenne (iso-8859-1, UTF-8, UTF-16,...) mit.

  • Das ist interessant. Ich habe vor kurzem einige Tests auf einem iPhone und einem HTC EVO 4G, die beide US-Handys. Ihre software sofort geschaltet UCS-2 (fixed 16-bit-pro-Zeichen-Kodierung), wenn ich in nicht GSM-03.38 7-bit - Zeichen wie í, obwohl dieses Zeichen kann kodiert werden, als zwei 7-bit GSM-03.38-Zeichen. In meinen tests, das Telefon hat mir keine andere Wahl.
InformationsquelleAutor gurney alex | 2011-08-18
Schreibe einen Kommentar