C# : japanische Zeichen werden mit unicode-Codierung

Die intention des Kodex ist die Ausgabe von unicode als japanische Zeichen in eine Datei

   String s = "\u30a2\u30c3\u30d7\u30ed\u30fc\u30c9\u3059\u308b\u30d5\u30a1\u30a4\u30eb\u304c\u6307\u5b9a\u3055\u308c\u3066\u3044\u307e\u305b\u3093";
   var Bytes = Encoding.Unicode.GetBytes(s);      
   string  key = Encoding.UTF8.GetString(Encoding.Convert(Encoding.Unicode, Encoding.UTF8, Bytes));

Schlüssel ist, ich will auf die Datei zu drucken, hat aber den Wert \u30a2\u30c3\u30d7\u30ed\u30fc\u30c9\u3059\u308b\u30d5\u30a1\u30a4\u30eb\u304c\u6307\u5b9a\u3055\u308c\u3066\u3044\u307e\u305b\u3093 Irgendwelche Ideen, was falsch?

Deine Frage und dein Beispiel-code ist völlig unerklärlich. Der ursprüngliche string ist ein C# - string (die wird intern gespeichert als UTF-16.) Dann ändern Sie es, um eine Sequenz von bytes, die eine UTF-16-string. Dann Convert es zu einer Sequenz von bytes, die eine UTF-8-string. Dann Lesen Sie diese bytes wieder in ein C# - string ist identisch mit der Zeichenfolge, die Sie in den ersten Platz. Was, genau, sind Sie hier versuchen zu erreichen?
Ein string in .NETZ ist immer UTF-16. So die Vorstellung von UTF-8-string nicht sinnvoll ist. Können Sie konvertieren eine Zeichenfolge in eine UTF-8 codierte Sequenz von bytes : var bytes = Encoding.UTF8.GetBytes(s);. Ist es das, was Sie brauchen?
UTF-8 ist eine Zeichenkodierung für Unicode.
Vielleicht hat er versucht, um die tatsächlichen Zeichen aus?
Man könnte finden diesem älteren Beitrag hilfreich. stackoverflow.com/questions/1615559/...

InformationsquelleAutor remo | 2011-08-30

c#character-encoding encoding

Was falsch ist, dass ein string (key) hat keine Ahnung von der bytes verwendet, um es zu speichern. In diesem Fall wird dieser string ist:

String:

アップロードするファイルが指定されていません

dies ist genau das, was

"\u30a2\u30c3\u30d7\u30ed\u30fc\u30c9\u3059\u308b\u30d5\u30a1\u30a4\u30eb\u304c\u6307\u5b9a\u3055\u308c\u3066\u3044\u307e\u305b\u3093"

bedeutet. Der Ausdruck '\u30a3' sieht aus wie 2-Unicode-bytes, aber es ist eigentlich nur bedeutet, dass den Charakter 'ア'.

wenn Sie speichern, um eine UTF-8-Datei, die bytes geschrieben werden:

UTF-8-bytes

File.WriteAllText("temp.txt", "アップロードするファイルが指定されていません", Encoding.UTF8);

Wird der Inhalt (in bytes)

 E3 82 A2 E3 83 83 E3 83 97 E3 83 AD E3 83 BC E3 83 89 E3 81 99 E3 82 8B E3 83 
 95 E3 82 A1 E3 82 A4 E3 83 AB E3 81 8C E6 8C 87 E5 AE 9A E3 81 95 E3 82 8C E3 
 81 A6 E3 81 84 E3 81 BE E3 81 9B E3 82 93

UTF-16 bytes

File.WriteAllText("temp.txt", "アップロードするファイルが指定されていません", Encoding.Unicode);

Wird der Inhalt (in bytes)

 A2 30 C3 30 D7 30 ED 30 FC 30 C9 30 59 30 8B 30 D5 30 A1 30 A4 30 EB 30 4C 30 
 07 63 9A 5B 55 30 8C 30 66 30 44 30 7E 30 5B 30 93 30

Dies ist, was ich gesucht hatte, wollte ich wissen, wie Sie Dekodieren konnte diese japanischen Zeichen hier..

InformationsquelleAutor Jimmy

0

Man nicht "konvertieren" Unicode UTF-8 :-/

Unicode, abgesehen davon, dass die Eltern für den ganzen Satz von Spezifikationen, gedacht werden kann, wie "einfach" definieren von code-Punkte/Zeichen und die Regeln der Interaktion. Die UTF-8 Codierung ist der spezifische Satz von Regeln zur Zuordnung einer Sequenz von Unicode-code-points in eine Sequenz von Bytes (8-bit-bytes).

Versuchen, diese in LINQPad:
```
String s = "\u30a2\u30c3\u30d7\u30ed";
s.Dump();     //original string
var bytes = Encoding.UTF8.GetBytes(s);      
bytes.Dump(); //see UTF-8 encoded byte sequence
string key = Encoding.UTF8.GetString(bytes);
key.Dump();   //contents restored
```
UTF-8 existiert nur in bytes.

Happy coding.

In C# Encoding.Unicode bedeutet, UTF-16, so ist es möglich, dass, wenn der OP sagt "Unicode" er meint, UTF-16 im besonderen.
Sehr wahr. Ich Stimme mit Ihren Kommentar posten 😉

InformationsquelleAutor

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.