Konvertieren von UTF-8, unicode, c++
Wie kann ich umwandeln ú innerhalb einer c++ - Anwendung, in denen die Anwendung erhält das Zeichen als UTF-8-Kodierung %C3%BA und speichern Sie Sie als unicode-Entsprechung %FA. Ich möchte nur wissen, wie ich gehen würde, über das schreiben von code zum ausführen dieser Kodierung
utfcpp.sourceforge.net?
msdn.microsoft.com/en-us/library/dd374130(v=vs. 85).aspx ?
Nur für das Protokoll, mit Bezug auf deinen Titel: UTF-8 ist Unicode. Und die standardisierte Art und Weise der Angabe der code-point wäre
Sie sehen, die Regeln für UTF-8, unicode-und url-Kodierung etc. und Ihnen bei der Implementierung im code. Ich kenne keinen anderen Weg, die Frage zu beantworten. Es könnte Ihnen helfen, Fortschritte, wenn Sie sagte, speziell, wo Sie stecken. Ich würde brechen das problem in drei Schritten, URL-decode ("konvertieren" %xy usw. Charakter-Wert), UTF-8, unicode code point (dies ist konvertiert zum Beispiel C3 BA FA, das ist das schwierige Schritt), URL-Codierung (wieder die %'s). Jeder dieser Schritte ist einfacher als das Allgemeine problem, wählen Sie einfach die einfachste und code, der einer der ersten.
msdn.microsoft.com/en-us/library/dd374130(v=vs. 85).aspx ?
Nur für das Protokoll, mit Bezug auf deinen Titel: UTF-8 ist Unicode. Und die standardisierte Art und Weise der Angabe der code-point wäre
U+00FA
(mit mindestens 4 hex-Ziffern, aber bis zu 6).Sie sehen, die Regeln für UTF-8, unicode-und url-Kodierung etc. und Ihnen bei der Implementierung im code. Ich kenne keinen anderen Weg, die Frage zu beantworten. Es könnte Ihnen helfen, Fortschritte, wenn Sie sagte, speziell, wo Sie stecken. Ich würde brechen das problem in drei Schritten, URL-decode ("konvertieren" %xy usw. Charakter-Wert), UTF-8, unicode code point (dies ist konvertiert zum Beispiel C3 BA FA, das ist das schwierige Schritt), URL-Codierung (wieder die %'s). Jeder dieser Schritte ist einfacher als das Allgemeine problem, wählen Sie einfach die einfachste und code, der einer der ersten.
InformationsquelleAutor user2724841 | 2013-08-30
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich schrieb einige code zu tun gestern...
Ich sage nicht, dass dies der "perfekte" Weg, dies zu tun, aber es scheint zu funktionieren für alle testcases ich habe durch Sie laufen (ich schrieb beide Richtungen für diesen Zweck).
Werde ich überlasse es Ihnen, zu übersetzen, "%NN" in einen integer-Wert.
Der code enthält BEIDE Richtungen - von einer deque unicode und von unicode zu deque. Es geht einfach nicht um die "erforderlichen" code FIRST, ich wollte nicht neu formatieren mein code...
Nur eine kleine Anmerkung bezüglich der Benennung; ich schlage vor, den Namen
utf32_to_utf8
undutf8_to_utf32
; das Wort "unicode" ist ein bisschen überlastet und wird manchmal verstanden als utf-16.Ja, der name ist nicht so toll, die ECHTEN code, den ich benutze dies in (in PHP, das oben war nur ein hack zu testen, das Prinzip heißt)
utf8_to_html
, und produziert eine"ሴ"
string.Vielen Dank für den code oben, ich bin kämpfen, um Sie zu implementieren, das in mein code, wie ich bin neu in c++. Wie wird die Zeichenfolge %C3B%A umgewandelt werden, mit diesem code?
InformationsquelleAutor Mats Petersson