Tag: utf-8
UTF-8 ist eine Zeichenkodierung beschreibt die einzelnen Unicode-code-point mit einer byte-Sequenz von einem bis vier bytes. Es ist rückwärts-kompatibel mit ASCII, während noch immer die Unterstützung Darstellung aller Unicode-code-points.
4
Antworten
War ich (wieder)Lesen Joel ist toll, Artikel auf Unicode und kam in diesem Absatz, was ich nicht ganz verstehe: Beispielsweise könnten Sie die Kodierung der Unicode-string Hello (U+0048 U+0065 U+006C U+006C U+006F) im ASCII-oder das alte OEM-Griechisch-Codierung,
1
Antworten
Ich habe eine harte Zeit, die zum Parsen einer xml-Datei. Speichern der Datei mit der Codierung UTF-8. Normalen ASCII richtig gelesen, aber die koreanischen Zeichen nicht. Also habe ich ein einfaches Programm zum Lesen einer UTF-8-Textdatei und
1
Antworten
Versucht, um meine erste ASP.NET Seite. Habe IIS 5.1 unter XP konfiguriert .NET 4. Erstellt eine neue virtuelle Verzeichnis, und Hinzugefügt .aspx-Datei. Wenn ich durchsuchen die Datei nicht-ASCII-Zeichen sind beschädigt. Zum Beispiel, ein ü (U+00 FC) transformiert
4
Antworten
Habe ich folgenden php-code in einer utf-8-php-Datei: var_dump(setlocale(LC_CTYPE, 'de_DE.utf8', 'German_Germany.utf-8', 'de_DE', 'german')); var_dump(mb_internal_encoding()); var_dump(mb_internal_encoding('utf-8')); var_dump(mb_internal_encoding()); var_dump(mb_regex_encoding()); var_dump(mb_regex_encoding('utf-8')); var_dump(mb_regex_encoding()); var_dump(preg_replace('/\bweiß\b/iu', 'weiss', 'weißbier')); Möchte ich die Letzte regex ersetzen, nur ganze Wörter und nicht Teile von Wörtern. Auf meinem
2
Antworten
Ich versuche python zu geben, mich Prozent-kodierte strings. Die API-ich bin die Interaktion mit (was ich denke, ist mit Prozent-codierte UTF-8), gibt %c3%ae für î. Allerdings, python ist das urllib.Zitat gibt %3F. import urllib mystring = "î"
3
Antworten
Muss ich parse eine utf8 codierte csv. Nach der Konvertierung habe ich gerade gesehen, dass das problem mit dem BOM () Zeichen am beginging. Ich kann nicht erstellen Sie eine csv-Vermeidung der Stückliste mit der utf8-Codierung, wie
1
Antworten
Ich bin Einstellung, die eine REST-Web-Service auf einer 2,5-Web-Anwendung auf Tomcat 6 verwenden von CXF 3.0.2. Der webservice erhält eine POST-Anforderung mit keine Parameter und gibt ein JSON-String mit internationalen Zeichen (z.B. é, è, à, ...). Das
2
Antworten
Ich bin mit dem base64-Umsetzung an der Unterseite der dieser Beitrag. Wenn ich folgenden code: NSLog(@"decoded:%@",[[[NSString alloc] initWithData:[Base64 decode:@"8fEmIzEyNDA3OyYjMTI0MTE7"] encoding:NSUTF8StringEncoding] autorelease]); Bekomme ich decoded:(null) Allerdings, wenn ich: NSLog(@"decoded 1:%@",[[[NSString alloc] initWithData:[Base64 decode:@"8fEmIzEyNDA3OyYjMTI0MTE7"] encoding:NSASCIIStringEncoding] autorelease]); Bekomme ich decoded:ññぷほ
3
Antworten
Habe ich eine Funktion zurückgibt, die eine HTML-Seite aus dem Internet, aber die kyrillischen Symbole werden angezeigt, mit einige andere unbekannte Zeichen. Wie kann ich konvertieren Sie den text und werden in der Lage, um zu sehen,
4
Antworten
Gute Zeit! Mein Adroid-app führt HTTP-request zu einem, der in der API-Dienste von Google. Sicher, es funktioniert, wenn die parameter der Anfrage in Englisch, aber wenn ich mein test-Funktion, mit der Kyrillisch - ich bekomme die 400-Fehler.
1
Antworten
Gibt es eine einfache Möglichkeit zur Konvertierung einer Java-string zu einem echten UTF-8-byte-array im JNI code? Leider GetStringUTFChars() fast tut, was erforderlich ist, aber nicht ganz, es gibt eine "modifizierte" UTF-8-byte-Sequenz. Der Hauptunterschied ist, dass eine modifizierte
2
Antworten
Ich versuche zu laufen, einen RegEx zu suchen, Grad-Zeichen (\u00B0|\u00BA Grad in-Zusatz zu suchen, die eine andere form von ' --> \u00B4). Ich lese Längen-und Breitengrad-Koordinaten wie diese: 12º30'23.256547"S Das problem ist mit der Art, wie lese
5
Antworten
Muss ich überprüfen einige Benutzereingaben, die in UTF-8 codiert. Viele haben empfohlen, mit dem folgenden code: preg_match('/\A( [\x09\x0A\x0D\x20-\x7E] | [\xC2-\xDF][\x80-\xBF] | \xE0[\xA0-\xBF][\x80-\xBF] | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} | \xED[\x80-\x9F][\x80-\xBF] | \xF0[\x90-\xBF][\x80-\xBF]{2} | [\xF1-\xF3][\x80-\xBF]{3} | \xF4[\x80-\x8F][\x80-\xBF]{2} )*\z/x', $string); Es ist ein
2
Antworten
Ich versuche Sonderzeichen (für ausländische Familiennamen), die in pandoc. Ich folgte den Anweisungen hier und stellte sicher, dass alle Sonderzeichen dargestellt werden, die UTF-Codierung (gemäß auf dieser Seite. Ich wählte HTML Entity (decimal) option. Die resultierenden Dateien
3
Antworten
Beim erstellen der Tabelle habe ich gesetzt charset = utf8. Ich erstellen 1 gespeicherte Prozedur zum einfügen von Daten in die Datenbank. Beim einfügen von Daten UTF8-Datenbank-Fenster, funktioniert es.(Display-Daten richtig) Aber es doesnot Arbeit in Linux.(Display-Daten nicht
4
Antworten
Ich bin das Lesen der HTTP-Antwort aus einem Perl-Seite in ein Servlet wie diese: public String getHTML(String urlToRead) { URL url; HttpURLConnection conn; BufferedReader rd; String line; String result = ""; try { url = new URL(urlToRead);
7
Antworten
Habe ich ein paar Leerzeichen am Anfang eines Absatzes in einem text-Feld in MySQL. Mit trim($var_text_field) in PHP oder TRIM(text_field) im MySQL-Anweisungen ist absolut nichts. Was könnte diese Leerzeichen werden und wie Entferne ich es per code?
1
Antworten
Habe ich ein kleines Java-Projekt, wo ich die Eigenschaften der class-Dateien auf UTF-8 (ich benutze eine Menge von ausländischen Zeichen, die nicht auf der Standard-CP1252). Das Ziel ist, erstellen Sie eine text-Datei (in Windows) mit einer Liste
2
Antworten
Die Facebook graph API ' s für mich zurück des Benutzers E-Mail-Adresse als foo\u0040bar.com. in ein JSON-Objekt. Muss ich es konvertieren zu
[email protected]. Muss es eine eingebaute Methode .NET, dass änderungen der Unicode-Zeichen-Ausdruck (\u1234) zu den eigentlichen
1
Antworten
Habe ich eine socket Verbindung zu einem IRC-server. Ich würde gerne konvertieren empfangenen Daten (QByteArray) zu QString. Weil im IRC, nicht jeder ist mit UTF-8, ich will versuchen, das zu entschlüsseln das QByteArray mit UTF-8: QString s
3
Antworten
Ich versuche zulassen, dass meine Kunden sehen Sie einige der MySQL Daten in Excel. Ich habe verwendet, PHP fputcsv () - Funktion, wie: public function generate() { setlocale(LC_ALL, 'ko_KR.UTF8'); $this->filename = date("YmdHis"); $create = $this->directory."Report".$this->filename.".csv"; $f =
4
Antworten
Ich habe diesen code für das drucken mit Zebra-Drucker (RW 420 um genau zu sein) StringBuilder sb = new StringBuilder(); sb.AppendLine("N"); sb.AppendLine("q609"); sb.AppendLine("Q203,26"); //set printer character set to win-1250 sb.AppendLine("I8,B,001"); sb.AppendLine("A50,50,0,2,1,1,N,\"zażółć gęślą jaźń\""); sb.AppendLine("P1"); printDialog1.PrinterSettings = new
4
Antworten
Wie kann ich einstellen, lokalisierte Dateinamen in java.Derzeit jedesmal, wenn ich auf eine lokalisierte Datei mit einem nicht-ascii-Dateinamen in meiner Anwendung, die windows-Dialogfeld "speichern" erscheint, aber es ist nicht die Anzeige der Dateinamen richtig, wenn der charset
3
Antworten
Bekomme ich eine FileStream(filename,FileMode.Open,FileAccess.Read,FileShare.ReadWrite) und dann ein StreamReader(stream,true). Gibt es einen Weg wie ich überprüfen kann, ob der stream begann mit einem UTF8-BOM? Ich bin zu bemerken, dass die Dateien ohne BOM gelesen werden als UTF8 durch
1
Antworten
Ich versuche zu analysieren, die durch eine log-Datei, aber das format der Datei ist immer in unicode. Meine übliche Prozess möchte ich gerne automatisieren: Ziehe ich die Datei in notepad Speichern unter... ändern der Codierung von unicode
3
Antworten
In meinem script, das ich Daten senden mit cURL und aktiviert CURLOPT_RETURNTRANSFER. Die Antwort ist json-codierte Daten. Wenn ich versuche, json_decode, gibt Sie null zurück. Dann fand ich, dass die Antwort enthält die utf-8 BOM-Zeichen am Anfang
2
Antworten
Ich bin mit JTextPane als einfache html-editor. jtp=new JTextPane(); jtp.setContentType("text/html;charset=UTF-8"); jtp.setEditorKit(new HTMLEditorKit()); Wenn ich Anrufe, jtp.getText() bekomme ich schöne html-code mit allen Sonderzeichen escaped. Aber ich will nicht entgehen nationale Zeichen (für Polnisch), sondern nur spezielle html-Zeichen
3
Antworten
Mit Python 3.4 ich bekomme die folgende Fehlermeldung, wenn Sie versuchen zu entschlüsseln byte-Typ unter Verwendung von utf-32 Traceback (most recent call last): File "c:.\SharqBot.py", line 1130, in <module> fullR=s.recv(1024).decode('utf-32').split('\r\n') UnicodeDecodeError: 'utf-32-le' codec can't decode bytes in
2
Antworten
ActionView::Template::Error (inkompatible Zeichensätze: UTF-8 und ASCII-8BIT): app/controllers/posts_controller.rb:27:in `new' # GET /posts/new def new if params[:post] @post = Post.new(post_params).dup if @post.valid? render :action => "confirm" else format.html { render action: 'new' } format.json { render json: @post.errors, status:
2
Antworten
Ich habe einige Schwierigkeiten abholen von E-Mails mit php und imap. Jeder Absender sendet E-Mails codiert in verschiedenen Zeichensatz-Kodierungen, so dass es schwer zu machen, eine Universelle Lösung für mich. Wenn ich will Holen die von, an,
1
Antworten
Arbeite ich noch auf einen Konverter .m3u-playlist-Dateien, die ports, die Sie aus Windows Media Player generierte format in ein format, das wird akzeptiert von den Teamspeak 3 plugin "Resonanzboden". Den main-Konverter ist jetzt fertig und ich stieß
4
Antworten
Ich habe Folgendes problem: ich lese aus einer Textdatei in UTF-8 (und das sage ich Perl, dass ich bin damit durch ":encoding(utf-8)"). Die Datei sieht wie diese in einem hex-viewer: EF BB BF 43 6F 6E 66
2
Antworten
Fragte ich eine Frage vorher um ein UCS-2/HexEncoded string von UTF-8, und ich bekam etwas Hilfe von einigen Jungs, unter dem folgenden link. UCS2/HexEncoded Zeichen Aber jetzt brauche ich, um die korrekten UTF-8 UCS-2/HexEncoded string in PHP.
6
Antworten
Ich gefunden habe, eine nützliche Funktion auf eine andere Antwort und ich Frage mich, wenn jemand könnte mir erklären, was es macht und ob es zuverlässig ist. Ich war mit mb_detect_encoding(), aber es war falsch, beim Lesen
1
Antworten
So, das war meine anfängliche Frage. Die Antwort auf meine Frage weiter unten, scheint zu sein, dass die einzige Lösung, um UTF-8 (oder UTF-8 ohne BOM) - Codierung, ist die Verwendung des ADODB.Stream-Objekt ein. Die Antwort auf
7
Antworten
Ich versuche herauszufinden, eine 'richtige' Art und Weise der Sortierung für UTF-8 strings in Ruby on Rails. In meiner Anwendung, ich habe eine select-box, die gefüllt ist mit den Ländern. Als meine Anwendung ist lokalisiert, die jeweils
2
Antworten
schrieb ich eine html mit utf-8-Zeichensatz. in den html-Kopf gibt es auch eine <meta http-equiv="Content-Type" content="text/html; charset=utf-8"/> alles funktioniert gut in lokalen, aber wenn ich Dateien auf den server hochzuladen, ich sehe alle meine Briefe àèìòù etc
5
Antworten
Nehme an, dass ich UTF-8-Inhalte im Speicher gespeichert, wie kann ich Lesen Sie die Zeichen mit einem Zeiger? Ich nehme an, ich brauche die Uhr für das 8. bit, das angibt, dass eine multi-byte-Zeichen, aber wie genau
2
Antworten
In Delphi 2009 haben wir: RichEdit1.Lines.LoadFromFile(OpenDialog1.FileName,TEncoding.UTF8); RichEdit1.Lines.SaveToFile(OpenDialog2.FileName,TEncoding.Unicode); Wie mache ich das auf Delphi 2006 wenn ich nicht TEconding noch? Ist es irgendwie zu transportieren, dass die neue Bibliothek zurück? oder gibt es da eine Lösung versteckt im
2
Antworten
+--------------------------+--------------------------------------------------------+ | Variable_name | Wert | +--------------------------+--------------------------------------------------------+ | character_set_client | utf8 | | character_set_connection | utf8 | | character_set_database | utf8 | | character_set_filesystem | binary | | character_set_results | utf8 | | character_set_server | utf8 |
3
Antworten
Ist dieser reguläre Ausdruck genug, um zu fangen alle cross-site-scripting-versuche, wenn das einbetten von HTML-Code in den DOM. zB: wie mit dem Dokument.write() (javascript:|<\s*script.*?\s*>) Darauf verwiesen wird in diesem Dokument aus modsecurity.com http://www.modsecurity.org/documentation/Ajax_Fingerprinting_and_Filtering_with_ModSecurity_2.0.pdf Wäre es fangen alle
3
Antworten
Habe ich zum verteilen meine app International. Sagen wir, ich habe ein Steuerelement (wie ein Notizzettel), wo der Benutzer text ein. Der Benutzer kann Japanisch, Russisch, Kanadischen, etc. Ich möchte speichern Sie die Zeichenfolge auf der Festplatte
1
Antworten
Ich soll zum speichern von beliebigen binären Daten als BLOB in einer SQlite-Datenbank. Den Daten Hinzugefügt werden, wie value mit dieser Funktion: procedure TSQLiteDatabase.AddParamText(name: string; value: string); Ich jetzt konvertieren wollen WideString in seine UTF-8-Darstellung, so kann
4
Antworten
Ich Schreibe übrigen Dokumente, die gerendert wird in HTML-und PDF-Datei mit der Sphinx. Meine source-Dateien sind UTF-8, und erwarte, dass meine HTML angezeigt werden als UTF-8. Was ist die best practice für die schriftliche Multiplikation? Ist: x,
3
Antworten
Habe ich einige .xml - Dateien, die codiert werden in UTF-8. Aber immer wenn ich versuche zu analysieren, Sie auf meinem tablet (idea pad, lenovo, android 3.1), bekomme ich den gleichen Fehler: org.xml.SAXParseException: Unexpected token (position: TEXT
4
Antworten
Der Ort, von wo ich rufe die window.open() Funktion ist in UTF-8, mit der <meta> tag, funktioniert auch alles, aber sobald ich die Funktion aufrufen und öffnen Sie ein weiteres Fenster mit dem gleichen tag wird das
3
Antworten
Bin ich abrufen mithilfe von jQuery zum abrufen einer text-Datei vom server, und laden Sie in das code-Spiegel-editor. (Dies ist in Chrom) Wenn ich eine test-Datei mit dem folgenden test-string: üöIiçgIös Es wird angezeigt als: s��Ii�gI�s Lade
1
Antworten
Ich habe Probleme mit dem Lesen von utf-8-Daten aus einer MySQL-DB mit Python. Meine DB enthält eine Tabelle mit dem Namen Videos enthält und die Tabelle mindestens eine Zeile, die Unicode-Zeichen, d.h. [KR] Samsung Galaxy Beam 2
2
Antworten
In C++, es ist möglich erstellen Sie einen UTF-8 string, der mit dieser Art von notation: "\uD840\uDC50". Aber das funktioniert nicht in PHP. Gibt es eine ähnliche Schreibweise? Wenn nicht, gibt es eine integrierte Möglichkeit zum erstellen
1
Antworten
Ich versuche zu laden eine Reihe von utf-8-kodierte strings und steckt Sie wieder mit PyYaml. Dies ist der code für das laden/Abladen: lang_yml = yaml.load(codecs.open(lang + ".yml.old", "r", "utf-8")) test_file_path = lang + '.yml' stream = file(test_file_path,