Tag: utf-8
UTF-8 ist eine Zeichenkodierung beschreibt die einzelnen Unicode-code-point mit einer byte-Sequenz von einem bis vier bytes. Es ist rückwärts-kompatibel mit ASCII, während noch immer die Unterstützung Darstellung aller Unicode-code-points.
11
Antworten
Ich versuche zu bekommen java.net.URI Objekt aus einem String. Der string hat einige Zeichen, die ersetzt werden müssen durch den Anteil escape-Sequenzen. Aber wenn ich URLEncoder Kodieren Sie die Zeichenkette UTF-8-Codierung, auch der /sind durch Ihre escape-Sequenzen.
12
Antworten
Ich habe eine JSP Seite deren Seite Codierung ist ISO-8859-1. Diese JSP-Seite in einem Frage-Antwort-blog. Ich möchte Sonderzeichen während der Q/A posting. Das problem ist JSP nicht unterstützen UTF-8 die Codierung selbst habe ich es geändert von
5
Antworten
Ich versuche zu Lesen ein gunzipped-Datei (.gz) in python und bin mit einigen Schwierigkeiten. Verwendet habe ich das gzip-Modul, um es zu Lesen, aber die Datei wird codiert als utf-8 text-Datei, so dass es schließlich ein Ungültiger
4
Antworten
Gibt es irgendeine Möglichkeit das zu ändern MySQL Workbench charset? Mein schema verwendet UTF-8 und wenn ich die Daten der Tabelle (gespeichert als UTF-8) oder die Daten manuell hinzufügen, es scheint, mit charset-Fehler, wahrscheinlich der MySQL Workbench
15
Antworten
Wie kann ich richtig einstellen, die Standard-Zeichenkodierung verwendet, die von der JVM (1.5.x) programmgesteuert? Habe ich gelesen, dass -Dfile.encoding=whatever verwendet werden, um den Weg zu gehen, für ältere JVMs... ich haben diesen Luxus nicht aus Gründen, die
5
Antworten
PHP str_replace() war das nur für ANSI-strings und so 'zerfleischen' UTF-8 strings. Doch angesichts der Tatsache, dass es Binär-sicher würde es funktionieren, wenn es war nur gültige UTF-8-Zeichenfolgen als Argumente? Edit: ich bin nicht auf der Suche
6
Antworten
Den .charCodeAt Funktion kehrt mit dem unicode-code der caracter. Aber ich möchte das byte-array statt. Ich weiß, wenn das charcode ist über 127, dann die Zeichen werden in zwei oder mehr bytes. var arr=; for(var i=0; i<str.length;
1
Antworten
Folgenden code: var text = (new WebClient()).DownloadString("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&start=0&max_results=20")); Ergebnisse in eine variable text enthält, unter vielen anderen Dinge, die Zeichenfolge "$κ$-Minkowski-Raum, Skalares Feld, und die Frage der Lorentz-Invarianz" Allerdings, wenn ich besuchen Sie diese URL in Firefox, bekomme
8
Antworten
Möchte ich zum test der Unicode-handling von meinem code. Ist es etwas, was ich in random.Wahl() zu wählen aus dem gesamten Unicode-Bereich, vorzugsweise nicht ein externes Modul? Weder Google noch StackOverflow scheint eine Antwort haben. Edit: wie
3
Antworten
Wir erstellen multi-language-Unterseiten auf unserer website. Ich würde gerne mit dem 2-letter language codes. Spanisch und Französisch sind einfach. Erhalten Sie URLs wie: mydomain.com/es mydomain.com/fr aber ich habe ein problem mit Traditionelles und Vereinfachtes Chinesisch. Gibt es
8
Antworten
Ich habe ein script, das kombiniert eine Reihe von Dateien in eine, und es bricht, wenn eine der Dateien in UTF8-Kodierung. Ich vermute, dass ich mit sollte die utf8_decode() Funktion beim Einlesen der Dateien, aber ich weiß
9
Antworten
Ich bin auf der Suche nach einer code-snippet in plain old C, der erkennt, dass der angegebene string wird im UTF-8-Codierung. Ich weiß, die Lösung mit regex, aber aus verschiedenen Gründen wäre es besser, zu vermeiden, mit
4
Antworten
Ich habe eine Datei, die enthält nicht-Englisch-chars und gespeichert wurde in ANSI-Codierung mit einer nicht-englischen Zeichensatz. Wie kann ich diese Datei Lesen in C# und sehen den Inhalt der Datei korrekt? Nicht arbeiten StreamReader sr=new StreamReader(@"C:\APPLICATIONS.xml",Encoding.ASCII); var
2
Antworten
Ist es möglich, speichern Sie eine text-Datei im UTF-8-Codierung mit der Windows-Kommandozeile cmd.exe? InformationsquelleAutor der Frage user2333346 | 2013-05-16
9
Antworten
Habe ich meine Daten in diesem format: U+597D oder so U+6211. Ich will Sie konvertieren, auf UTF-8 (original Zeichen 好 und 我). Wie kann ich es tun? InformationsquelleAutor der Frage Anthony | 2009-11-26
7
Antworten
Zog ich meine website von meinem lokalen test-server zu NameCheap shared-hosting-und jetzt Laufe ich in ein problem - einige Seiten nicht anzeigen utf-8 Sonderzeichen richtig (zeigt Fragezeichen anstelle). Alle Seiten sind utf-8 kodiert, so werden alle Datenbank-Tabellen.
6
Antworten
Suchte ich in der Java-internen Darstellung für Strings, aber ich habe zwei Materialien, die Aussehen, als zuverlässig, aber inkonsistent. Ist: http://www.codeguru.com/cpp/misc/misc/multi-lingualsupport/article.php/c10451 und es sagt: Java verwendet UTF-16 für die interne Textdarstellung und unterstützt eine non-standard-änderung von UTF-8
3
Antworten
Ich gelesen habe, auf alle UTF-8-Fragen und blog-posts, und ich habe Folgendes Beispiel in einem test.rb-Datei: # encoding: UTF-8 File.open("test.txt", "w") do |f| f.write "test © foo" end File.open("test.txt", "r") do |f| puts f.read end dieser funktioniert
3
Antworten
In PHP, können wir mb_check_encoding()um zu bestimmen, ob ein string ein gültiges UTF-8. Aber das ist keine tragbare Lösung, da es erfordert die mbstring-Erweiterung kompiliert und aktiviert. Zusätzlich, es wird uns nicht gesagt die Zeichen ist ungültig.
2
Antworten
Ich versuche zum erstellen einer 'normalisierten' Kopie eines Strings, um zu helfen reduzieren Sie doppelte Namen in einer Datenbank. Die Namen enthalten viele internationale Zeichen (dh. akzentuierte Buchstaben), und ich möchte, um eine Kopie mit den Akzenten
5
Antworten
wie kann ich schreiben UTF-8-kodierte strings, um eine Textdatei von vba, wie Dim fnum As Integer fnum = FreeFile Open "myfile.txt" For Output As fnum Print #fnum, "special characters: äöüß" 'latin-1 or something by default Close fnum
5
Antworten
In JavaScript: "ab abc cab ab ab".replace(/\bab\b/g, "AB"); richtig gibt mir: "AB abc cab AB AB" Wenn ich die utf-8-Zeichen, aber: "αβ αβγ γαβ αβ αβ".replace(/\bαβ\b/g, "AB"); den word-boundary-operator scheint nicht zu funktionieren: "αβ αβγ γαβ αβ
7
Antworten
Mein Django View/Template ist nicht in der Lage zu handhaben Sonderzeichen. Die einfache Ansicht von unten scheitert an den -. Ich bekomme folgende Fehlermeldung: Non-ASCII character '\XF1 verfüllen' in der Datei" def test(request): return HttpResponse('español') Gibt es
8
Antworten
Habe ich gegoogelt über dieses Thema und ich habe mir jede Antwort, aber ich noch nicht bekommen. Im Prinzip brauche ich zum konvertieren von UTF-8-string in ISO-8859-1 und ich mache es mit dem folgenden code: Encoding iso
14
Antworten
Im mit neueste TCPDF-version(5.9). Haben aber ein paar merkwürdige Probleme mit der Codierung. Ich brauche litauischen Sprache, Symbole wie: ąčęėįšųūž. Aber nur wenige davon. Andere bleiben wie ????? Also, was soll ich tun ? Ich verwenden Sie
3
Antworten
Ich habe versucht, verwenden Sie ein velocity-Template mit folgendem Inhalt: Sübjäct $item Alles funktioniert einwandfrei außer die übersetzung der beiden Unicode-Zeichen. Das Ergebnis Zeichenfolge gedruckt auf der Kommando-Zeile sieht so aus: Sübjäct foo Suchte ich die velocity-website
5
Antworten
Frage ich mich, was ist der beste Weg -- oder, wenn es eine einfache Möglichkeit mit der standard-Bibliothek -- konvertieren eine URL mit Unicode-Zeichen im domain-Namen-und den Pfad in das entsprechende ASCII-URL, kodiert Domäne wie IDNA und
20
Antworten
Was ist der Unterschied zwischen UTF-8 und UTF-8 ohne BOM? Was ist besser? InformationsquelleAutor der Frage simple | 2010-02-08
3
Antworten
Schaute ich mir die Codierung von chinesischen Schriftzeichen auf Wikipedia, und ich habe Schwierigkeiten, herauszufinden, was Sie verwenden. Zum Beispiel "的" wird codiert als "%E7%9A%84" (siehe hier). Das sind drei bytes, jedoch keine der Codierungen beschrieben auf
2
Antworten
Bin ich mit nodeJS v0.8.6 und die native library fs. Hier ist mein code : var filesys = require('fs'); filesys.writeFile('test.txt', 'This is an example with accents : é è à ','utf8', function (err) {}); Das problem ist,
5
Antworten
Gibt es eine gute Lösung gibt, das dies tut transliteration in einer guten Art und Weise? Ich habe versucht, mit iconv()aber ist sehr ärgerlich und es verhält sich nicht wie man vielleicht erwarten würde. Mit //TRANSLIT versuchen
10
Antworten
Ich habe einige Dateien, die nicht im UTF-8-Kodierung und ich bin konvertieren einer Website nach UTF-8-Codierung. Verwende ich einfaches Skript für die Dateien, die ich speichern möchten, der in utf-8, aber die Dateien sind gespeichert in der
14
Antworten
Als eine der Reaktionen auf eine Frage, die ich gestern vorgeschlagen, dass, sollte ich sicherstellen, dass meine Datenbank verarbeiten kann, UTF-8-Zeichen korrekt. Wie kann ich das mit MySQL? InformationsquelleAutor der Frage Ben | 2008-10-14
6
Antworten
Ich versuche zu analysieren, eine XML-Datei mit Hilfe von PHP, aber ich bekomme eine Fehlermeldung: parser error : Char 0 x 0 aus dem zulässigen Bereich in Ich denke, es ist, weil der Inhalt der XML, ich
7
Antworten
Ich habe seltsame Fehlermeldung, wenn versucht zu retten, first_name, last_name, um Django ' s auth_user Modell. Fehlgeschlagen Beispiele user = User.object.create_user(username, email, password) user.first_name = u'Rytis' user.last_name = u'Slatkevičius' user.save() >>> Incorrect string value: '\xC4\x8Dius' for column
5
Antworten
Ich Schreibe ein crawler mit Python mit BeautifulSoup und alles ging swimmingly, bis ich lief in dieser Website: http://www.elnorte.ec/ Ich bin immer der Inhalt mit den Anforderungen der Bibliothek: r = requests.get('http://www.elnorte.ec/') content = r.content Wenn ich
2
Antworten
Ich habe diese Werte aus einer unicode-Datenbank, aber ich bin mir nicht sicher, wie Sie Sie zu übersetzen in der human-readable form. Was sind diese noch genannt? Hier sind Sie: U+2B71F U+2A52D U+2A68F U+2A690 U+2B72F U+2B4F7 U+2B72B
6
Antworten
Ich habe einen string, den ich von einer Drittanbieter-app, und ich möchte, um es anzuzeigen korrekt in jeder Sprache mit C# auf meinem Windows-Oberfläche. Durch falsche Codierung, ein Stück von mein string sieht in Spanisch: AcciÃ3n in
1
Antworten
Die ich gelesen habe über Unicode und UTF-8 in den letzten paar Tagen, und ich oft über einen bitweisen Vergleich ähnlich wie diese : int strlen_utf8(char *s) { int i = 0, j = 0; while (s[i])
5
Antworten
Ich brauchen, um zu konvertieren eine Reihe von Dateien auf utf-8 in Python, und ich habe Probleme mit der "konvertieren Sie die Datei" Teil. Möchte ich das gleiche: iconv -t utf-8 $file > converted/$file # this is
5
Antworten
Ich habe einige Schwierigkeiten mit den paar Schienen 3.0.1, Ruby 1.9.2 und meine website-Lokalisierung. Das problem ist ganz einfach, ich habe sowas im Blick : f.input :zip_code, :label => I18n.t('labels.zip_code') und ein es.yml-Datei : es: labels: zip_code:
3
Antworten
Hannibal-Episoden in tvdb haben seltsame Zeichen in Ihnen. Beispiel: Œuf Also ruby spuckt: ./manifesto.rb:19:in `encode': "\xC3" from ASCII-8BIT to UTF-8 (Encoding::UndefinedConversionError) from ./manifesto.rb:19:in `to_json' from ./manifesto.rb:19:in `<main>' Zeile 19: puts @tree.to_json Ist es ein Weg, um sich
7
Antworten
Mein problem ergibt sich aus Emacs einfügen der Codierung der überschriften in den Quellcode-Dateien mit nicht-ascii-Zeichen: # -*- coding: utf-8 -*- Meiner Kollegen weiß nicht, wie diese Header überprüft wird, ob sich in unseren Archiven. Ich will
5
Antworten
Brauche ich zum konvertieren zwischen wstring und string. Ich fand heraus, dass mit Hilfe der codecvt-Facette sollte den trick tun, aber es scheint nicht zu funktionieren für utf-8-Gebietsschema. Meine Idee ist, dass ich beim Lesen von utf-8-codierte
2
Antworten
Habe ich ein schema in "utf8 -- UTF-8 Unicode" - Zeichensatz und eine Sortierung von "utf8_spanish_ci". Alle innerhalb von Tabellen sind InnoDB-mit dem gleichen Zeichensatz und Sortierung wie bereits erwähnt. Hier kommt das problem: mit einer Abfrage
8
Antworten
So haben wir diese web-app, wo wir Unterstützung von UTF8-kodierten Daten. Hurra UTF8. Und wir können exportieren Sie die vom Benutzer gelieferten Daten in das CSV-kein problem - es ist noch immer in UTF8 an diesem Punkt.
3
Antworten
Im nach dem umschreiben des Datenbank-Klasse (PDO), und stecken Sie sich das an. Ich habe gelernt, verwenden beide SET NAMES utf8 und SET CHARACTER SET utf8 beim arbeiten mit UTF-8 in PHP und MySQL. PDO ich jetzt
9
Antworten
Habe ich einige aktuellen code ein, und das problem wird sein die Schaffung eines 1252 codepage-Datei, ich will zwingen Sie zum erstellen einer UTF-8 Datei Kann mir jemand helfen mit diesem code, wie ich sagen, es funktioniert
4
Antworten
Ich würde gerne wissen, was ist der Wert, der von der Java Virtual Machine (JVM) - Eigenschaft zum festlegen der Datei-Kodierung UTF-8. Mache ich -Dfile.encoding=UTF8 oder -Dfile.encoding=UTF-8? InformationsquelleAutor der Frage astrotouf | 2011-05-17
7
Antworten
Habe ich eine staging-Rails-Website, die läuft über MySQL 5.0.32-Debian. Auf diese bestimmte Website, die alle meine Tabellen sind mit utf8 /utf8_general_ci Codierung. Innen, die Datenbank habe ich einige Daten, die sieht so aus: mysql> select * from