Tag: utf-8

UTF-8 ist eine Zeichenkodierung beschreibt die einzelnen Unicode-code-point mit einer byte-Sequenz von einem bis vier bytes. Es ist rückwärts-kompatibel mit ASCII, während noch immer die Unterstützung Darstellung aller Unicode-code-points.

Java - Konvertiere String in ein gültiges URI-Objekt

Anzahl der Antworten 11 Antworten
Ich versuche zu bekommen java.net.URI Objekt aus einem String. Der string hat einige Zeichen, die ersetzt werden müssen durch den Anteil escape-Sequenzen. Aber wenn ich URLEncoder Kodieren Sie die Zeichenkette UTF-8-Codierung, auch der /sind durch Ihre escape-Sequenzen.

UTF-8-Codierung in JSP-Seite

Anzahl der Antworten 12 Antworten
Ich habe eine JSP Seite deren Seite Codierung ist ISO-8859-1. Diese JSP-Seite in einem Frage-Antwort-blog. Ich möchte Sonderzeichen während der Q/A posting. Das problem ist JSP nicht unterstützen UTF-8 die Codierung selbst habe ich es geändert von

Utf-8 Zeichen aus einer gzip Datei in Python lesen

Anzahl der Antworten 5 Antworten
Ich versuche zu Lesen ein gunzipped-Datei (.gz) in python und bin mit einigen Schwierigkeiten. Verwendet habe ich das gzip-Modul, um es zu Lesen, aber die Datei wird codiert als utf-8 text-Datei, so dass es schließlich ein Ungültiger

MySQL Workbench-Zeichensatz

Anzahl der Antworten 4 Antworten
Gibt es irgendeine Möglichkeit das zu ändern MySQL Workbench charset? Mein schema verwendet UTF-8 und wenn ich die Daten der Tabelle (gespeichert als UTF-8) oder die Daten manuell hinzufügen, es scheint, mit charset-Fehler, wahrscheinlich der MySQL Workbench

Standard-Java-Zeichencodierung festlegen?

Anzahl der Antworten 15 Antworten
Wie kann ich richtig einstellen, die Standard-Zeichenkodierung verwendet, die von der JVM (1.5.x) programmgesteuert? Habe ich gelesen, dass -Dfile.encoding=whatever verwendet werden, um den Weg zu gehen, für ältere JVMs... ich haben diesen Luxus nicht aus Gründen, die

Kann str_replace sicher in einer UTF-8-codierten Zeichenfolge verwendet werden, wenn nur gültige UTF-8-codierte Zeichenfolgen als Argumente übergeben werden?

Anzahl der Antworten 5 Antworten
PHP str_replace() war das nur für ANSI-strings und so 'zerfleischen' UTF-8 strings. Doch angesichts der Tatsache, dass es Binär-sicher würde es funktionieren, wenn es war nur gültige UTF-8-Zeichenfolgen als Argumente? Edit: ich bin nicht auf der Suche

Wie konvertiert man eine UTF8-Zeichenfolge in ein Byte-Array?

Anzahl der Antworten 6 Antworten
Den .charCodeAt Funktion kehrt mit dem unicode-code der caracter. Aber ich möchte das byte-array statt. Ich weiß, wenn das charcode ist über 127, dann die Zeichen werden in zwei oder mehr bytes. var arr=; for(var i=0; i<str.length;

WebClient.DownloadString führt aufgrund von Codierungsproblemen zu mangelnder Zeichen, aber der Browser ist OK

Anzahl der Antworten 1 Antworten
Folgenden code: var text = (new WebClient()).DownloadString("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&start=0&max_results=20")); Ergebnisse in eine variable text enthält, unter vielen anderen Dinge, die Zeichenfolge "$κ$-Minkowski-Raum, Skalares Feld, und die Frage der Lorentz-Invarianz" Allerdings, wenn ich besuchen Sie diese URL in Firefox, bekomme

Generieren Sie zufällige UTF-8-Zeichenfolge in Python

Anzahl der Antworten 8 Antworten
Möchte ich zum test der Unicode-handling von meinem code. Ist es etwas, was ich in random.Wahl() zu wählen aus dem gesamten Unicode-Bereich, vorzugsweise nicht ein externes Modul? Weder Google noch StackOverflow scheint eine Antwort haben. Edit: wie

Sprachcodes für vereinfachtes Chinesisch und traditionelles Chinesisch?

Anzahl der Antworten 3 Antworten
Wir erstellen multi-language-Unterseiten auf unserer website. Ich würde gerne mit dem 2-letter language codes. Spanisch und Französisch sind einfach. Erhalten Sie URLs wie: mydomain.com/es mydomain.com/fr aber ich habe ein problem mit Traditionelles und Vereinfachtes Chinesisch. Gibt es

Erkennung der Dateicodierung in PHP

Anzahl der Antworten 8 Antworten
Ich habe ein script, das kombiniert eine Reihe von Dateien in eine, und es bricht, wenn eine der Dateien in UTF8-Kodierung. Ich vermute, dass ich mit sollte die utf8_decode() Funktion beim Einlesen der Dateien, aber ich weiß

Wie erkennt man UTF-8 in reinem C?

Anzahl der Antworten 9 Antworten
Ich bin auf der Suche nach einer code-snippet in plain old C, der erkennt, dass der angegebene string wird im UTF-8-Codierung. Ich weiß, die Lösung mit regex, aber aus verschiedenen Gründen wäre es besser, zu vermeiden, mit

Wie liest man Textdateien mit ANSI-Codierung und nicht englischen Buchstaben?

Anzahl der Antworten 4 Antworten
Ich habe eine Datei, die enthält nicht-Englisch-chars und gespeichert wurde in ANSI-Codierung mit einer nicht-englischen Zeichensatz. Wie kann ich diese Datei Lesen in C# und sehen den Inhalt der Datei korrekt? Nicht arbeiten StreamReader sr=new StreamReader(@"C:\APPLICATIONS.xml",Encoding.ASCII); var

Speichern Sie die Textdatei in UTF-8-Codierung mit cmd.exe

Anzahl der Antworten 2 Antworten
Ist es möglich, speichern Sie eine text-Datei im UTF-8-Codierung mit der Windows-Kommandozeile cmd.exe? InformationsquelleAutor der Frage user2333346 | 2013-05-16

PHP: Konvertiere Unicode-Codepunkte in UTF-8

Anzahl der Antworten 9 Antworten
Habe ich meine Daten in diesem format: U+597D oder so U+6211. Ich will Sie konvertieren, auf UTF-8 (original Zeichen 好 und 我). Wie kann ich es tun? InformationsquelleAutor der Frage Anthony | 2009-11-26

utf-8 Sonderzeichen werden nicht angezeigt

Anzahl der Antworten 7 Antworten
Zog ich meine website von meinem lokalen test-server zu NameCheap shared-hosting-und jetzt Laufe ich in ein problem - einige Seiten nicht anzeigen utf-8 Sonderzeichen richtig (zeigt Fragezeichen anstelle). Alle Seiten sind utf-8 kodiert, so werden alle Datenbank-Tabellen.

Was ist die interne Repräsentation von Java für String? Modifiziertes UTF-8? UTF-16?

Anzahl der Antworten 6 Antworten
Suchte ich in der Java-internen Darstellung für Strings, aber ich habe zwei Materialien, die Aussehen, als zuverlässig, aber inkonsistent. Ist: http://www.codeguru.com/cpp/misc/misc/multi-lingualsupport/article.php/c10451 und es sagt: Java verwendet UTF-16 für die interne Textdarstellung und unterstützt eine non-standard-änderung von UTF-8

Schreiben und lesen Sie eine Datei mit UTF-8-Codierung

Anzahl der Antworten 3 Antworten
Ich gelesen habe, auf alle UTF-8-Fragen und blog-posts, und ich habe Folgendes Beispiel in einem test.rb-Datei: # encoding: UTF-8 File.open("test.txt", "w") do |f| f.write "test © foo" end File.open("test.txt", "r") do |f| puts f.read end dieser funktioniert

Regex, um ungültige UTF-8-Zeichenfolge zu erkennen

Anzahl der Antworten 3 Antworten
In PHP, können wir mb_check_encoding()um zu bestimmen, ob ein string ein gültiges UTF-8. Aber das ist keine tragbare Lösung, da es erfordert die mbstring-Erweiterung kompiliert und aktiviert. Zusätzlich, es wird uns nicht gesagt die Zeichen ist ungültig.

Ruby-Methode zum Entfernen von Akzenten aus internationalen UTF-8-Zeichen

Anzahl der Antworten 2 Antworten
Ich versuche zum erstellen einer 'normalisierten' Kopie eines Strings, um zu helfen reduzieren Sie doppelte Namen in einer Datenbank. Die Namen enthalten viele internationale Zeichen (dh. akzentuierte Buchstaben), und ich möchte, um eine Kopie mit den Akzenten

Speichern Sie die Textdatei UTF-8, die mit VBA codiert ist

Anzahl der Antworten 5 Antworten
wie kann ich schreiben UTF-8-kodierte strings, um eine Textdatei von vba, wie Dim fnum As Integer fnum = FreeFile Open "myfile.txt" For Output As fnum Print #fnum, "special characters: äöüß" 'latin-1 or something by default Close fnum

utf-8 Wortgrenze Regex in Javascript

Anzahl der Antworten 5 Antworten
In JavaScript: "ab abc cab ab ab".replace(/\bab\b/g, "AB"); richtig gibt mir: "AB abc cab AB AB" Wenn ich die utf-8-Zeichen, aber: "αβ αβγ γαβ αβ αβ".replace(/\bαβ\b/g, "AB"); den word-boundary-operator scheint nicht zu funktionieren: "αβ αβγ γαβ αβ

Django: Nicht-ASCII-Zeichen

Anzahl der Antworten 7 Antworten
Mein Django View/Template ist nicht in der Lage zu handhaben Sonderzeichen. Die einfache Ansicht von unten scheitert an den -. Ich bekomme folgende Fehlermeldung: Non-ASCII character '\XF1 verfüllen' in der Datei" def test(request): return HttpResponse('español') Gibt es

C # Konvertiert eine Zeichenfolge von UTF-8 in ISO-8859-1 (Latin1) H

Anzahl der Antworten 8 Antworten
Habe ich gegoogelt über dieses Thema und ich habe mir jede Antwort, aber ich noch nicht bekommen. Im Prinzip brauche ich zum konvertieren von UTF-8-string in ISO-8859-1 und ich mache es mit dem folgenden code: Encoding iso

TCPDF UTF-8. Litauische Symbole tauchen nicht auf

Anzahl der Antworten 14 Antworten
Im mit neueste TCPDF-version(5.9). Haben aber ein paar merkwürdige Probleme mit der Codierung. Ich brauche litauischen Sprache, Symbole wie: ąčęėįšųūž. Aber nur wenige davon. Andere bleiben wie ????? Also, was soll ich tun ? Ich verwenden Sie

Geschwindigkeitsvorlagen scheinen mit UTF-8 nicht zu funktionieren

Anzahl der Antworten 3 Antworten
Ich habe versucht, verwenden Sie ein velocity-Template mit folgendem Inhalt: Sübjäct $item Alles funktioniert einwandfrei außer die übersetzung der beiden Unicode-Zeichen. Das Ergebnis Zeichenfolge gedruckt auf der Kommando-Zeile sieht so aus: Sübjäct foo Suchte ich die velocity-website

Der beste Weg, um eine Unicode-URL in Python in ASCII (UTF-8 Prozent-maskiert) zu konvertieren?

Anzahl der Antworten 5 Antworten
Frage ich mich, was ist der beste Weg -- oder, wenn es eine einfache Möglichkeit mit der standard-Bibliothek -- konvertieren eine URL mit Unicode-Zeichen im domain-Namen-und den Pfad in das entsprechende ASCII-URL, kodiert Domäne wie IDNA und

Was unterscheidet UTF-8 und UTF-8 ohne BOM?

Anzahl der Antworten 20 Antworten
Was ist der Unterschied zwischen UTF-8 und UTF-8 ohne BOM? Was ist besser? InformationsquelleAutor der Frage simple | 2010-02-08

Was ist die Codierung von chinesischen Schriftzeichen auf Wikipedia?

Anzahl der Antworten 3 Antworten
Schaute ich mir die Codierung von chinesischen Schriftzeichen auf Wikipedia, und ich habe Schwierigkeiten, herauszufinden, was Sie verwenden. Zum Beispiel "的" wird codiert als "%E7%9A%84" (siehe hier). Das sind drei bytes, jedoch keine der Codierungen beschrieben auf

NodeJs - Wie mache ich die Funktion fs.writeFile write with BOM?

Anzahl der Antworten 2 Antworten
Bin ich mit nodeJS v0.8.6 und die native library fs. Hier ist mein code : var filesys = require('fs'); filesys.writeFile('test.txt', 'This is an example with accents : é è à ','utf8', function (err) {}); Das problem ist,

Transkribieren Sie alle konvertierbaren utf8 Zeichen in ASCII Äquivalente

Anzahl der Antworten 5 Antworten
Gibt es eine gute Lösung gibt, das dies tut transliteration in einer guten Art und Weise? Ich habe versucht, mit iconv()aber ist sehr ärgerlich und es verhält sich nicht wie man vielleicht erwarten würde. Mit //TRANSLIT versuchen

Wie schreibe ich eine Datei im UTF-8 Format?

Anzahl der Antworten 10 Antworten
Ich habe einige Dateien, die nicht im UTF-8-Kodierung und ich bin konvertieren einer Website nach UTF-8-Codierung. Verwende ich einfaches Skript für die Dateien, die ich speichern möchten, der in utf-8, aber die Dateien sind gespeichert in der

Wie man UTF-8 richtig handhaben kann

Anzahl der Antworten 14 Antworten
Als eine der Reaktionen auf eine Frage, die ich gestern vorgeschlagen, dass, sollte ich sicherstellen, dass meine Datenbank verarbeiten kann, UTF-8-Zeichen korrekt. Wie kann ich das mit MySQL? InformationsquelleAutor der Frage Ben | 2008-10-14

Wie ungültige Zeichen in XML-Datei mit PHP übersprungen werden

Anzahl der Antworten 6 Antworten
Ich versuche zu analysieren, eine XML-Datei mit Hilfe von PHP, aber ich bekomme eine Fehlermeldung: parser error : Char 0 x 0 aus dem zulässigen Bereich in Ich denke, es ist, weil der Inhalt der XML, ich

MySQL "falscher Zeichenfolgenwert" -Fehler beim Speichern der Unicode-Zeichenfolge in Django

Anzahl der Antworten 7 Antworten
Ich habe seltsame Fehlermeldung, wenn versucht zu retten, first_name, last_name, um Django ' s auth_user Modell. Fehlgeschlagen Beispiele user = User.object.create_user(username, email, password) user.first_name = u'Rytis' user.last_name = u'Slatkevičius' user.save() >>> Incorrect string value: '\xC4\x8Dius' for column

Python und BeautifulSoup Codierungsprobleme

Anzahl der Antworten 5 Antworten
Ich Schreibe ein crawler mit Python mit BeautifulSoup und alles ging swimmingly, bis ich lief in dieser Website: http://www.elnorte.ec/ Ich bin immer der Inhalt mit den Anforderungen der Bibliothek: r = requests.get('http://www.elnorte.ec/') content = r.content Wenn ich

Konvertiere Unicode-Codepunkte in Zeichenfolgen in Ruby

Anzahl der Antworten 2 Antworten
Ich habe diese Werte aus einer unicode-Datenbank, aber ich bin mir nicht sicher, wie Sie Sie zu übersetzen in der human-readable form. Was sind diese noch genannt? Hier sind Sie: U+2B71F U+2A52D U+2A68F U+2A690 U+2B72F U+2B4F7 U+2B72B

Wie kann ich Zeichenfolge in C # in UTF-8 transformieren?

Anzahl der Antworten 6 Antworten
Ich habe einen string, den ich von einer Drittanbieter-app, und ich möchte, um es anzuzeigen korrekt in jeder Sprache mit C# auf meinem Windows-Oberfläche. Durch falsche Codierung, ein Stück von mein string sieht in Spanisch: AcciÃ3n in

UTF-8 & amp; Unicode, was ist mit 0xC0 und 0x80?

Anzahl der Antworten 1 Antworten
Die ich gelesen habe über Unicode und UTF-8 in den letzten paar Tagen, und ich oft über einen bitweisen Vergleich ähnlich wie diese : int strlen_utf8(char *s) { int i = 0, j = 0; while (s[i])

Wie konvertiert man eine Datei nach utf-8 in Python?

Anzahl der Antworten 5 Antworten
Ich brauchen, um zu konvertieren eine Reihe von Dateien auf utf-8 in Python, und ich habe Probleme mit der "konvertieren Sie die Datei" Teil. Möchte ich das gleiche: iconv -t utf-8 $file > converted/$file # this is

Ruby on Rails 3, inkompatible Zeichenkodierungen: UTF-8 und ASCII-8BIT mit i18n

Anzahl der Antworten 5 Antworten
Ich habe einige Schwierigkeiten mit den paar Schienen 3.0.1, Ruby 1.9.2 und meine website-Lokalisierung. Das problem ist ganz einfach, ich habe sowas im Blick : f.input :zip_code, :label => I18n.t('labels.zip_code') und ein es.yml-Datei : es: labels: zip_code:

Ruby `encode ':" \ xC3 "von ASCII-8BIT nach UTF-8 (Encoding :: UndefinedConversionError)

Anzahl der Antworten 3 Antworten
Hannibal-Episoden in tvdb haben seltsame Zeichen in Ihnen. Beispiel: Œuf Also ruby spuckt: ./manifesto.rb:19:in `encode': "\xC3" from ASCII-8BIT to UTF-8 (Encoding::UndefinedConversionError) from ./manifesto.rb:19:in `to_json' from ./manifesto.rb:19:in `<main>' Zeile 19: puts @tree.to_json Ist es ein Weg, um sich

Ändern Sie das Standardcodierungssystem von Emacs

Anzahl der Antworten 7 Antworten
Mein problem ergibt sich aus Emacs einfügen der Codierung der überschriften in den Quellcode-Dateien mit nicht-ascii-Zeichen: # -*- coding: utf-8 -*- Meiner Kollegen weiß nicht, wie diese Header überprüft wird, ob sich in unseren Archiven. Ich will

Konvertiert wstring in eine in UTF-8 codierte Zeichenfolge

Anzahl der Antworten 5 Antworten
Brauche ich zum konvertieren zwischen wstring und string. Ich fand heraus, dass mit Hilfe der codecvt-Facette sollte den trick tun, aber es scheint nicht zu funktionieren für utf-8-Gebietsschema. Meine Idee ist, dass ich beim Lesen von utf-8-codierte

Wie funktioniert MySQL in UTF-8 "case insensitive" und "accent insensitive"?

Anzahl der Antworten 2 Antworten
Habe ich ein schema in "utf8 -- UTF-8 Unicode" - Zeichensatz und eine Sortierung von "utf8_spanish_ci". Alle innerhalb von Tabellen sind InnoDB-mit dem gleichen Zeichensatz und Sortierung wie bereits erwähnt. Hier kommt das problem: mit einer Abfrage

Was ist der beste Weg, um UTF8-Daten in Excel zu exportieren?

Anzahl der Antworten 8 Antworten
So haben wir diese web-app, wo wir Unterstützung von UTF8-kodierten Daten. Hurra UTF8. Und wir können exportieren Sie die vom Benutzer gelieferten Daten in das CSV-kein problem - es ist noch immer in UTF8 an diesem Punkt.

Ist "SET CHARACTER SET utf8" notwendig?

Anzahl der Antworten 3 Antworten
Im nach dem umschreiben des Datenbank-Klasse (PDO), und stecken Sie sich das an. Ich habe gelernt, verwenden beide SET NAMES utf8 und SET CHARACTER SET utf8 beim arbeiten mit UTF-8 in PHP und MySQL. PDO ich jetzt

Wie schreibe ich eine UTF-8-Datei mit Java?

Anzahl der Antworten 9 Antworten
Habe ich einige aktuellen code ein, und das problem wird sein die Schaffung eines 1252 codepage-Datei, ich will zwingen Sie zum erstellen einer UTF-8 Datei Kann mir jemand helfen mit diesem code, wie ich sagen, es funktioniert

JVM-Eigenschaft -Dfile.encoding = UTF8 oder UTF-8?

Anzahl der Antworten 4 Antworten
Ich würde gerne wissen, was ist der Wert, der von der Java Virtual Machine (JVM) - Eigenschaft zum festlegen der Datei-Kodierung UTF-8. Mache ich -Dfile.encoding=UTF8 oder -Dfile.encoding=UTF-8? InformationsquelleAutor der Frage astrotouf | 2011-05-17

UTF8 MySQL-Probleme auf Rails - Probleme mit utf8_general_ci

Anzahl der Antworten 7 Antworten
Habe ich eine staging-Rails-Website, die läuft über MySQL 5.0.32-Debian. Auf diese bestimmte Website, die alle meine Tabellen sind mit utf8 /utf8_general_ci Codierung. Innen, die Datenbank habe ich einige Daten, die sieht so aus: mysql> select * from