Tag: utf-8

UTF-8 ist eine Zeichenkodierung beschreibt die einzelnen Unicode-code-point mit einer byte-Sequenz von einem bis vier bytes. Es ist rückwärts-kompatibel mit ASCII, während noch immer die Unterstützung Darstellung aller Unicode-code-points.

Warum SQLAlchemy create_engine mit charset=utf8 zurück python-Typ <str> und nicht Typ <unicode>?

Anzahl der Antworten 1 Antworten
Mit Python 2.7 und SQLAlchemy 0.7, ich bin die Verbindung zu einer MySQL-DB mit dem Befehl: engine = create_engine('mysql://username:[email protected]/dbname?charset=utf8',echo=False) Entsprechend der SQLAlchemy-docs, die Einstellung charset=utf-8 impliziert automatisch use_unicode=1, so dass alle Saiten kommen sollte, wieder als unicode.

Ändern der Codierung von UTF-8 auf ISO-8859-2 in Javascript

Anzahl der Antworten 3 Antworten
Ich würde das gerne ändern-string encoding von UTF-8 auf ISO-8859-2 in Javascript. Wie kann ich es tun? Ich brauche es, weil ich entworfen habe ein widget. Benutzer nur Kopien < script > - tag von meiner Seite

Wie viele bytes hat ein string enthält?

Anzahl der Antworten 2 Antworten
public class ClassToTestSnippets { private static ClassToTestSnippets ctts; public static void main(String args) { ctts = new ClassToTestSnippets(); ctts.testThisMethod(); } public void testThisMethod() { System.out.println("\u2014".length()); //answer is 1 } } Obige code druckt 1. Aber \u2014 ist

Beste Weg, um eine Zeichenfolge schreiben zu Ausgabestrom in Java

Anzahl der Antworten 1 Antworten
Ich habe eine OutputStream Instanz, die Rückkehr von HttpURLConnection. Schreiben brauche ich eine UTF-8-String in den stream. Habe ich 2 Möglichkeiten: Verwenden OutputStream sich //write String os.write("some utf8 text".getBytes(Charsets.UTF_8)); Verwenden OutputStreamWriter wrapper //BufferedWriter bw = new BufferedWriter(new

VB.NET, MySQL und Unicode

Anzahl der Antworten 3 Antworten
Wie die Eingabe der textbox ist unicode-string in MySQL Datenbank. Ich änderte utf8-Zeichensatz der MySQL-Datenbank. Ich bin mit VB.NET 2005 und MySQL-Datenbank für Windows-Anwendung. Bitte Helfen Sie mir. Haben Sie versucht, es sich selbst? Post code und

SQL Tabellen mit VARCHAR mit UTF8 (mit Bezug auf multi-byte-Zeichen-Länge)

Anzahl der Antworten 3 Antworten
Wie in Oracle VARCHAR( 60 CHAR ) ich möchte, um anzugeben, ein varchar-Feld mit variabler Länge, je nach den eingefügten Zeichen. Beispiel: create table X (text varchar(3)) insert into X (text) VALUES ('äöü') Sollte möglich sein (mit

So entfernen Sie steuerzeichen aus UTF8-string

Anzahl der Antworten 2 Antworten
habe ich eine VB.NET Programm behandelt, die den Inhalt von Dokumenten. Das programm verarbeitet große Mengen von Unterlagen, die als "batch"(>2 Millionen Dokumente, insgesamt 1-TB-Volumen) Einige dieser Dokumente enthalten möglicherweise control-chars oder chars wie f0e8(http://www.fileformat.info/info/unicode/char/f0e8/browsertest.htm). Gibt es

die Funktionen json_encode mit mysql-Inhalte und Umlaute in utf-8

Anzahl der Antworten 1 Antworten
fühle ich meinen BART wachsen, während Sie versuchen, herauszufinden, das Problem hier. Basic das Problem ist, dass Umlaute/Sonderzeichen äöß ... funktionieren nicht. Ich denke, jeder ist krank und müde, dass Fragen, die aber alle Lösungen online gefunden

Wie konvertiere ich einen string in eine URI-Komponente?

Anzahl der Antworten 2 Antworten
Ich habe versucht, encodeURI und alsterrunde, scheint diese nicht richtig konvertieren. sample : encodeURIComponent("�‡‰™©"); Dank!! Wo stammen die Daten? Welche Ausgabe ist es ein geben Sie? Meinst du, die Fragen "Wie konvertiere ich einen string in eine

Ersetzt einen Zeilenumbruch in UTF-8 sicher?

Anzahl der Antworten 3 Antworten
Wenn ich eine UTF-8-Strings und wollen, ersetzen Sie die Zeilenumbrüche mit dem HTML -<br> , ist dies sicher? $var = str_replace("\r\n", "<br>", $var); Ich weiß, str_replace ist nicht UTF-8 sicher, aber vielleicht kann ich mit diesem Weg

Warum Fragezeichen angezeigt im web-browser?

Anzahl der Antworten 4 Antworten
War ich (wieder)Lesen Joel ist toll, Artikel auf Unicode und kam in diesem Absatz, was ich nicht ganz verstehe: Beispielsweise könnten Sie die Kodierung der Unicode-string Hello (U+0048 U+0065 U+006C U+006C U+006F) im ASCII-oder das alte OEM-Griechisch-Codierung,

Wie zu Lesen die UTF-8-kodierte text-Datei mit std::ifstream?

Anzahl der Antworten 1 Antworten
Ich habe eine harte Zeit, die zum Parsen einer xml-Datei. Speichern der Datei mit der Codierung UTF-8. Normalen ASCII richtig gelesen, aber die koreanischen Zeichen nicht. Also habe ich ein einfaches Programm zum Lesen einer UTF-8-Textdatei und

Brauche ich Internet.config für nicht-ASCII-Zeichen?

Anzahl der Antworten 1 Antworten
Versucht, um meine erste ASP.NET Seite. Habe IIS 5.1 unter XP konfiguriert .NET 4. Erstellt eine neue virtuelle Verzeichnis, und Hinzugefügt .aspx-Datei. Wenn ich durchsuchen die Datei nicht-ASCII-Zeichen sind beschädigt. Zum Beispiel, ein ü (U+00 FC) transformiert

php regex wortgrenzeanpassung in utf-8

Anzahl der Antworten 4 Antworten
Habe ich folgenden php-code in einer utf-8-php-Datei: var_dump(setlocale(LC_CTYPE, 'de_DE.utf8', 'German_Germany.utf-8', 'de_DE', 'german')); var_dump(mb_internal_encoding()); var_dump(mb_internal_encoding('utf-8')); var_dump(mb_internal_encoding()); var_dump(mb_regex_encoding()); var_dump(mb_regex_encoding('utf-8')); var_dump(mb_regex_encoding()); var_dump(preg_replace('/\bweiß\b/iu', 'weiss', 'weißbier')); Möchte ich die Letzte regex ersetzen, nur ganze Wörter und nicht Teile von Wörtern. Auf meinem

UTF-8% - Codierung und python

Anzahl der Antworten 2 Antworten
Ich versuche python zu geben, mich Prozent-kodierte strings. Die API-ich bin die Interaktion mit (was ich denke, ist mit Prozent-codierte UTF-8), gibt %c3%ae für î. Allerdings, python ist das urllib.Zitat gibt %3F. import urllib mystring = "î"

wie entfernen Sie die BOM() Zeichen aus einer UTF-8-kodierten csv?

Anzahl der Antworten 3 Antworten
Muss ich parse eine utf8 codierte csv. Nach der Konvertierung habe ich gerade gesehen, dass das problem mit dem BOM () Zeichen am beginging. Ich kann nicht erstellen Sie eine csv-Vermeidung der Stückliste mit der utf8-Codierung, wie

UTF-8-codierten String in REST-WebService mit Apache CXF

Anzahl der Antworten 1 Antworten
Ich bin Einstellung, die eine REST-Web-Service auf einer 2,5-Web-Anwendung auf Tomcat 6 verwenden von CXF 3.0.2. Der webservice erhält eine POST-Anforderung mit keine Parameter und gibt ein JSON-String mit internationalen Zeichen (z.B. é, è, à, ...). Das

Dekodieren von base64-string als UTF-8

Anzahl der Antworten 2 Antworten
Ich bin mit dem base64-Umsetzung an der Unterseite der dieser Beitrag. Wenn ich folgenden code: NSLog(@"decoded:%@",[[[NSString alloc] initWithData:[Base64 decode:@"8fEmIzEyNDA3OyYjMTI0MTE7"] encoding:NSUTF8StringEncoding] autorelease]); Bekomme ich decoded:(null) Allerdings, wenn ich: NSLog(@"decoded 1:%@",[[[NSString alloc] initWithData:[Base64 decode:@"8fEmIzEyNDA3OyYjMTI0MTE7"] encoding:NSASCIIStringEncoding] autorelease]); Bekomme ich decoded:ññ&#12407;&#12411;

Wie konvertieren von text in UTF-8 Delphi

Anzahl der Antworten 3 Antworten
Habe ich eine Funktion zurückgibt, die eine HTML-Seite aus dem Internet, aber die kyrillischen Symbole werden angezeigt, mit einige andere unbekannte Zeichen. Wie kann ich konvertieren Sie den text und werden in der Lage, um zu sehen,

Codieren kyrillischen Symbolen, die in HTTP-Anfragen in Java?

Anzahl der Antworten 4 Antworten
Gute Zeit! Mein Adroid-app führt HTTP-request zu einem, der in der API-Dienste von Google. Sicher, es funktioniert, wenn die parameter der Anfrage in Englisch, aber wenn ich mein test-Funktion, mit der Kyrillisch - ich bekomme die 400-Fehler.

Erste echte UTF-8-Zeichen in Java-JNI

Anzahl der Antworten 1 Antworten
Gibt es eine einfache Möglichkeit zur Konvertierung einer Java-string zu einem echten UTF-8-byte-array im JNI code? Leider GetStringUTFChars() fast tut, was erforderlich ist, aber nicht ganz, es gibt eine "modifizierte" UTF-8-byte-Sequenz. Der Hauptunterschied ist, dass eine modifizierte

.NET : StreamReader nicht erkannt ° - Zeichen

Anzahl der Antworten 2 Antworten
Ich versuche zu laufen, einen RegEx zu suchen, Grad-Zeichen (\u00B0|\u00BA Grad in-Zusatz zu suchen, die eine andere form von ' --> \u00B4). Ich lese Längen-und Breitengrad-Koordinaten wie diese: 12º30'23.256547"S Das problem ist mit der Art, wie lese

UTF-8-überprüfung in PHP ohne Verwendung von preg_match()

Anzahl der Antworten 5 Antworten
Muss ich überprüfen einige Benutzereingaben, die in UTF-8 codiert. Viele haben empfohlen, mit dem folgenden code: preg_match('/\A( [\x09\x0A\x0D\x20-\x7E] | [\xC2-\xDF][\x80-\xBF] | \xE0[\xA0-\xBF][\x80-\xBF] | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} | \xED[\x80-\x9F][\x80-\xBF] | \xF0[\x90-\xBF][\x80-\xBF]{2} | [\xF1-\xF3][\x80-\xBF]{3} | \xF4[\x80-\x8F][\x80-\xBF]{2} )*\z/x', $string); Es ist ein

Sonderzeichen, die sich nicht zeigen in pandoc html-Ausgabe

Anzahl der Antworten 2 Antworten
Ich versuche Sonderzeichen (für ausländische Familiennamen), die in pandoc. Ich folgte den Anweisungen hier und stellte sicher, dass alle Sonderzeichen dargestellt werden, die UTF-Codierung (gemäß auf dieser Seite. Ich wählte HTML Entity (decimal) option. Die resultierenden Dateien

Kann nicht einfügen UTF8-Datenbank MySQL in Linux

Anzahl der Antworten 3 Antworten
Beim erstellen der Tabelle habe ich gesetzt charset = utf8. Ich erstellen 1 gespeicherte Prozedur zum einfügen von Daten in die Datenbank. Beim einfügen von Daten UTF8-Datenbank-Fenster, funktioniert es.(Display-Daten richtig) Aber es doesnot Arbeit in Linux.(Display-Daten nicht

UTF-8-Antwort bei servlet

Anzahl der Antworten 4 Antworten
Ich bin das Lesen der HTTP-Antwort aus einem Perl-Seite in ein Servlet wie diese: public String getHTML(String urlToRead) { URL url; HttpURLConnection conn; BufferedReader rd; String line; String result = ""; try { url = new URL(urlToRead);

Leerzeichen in ein Datenbank-Feld nicht entfernt trim()

Anzahl der Antworten 7 Antworten
Habe ich ein paar Leerzeichen am Anfang eines Absatzes in einem text-Feld in MySQL. Mit trim($var_text_field) in PHP oder TRIM(text_field) im MySQL-Anweisungen ist absolut nichts. Was könnte diese Leerzeichen werden und wie Entferne ich es per code?

Erstellen von UTF-8 Dateien in Java von einem runnable Jar

Anzahl der Antworten 1 Antworten
Habe ich ein kleines Java-Projekt, wo ich die Eigenschaften der class-Dateien auf UTF-8 (ich benutze eine Menge von ausländischen Zeichen, die nicht auf der Standard-CP1252). Das Ziel ist, erstellen Sie eine text-Datei (in Windows) mit einer Liste

konvertieren \u0040 zu @ in C#

Anzahl der Antworten 2 Antworten
Die Facebook graph API ' s für mich zurück des Benutzers E-Mail-Adresse als foo\u0040bar.com. in ein JSON-Objekt. Muss ich es konvertieren zu [email protected] Muss es eine eingebaute Methode .NET, dass änderungen der Unicode-Zeichen-Ausdruck (\u1234) zu den eigentlichen

Wie zu Dekodieren, die ein QByteArray mit UTF-8 mit den Latin-1-fallback

Anzahl der Antworten 1 Antworten
Habe ich eine socket Verbindung zu einem IRC-server. Ich würde gerne konvertieren empfangenen Daten (QByteArray) zu QString. Weil im IRC, nicht jeder ist mit UTF-8, ich will versuchen, das zu entschlüsseln das QByteArray mit UTF-8: QString s

PHP fputcsv mit UTF-8-Problem

Anzahl der Antworten 3 Antworten
Ich versuche zulassen, dass meine Kunden sehen Sie einige der MySQL Daten in Excel. Ich habe verwendet, PHP fputcsv () - Funktion, wie: public function generate() { setlocale(LC_ALL, 'ko_KR.UTF8'); $this->filename = date("YmdHis"); $create = $this->directory."Report".$this->filename.".csv"; $f =

Drucken mit win-1250 Zeichensatz auf zebra-Drucker an?

Anzahl der Antworten 4 Antworten
Ich habe diesen code für das drucken mit Zebra-Drucker (RW 420 um genau zu sein) StringBuilder sb = new StringBuilder(); sb.AppendLine("N"); sb.AppendLine("q609"); sb.AppendLine("Q203,26"); //set printer character set to win-1250 sb.AppendLine("I8,B,001"); sb.AppendLine("A50,50,0,2,1,1,N,\"zażółć gęślą jaźń\""); sb.AppendLine("P1"); printDialog1.PrinterSettings = new

Java lokalisierten Dateinamen

Anzahl der Antworten 4 Antworten
Wie kann ich einstellen, lokalisierte Dateinamen in java.Derzeit jedesmal, wenn ich auf eine lokalisierte Datei mit einem nicht-ascii-Dateinamen in meiner Anwendung, die windows-Dialogfeld "speichern" erscheint, aber es ist nicht die Anzeige der Dateinamen richtig, wenn der charset

Wie kann ich erkennen, ob eine .NET StreamReader fand ein UTF8-BOM an den zugrunde liegenden stream?

Anzahl der Antworten 3 Antworten
Bekomme ich eine FileStream(filename,FileMode.Open,FileAccess.Read,FileShare.ReadWrite) und dann ein StreamReader(stream,true). Gibt es einen Weg wie ich überprüfen kann, ob der stream begann mit einem UTF8-BOM? Ich bin zu bemerken, dass die Dateien ohne BOM gelesen werden als UTF8 durch

Python 3 ist unicode utf-8-Datei

Anzahl der Antworten 1 Antworten
Ich versuche zu analysieren, die durch eine log-Datei, aber das format der Datei ist immer in unicode. Meine übliche Prozess möchte ich gerne automatisieren: Ziehe ich die Datei in notepad Speichern unter... ändern der Codierung von unicode

cURL bekommt Antwort mit utf-8-BOM

Anzahl der Antworten 3 Antworten
In meinem script, das ich Daten senden mit cURL und aktiviert CURLOPT_RETURNTRANSFER. Die Antwort ist json-codierte Daten. Wenn ich versuche, json_decode, gibt Sie null zurück. Dann fand ich, dass die Antwort enthält die utf-8 BOM-Zeichen am Anfang

Java JTextPane-HTML-Editor, der UTF-8 Zeichen Kodierung

Anzahl der Antworten 2 Antworten
Ich bin mit JTextPane als einfache html-editor. jtp=new JTextPane(); jtp.setContentType("text/html;charset=UTF-8"); jtp.setEditorKit(new HTMLEditorKit()); Wenn ich Anrufe, jtp.getText() bekomme ich schöne html-code mit allen Sonderzeichen escaped. Aber ich will nicht entgehen nationale Zeichen (für Polnisch), sondern nur spezielle html-Zeichen

UnicodeDecodeError auf byte-Typ

Anzahl der Antworten 3 Antworten
Mit Python 3.4 ich bekomme die folgende Fehlermeldung, wenn Sie versuchen zu entschlüsseln byte-Typ unter Verwendung von utf-32 Traceback (most recent call last): File "c:.\SharqBot.py", line 1130, in <module> fullR=s.recv(1024).decode('utf-32').split('\r\n') UnicodeDecodeError: 'utf-32-le' codec can't decode bytes in

inkompatible Zeichensätze: UTF-8 und ASCII-8-BIT render-Aktion

Anzahl der Antworten 2 Antworten
ActionView::Template::Error (inkompatible Zeichensätze: UTF-8 und ASCII-8BIT): app/controllers/posts_controller.rb:27:in `new' # GET /posts/new def new if params[:post] @post = Post.new(post_params).dup if @post.valid? render :action => "confirm" else format.html { render action: 'new' } format.json { render json: @post.errors, status:

Holen E-Mails von imap-und konvertiere zu UTF-8

Anzahl der Antworten 2 Antworten
Ich habe einige Schwierigkeiten abholen von E-Mails mit php und imap. Jeder Absender sendet E-Mails codiert in verschiedenen Zeichensatz-Kodierungen, so dass es schwer zu machen, eine Universelle Lösung für mich. Wenn ich will Holen die von, an,

Speichern von text in UTF-8 per Batch

Anzahl der Antworten 1 Antworten
Arbeite ich noch auf einen Konverter .m3u-playlist-Dateien, die ports, die Sie aus Windows Media Player generierte format in ein format, das wird akzeptiert von den Teamspeak 3 plugin "Resonanzboden". Den main-Konverter ist jetzt fertig und ich stieß

Entfernen Stückliste aus string mit Perl

Anzahl der Antworten 4 Antworten
Ich habe Folgendes problem: ich lese aus einer Textdatei in UTF-8 (und das sage ich Perl, dass ich bin damit durch ":encoding(utf-8)"). Die Datei sieht wie diese in einem hex-viewer: EF BB BF 43 6F 6E 66

UCS2/HexEncoded Zeichen auf UTF-8 in php

Anzahl der Antworten 2 Antworten
Fragte ich eine Frage vorher um ein UCS-2/HexEncoded string von UTF-8, und ich bekam etwas Hilfe von einigen Jungs, unter dem folgenden link. UCS2/HexEncoded Zeichen Aber jetzt brauche ich, um die korrekten UTF-8 UCS-2/HexEncoded string in PHP.

Ist die Prüfung für UTF-8 strings in PHP eine zuverlässige Methode?

Anzahl der Antworten 6 Antworten
Ich gefunden habe, eine nützliche Funktion auf eine andere Antwort und ich Frage mich, wenn jemand könnte mir erklären, was es macht und ob es zuverlässig ist. Ich war mit mb_detect_encoding(), aber es war falsch, beim Lesen

So speichern Sie eine text-Datei (CSV) mit UTF-8 ohne BOM Codierung in VBA (Excel)?

Anzahl der Antworten 1 Antworten
So, das war meine anfängliche Frage. Die Antwort auf meine Frage weiter unten, scheint zu sein, dass die einzige Lösung, um UTF-8 (oder UTF-8 ohne BOM) - Codierung, ist die Verwendung des ADODB.Stream-Objekt ein. Die Antwort auf

Sortieren von UTF-8-Zeichenfolgen in RoR

Anzahl der Antworten 7 Antworten
Ich versuche herauszufinden, eine 'richtige' Art und Weise der Sortierung für UTF-8 strings in Ruby on Rails. In meiner Anwendung, ich habe eine select-box, die gefüllt ist mit den Ländern. Als meine Anwendung ist lokalisiert, die jeweils

akzentuierte Zeichen werden nicht korrekt angezeigt, auf dem server, auch wenn die Codierung korrekt ist

Anzahl der Antworten 2 Antworten
schrieb ich eine html mit utf-8-Zeichensatz. in den html-Kopf gibt es auch eine <meta http-equiv="Content-Type" content="text/html; charset=utf-8"/> alles funktioniert gut in lokalen, aber wenn ich Dateien auf den server hochzuladen, ich sehe alle meine Briefe àèìòù etc

Wie lese ich die UTF-8 Zeichen per pointer?

Anzahl der Antworten 5 Antworten
Nehme an, dass ich UTF-8-Inhalte im Speicher gespeichert, wie kann ich Lesen Sie die Zeichen mit einem Zeiger? Ich nehme an, ich brauche die Uhr für das 8. bit, das angibt, dass eine multi-byte-Zeichen, aber wie genau

Wie behandeln UTF-8 und ANSI-Konvertierung vor Delphi 2009?

Anzahl der Antworten 2 Antworten
In Delphi 2009 haben wir: RichEdit1.Lines.LoadFromFile(OpenDialog1.FileName,TEncoding.UTF8); RichEdit1.Lines.SaveToFile(OpenDialog2.FileName,TEncoding.Unicode); Wie mache ich das auf Delphi 2006 wenn ich nicht TEconding noch? Ist es irgendwie zu transportieren, dass die neue Bibliothek zurück? oder gibt es da eine Lösung versteckt im

MySQL CHAR () - Funktion und UTF8 Ausgabe?

Anzahl der Antworten 2 Antworten
+--------------------------+--------------------------------------------------------+ | Variable_name | Wert | +--------------------------+--------------------------------------------------------+ | character_set_client | utf8 | | character_set_connection | utf8 | | character_set_database | utf8 | | character_set_filesystem | binary | | character_set_results | utf8 | | character_set_server | utf8 |