Tag: utf-8
UTF-8 ist eine Zeichenkodierung beschreibt die einzelnen Unicode-code-point mit einer byte-Sequenz von einem bis vier bytes. Es ist rückwärts-kompatibel mit ASCII, während noch immer die Unterstützung Darstellung aller Unicode-code-points.
4
Antworten
In. c# Können wir unter Klassen zu tun encoding: System.Text.Encoding.UTF8 System.Text.Encoding.UTF16 System.Text.Encoding.ASCII Warum gibt es keine System.Text.Encoding.Base64? Können wir nur nutzen Convert.From(To)Base64String Methode, was ist das Besondere von base64? Kann ich sagen, base64 ist die gleiche Kodierung
5
Antworten
Ich versuche, verwenden Sie den folgenden code zum senden von Nachrichten über System.Net.Mail und bin manchmal bekommen Themen wie"=?utf-8?B?W3AxM25dIEZpbGV...' (beschnitten). Dies ist der code, dass heißt: MailMessage message = new MailMessage() { From = new MailAddress("
[email protected]", "Service"),
6
Antworten
Ich habe ein Programm, dass die Ausgänge einen Text und Tabelle auf UTF-8-Zeichenfolgen, und ich brauche, um zu Messen die Anzahl der Monospace-Charakter von Zellen mit einem string, so kann ich es richtig auszurichten. Wenn möglich, möchte
2
Antworten
Was ich versuche zu tun, ist die Verwendung SHA1-UTF-8-Verschlüsselung und dann base64-Codierung und auf einen Passwort-string-Wert. Allerdings musste ich die Verschlüsselung ein, dann die Codierung, aber ich Tat es den anderen Weg herum. Hier ist der code:
4
Antworten
Bin ich wirklich verwirrt mit den codecs.open function. Wenn ich das mache: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Es gibt mir die Fehlermeldung UnicodeDecodeError: 'ascii' codec can T decode byte 0xef in position 0: ordinal not
1
Antworten
Standardmäßig, wenn Sie die Umleitung der Ausgabe eines Befehls in eine Datei oder pipe es in etwas anderes in der PowerShell, die Kodierung ist UTF-16, was nicht nützlich. Ich bin auf der Suche, um es zu ändern
8
Antworten
Ich versuche zu konvertieren eine Zeichenfolge codiert, die in java in UTF-8 zu ISO-8859-1. Sagen Sie zum Beispiel, im string 'âabcd' 'â' dargestellt wird, die in ISO-8859-1 als E2. In UTF-8 dargestellt wird als zwei bytes. C3-A2,
11
Antworten
Nehmen wir an, ich habe gerade verwendet eine BufferedInputStream zum Lesen der bytes der UTF-8-kodierte text-Datei in ein byte-array. Ich weiß, dass ich kann verwenden Sie die folgende routine konvertieren die bytes zu einem string, aber es
3
Antworten
Arbeite ich mit Amazon S3-uploads und habe Probleme mit dem Schlüssel-Namen zu lang werden. S3 begrenzt die Länge der Schlüssel von bytes, nicht in Zeichen. Aus der docs: Den Namen für einen Schlüssel ist eine Folge von
2
Antworten
Wie kann ich von python 3 (3.1) print("Some text") auf stdout in UTF-8, oder, wie die rohen bytes? Test.py TestText = "Test - āĀēĒčČ..šŠūŪžŽ" # this is UTF-8 TestText2 = b"Test2 - \xc4\x81\xc4\x80\xc4\x93\xc4\x92\xc4\x8d\xc4\x8c..\xc5\xa1\xc5\xa0\xc5\xab\xc5\xaa\xc5\xbe\xc5\xbd" # just bytes print(sys.getdefaultencoding())
3
Antworten
Ich Schreibe ein crawler verwendet Hpricot. Es lädt eine Liste von strings von einigen Webseite, dann versuche ich in die Datei schreiben. Etwas ist falsch mit der Codierung: "\xC3" from ASCII-8BIT to UTF-8 Ich habe Gegenstände, die
6
Antworten
Habe ich php-Dokument signup.php die speichern den Inhalt von der form (in form.php Dokument) auf MySQL-Basis. Das problem entsteht, wenn ich will, um neu formatieren die Eingabe Inhalt. Ich will tun Dekodieren von UTF-8 charachters wie à->ein.
8
Antworten
Ich bin mit Mühe tmux zur Anzeige von Linien für die Grenzen. Sie sind mit x und q ein. Es ist ein debian squeeze server und der Zeichensatz wird auf de_de UTF8. Ich habe auch versucht, indem
6
Antworten
Bekomme ich eine Fehlermeldung mit dem folgenden Muster: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) Nicht sicher, was u'\ufeff' ist, zeigt sich, wenn ich bin web-scraping. Wie kann ich Abhilfe
10
Antworten
Ich habe eine MySQL Tabelle mit utf8-general-ci-Sortierung. In der Tabelle sehe ich zwei Einträge: abad abád Bin ich mit einer Abfrage, die wie folgt aussieht: SELECT * FROM `words` WHERE `word` = 'abád' Das Ergebnis der Abfrage
4
Antworten
Habe ich zum speichern hindi text in eine MySQL-Datenbank, Holen Sie es mit einem PHP-script und zeigen Sie es auf einer Webseite. Ich habe die folgenden: Erstellte ich eine Datenbank, und legen Sie seine Codierung auf UTF-8
6
Antworten
Ich export-Microsoft Excel-Daten Excel-Makros(VBScript). Da die Datei lua-Skript, Exportiere ich es als UTF-8. Der einzige Weg, ich kann UTF-8 in Excel ist die Verwendung von adodb.stream wie diese set fileLua = CreateObject("adodb.stream") fileLua.Type = 2 fileLua.Mode =
6
Antworten
Habe ich die folgenden Charakter-encoding-Problem, irgendwie habe ich es geschafft, Daten zu speichern, die mit unterschiedlichen Zeichen-encoding in meiner Datenbank (UTF8) Die code-und Ausgänge unten zeigen 2 Probe strings und wie Sie ausgegeben. 1 würde geändert werden
6
Antworten
Habe ich einige problem mit UTF-8. Mein client (realisiert in GWT), eine Anfrage zu meinem servlet mit einigen Parametern in der URL, wie folgt: http://localhost:8080/servlet?param=value Wenn in der servlet rufe ich die URL, ich habe einige problem
3
Antworten
Ich versuche hash einige unicode-strings: hashlib.sha1(s).hexdigest() UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-81: ordinal not in range(128) wo s ist so etwas wie: œ∑¡™£¢∞§¶•ªº–≠œ∑®†¥ˆøn“‘åß∂ƒ©∆...æΩ≈ç√∫µ≤≥÷åйцукенгшщзхъфывапролджэячсмитьбююю..юбьтијџўќ†њѓѕ"“«««\dzћ÷...•∆љl«єђxcvіƒm≤≥ї!@#$©^&*(()----------∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆∆•...÷ћzdzћ÷...•∆љlљ∆•...÷ћzћ÷...•∆љ∆•...љ∆•...љ∆•...∆љ•...∆љ•...љ∆•...∆•...∆•...∆•∆...•÷∆•...÷∆•...÷∆•...÷∆•...÷∆•...÷∆•...÷∆•... was soll ich das beheben? InformationsquelleAutor der Frage Halst | 2011-03-13
2
Antworten
Was ist die maximale Anzahl von bytes, die für ein einzelnes UTF-8 codierten Zeichen? Werde ich die Verschlüsselung der bytes von einem String in UTF-8 codiert und müssen daher in der Lage sein, um die maximale Anzahl
1
Antworten
Ich habe ein problem mit inkonsistente Codierung von Zeichen-Vektor - in R. Den text-Datei, die ich lese eine Tabelle aus ist codiert (über Notepad++) in UTF-8 (ich habe versucht, mit UTF-8 without BOM auch.). Möchte ich zum
7
Antworten
Iterieren ein UTF-8 string Zeichen für Zeichen mithilfe der Indizierung? Wenn Sie eine UTF-8-string mit dem Klammer-operator $str[0] utf-codierten Zeichen besteht aus 2 oder mehr Elementen. Beispiel: $str = "Kąt"; $str[0] = "K"; $str[1] = "�"; $str[2]
2
Antworten
Kann mir bitte jemand bestätigen, dass alle Kanji-Zeichen in Chinesisch sind 3 Byte lange UTF-8? InformationsquelleAutor der Frage TopCoder | 2010-09-09
3
Antworten
Ich versuche zu Lesen, von einem text/plain - Datei über das internet, line-by-line. Den code habe ich jetzt: URL url = new URL("http://kuehldesign.net/test.txt"); BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream())); LinkedList<String> lines = new LinkedList(); String readLine; while
1
Antworten
wie kann ich erzwingen, PHP, fügen Sie die Stückliste bei Verwendung utf8_encode ? Hier ist, was ich versuche zu tun: $zip->addFromString($filename, utf8_encode($xml)); Leider (für mich), das Ergebnis wird nicht die BOM-Markierung am Anfang. InformationsquelleAutor der Frage Jeano
11
Antworten
Ich habe eine UITextView braucht man ein NSString mit Formatierung stringWithUTF8String. Es erhält seine Werte aus einer Datenbank und ich möchte den text in der Datenbank dargestellt werden, mit Pausen im text. Ich habe versucht, mit \n
3
Antworten
Werde ich stecken Sie in einige Artikel in mysql mit PHP. Dies ist phpMyAdmin Informationen: Server: localhost via TCP/IP Server version: 5.0.85-community-nt Protocol version: 10 User: root@localhost MySQL charset: UTF-8 Unicode (utf8) Hier ist meine Tabelle Informationen:
4
Antworten
Kann ich nicht erstellen einer utf-8 csv-Datei in Python. Ich versuche, es zu Lesen die Dokumente, und in der im Abschnitt "Beispiele"es sagt: Für alle anderen Codierungen die folgenden UnicodeReader und UnicodeWriter Klassen können verwendet werden. Sie
2
Antworten
Gibt es irgendeinen Grund zu bevorzugen unicode(somestring, 'utf8') im Gegensatz zu somestring.decode('utf8')? Mein einziger Gedanke ist, dass .decode() ist eine gebundene Methode, so dass python kann in der Lage, es zu beheben effizienter, aber korrigieren Sie mich,
1
Antworten
Den Kern meiner Frage ist dieser: Wie kann ich die Anzeige von Unicode-Zeichen in Matlab GUI (OS X) so, dass Sie richtig gerendert? Details: Ich habe eine Tabelle von Zeichenfolgen in einer Datei gespeichert, und einige dieser
3
Antworten
Ich versuche zu Lesen, eine Datei als UTF-8 oder Windows-1252, je nach Ausgang dieses Verfahrens: public Charset getCorrectCharsetToApply() { //Returns a Charset for either UTF-8 or Windows-1252. } Bisher habe ich: String fileName = getFileNameToReadFromUserInput(); InputStream is
6
Antworten
Was ist der Unterschied zwischen UTF-8 und ISO-8859-1? InformationsquelleAutor der Frage Jagadesh | 2011-08-13
3
Antworten
Ich bin auf der Suche für eine kleine C-Bibliothek zum verarbeiten utf8-strings. Speziell, Spaltung, basierend auf unicode-Trennzeichen für die Verwendung mit stemming-algorithmen. Ähnliche Beiträge vorgeschlagen haben: ICU http://www.icu-project.org/ (ich fand es zu sperrig für meine Zwecke auf
2
Antworten
wie der Titel sagt, habe ich ein problem zwischen java und mysql Mysql-DB, Tabellen und Spalten sind in utf8_unicode_ci. Ich habe eine Anwendung, nahm einige Eingaben aus einer xml, und verfassen Sie dann die Abfrage... public String
5
Antworten
Welche der beiden ist die richtige Terminologie? InformationsquelleAutor der Frage moo | 2009-04-30
10
Antworten
Zog ich Daten aus MySQL 4 (Sie waren ursprünglich zu latin2 encoding) MySQL 5 und legen Sie die Kodierung zu utf-8. Es sieht gut aus in phpMyAdminund utf-8 ist okay. Aber es gibt Fragezeichen anstelle von Zeichen
4
Antworten
Will ich Lesen die UTF-8-Eingabe in Perl, egal ob es darum geht von der standard-Eingabe oder aus einer Datei, mit der diamond-operator: while(<>){...}. Also mein Skript sollte aufrufbar sein, in diesen zwei Möglichkeiten, wie gewohnt, geben die
4
Antworten
Ich bin mit dem utf-8-Vs. byte-string hier genannten Probleme: Django Kopfschmerzen mit einfachen nicht-ascii-string Interessiert mich nicht case sensitive matching in der MySQL-Spalten, ich will immer UTF-8-Zeichenfolgen zurückgegeben, da ich finde, es ist unmöglich, damit umzugehen byte-strings
6
Antworten
Ich versuche zu zeigen "iconv", um ein Verzeichnis und alle Dateien werden konvertiert in UTF-8 unabhängig von der aktuellen Codierung Ich bin mit diesem Skript, sondern Sie müssen angeben, welche Codierung Sie gehen AUS. Wie kann ich
12
Antworten
Was sind die Unterschiede zwischen UTF-8, UTF-16 und UTF-32? Ich verstehen, dass Sie alles speichern, Unicode, und dass jeweils eine unterschiedliche Anzahl von bytes zur Darstellung eines Zeichens. Ist es ein Vorteil, die Wahl einen über den
16
Antworten
Weiß jemand, wie man die Codierung in FPDF Paket auf utf-8? Oder zumindest ISO-8859-7 (Griechisch), die Unterstützung von griechischen Buchstaben? Grundsätzlich möchte ich eine pdf-Datei erstellen mit griechischen Zeichen. Anregungen würde helfen. George InformationsquelleAutor der Frage george
6
Antworten
Wie kann ich Lesen Sie ein Unicode-Zeichen (UTF-8) - Datei in wstring(s) auf der Windows-Plattform? InformationsquelleAutor der Frage Abdelwahed | 2011-01-23
11
Antworten
Schreibe ich einen crawler in Ruby (1.9), dass verbraucht viel HTML-Code aus einer Menge von zufälligen Seiten. Beim extrahieren von links, habe ich beschlossen, nur verwenden .scan(/href="(.*?)"/i) statt nokogiri/hpricot (große Beschleunigung). Das problem ist, dass ich jetzt
1
Antworten
C11 und C++11 sowohl die Einführung der uchar.h/cuchar header definieren char16_t und char32_t als explizit 16 und 32 bit breiten Zeichen, Hinzugefügt literal syntax u"" und U"" für das schreiben von strings mit diese Charakter-Typen, zusammen mit
8
Antworten
Kann ich nicht verwenden mkdir zum erstellen von Ordnern mit UTF-8-Zeichen: <?php $dir_name = "Depósito"; mkdir($dir_name); ?> wenn ich surfen Sie diese Ordner in Windows Explorer den Namen des Ordners sieht wie folgt aus: Depósito Was soll
8
Antworten
Ich habe eine ArrayBuffer enthält eine Zeichenfolge kodiert mit UTF-8 und ich kann nicht finden, eine standard-Möglichkeit der Umwandlung von solchen ArrayBuffer in eine JS String (was ich verstehen kodiert mit UTF-16). Ich habe gesehen, das der
30
Antworten
Habe ich dieses sehr einfache Sache, die nur Ausgänge, ein paar Sachen im CSV-format, aber es muss UTF-8 sein. Ich öffnen Sie diese Datei in TextEdit oder TextMate oder Dreamweaver, und es zeigt UTF-8-Zeichen korrekt, aber wenn
4
Antworten
Habe ich verwendet Javax Mail-API zum versenden von E-Mails. Ich bin über ein Kontaktformular zu senden, die Eingabe, das senden einer bestimmten E-Mail. Die email zu senden, ohne Probleme, aber ich bin ein dänischer Mann, und ich
3
Antworten
Ich bin mit ruby 1.9.2 Ich versuche, Parsen einer CSV-Datei enthält einige französische Wörter (z.B. spécifié) und platzieren Sie den Inhalt in eine MySQL-Datenbank. Wenn ich lese die Zeilen aus der CSV-Datei, file_contents = CSV.read("csvfile.csv", col_sep: "$")