Tag: non-ascii-characters
ASCII steht für „American Standard Code for Information Interchange‘. ASCII ist eine Zeichencodierung System basiert auf der Reihenfolge des englischen Alphabets. ASCII enthält nur Definitionen für 128 Zeichen, zahlreiche andere Kodierungsverfahren erstellt wurden, enthalten Zeichen aus anderen Alphabeten und anderen Symbolen.
1
Antworten
Habe ich eine kleine konsolenbasierte Anwendung, mit der Physik lösen von Gleichungen. Ich bin versuchen, um den Benutzer zu Fragen, wenn Sie wollen, finden Sie die ΔV in einer bestimmten situation, aber ich kann nicht herausfinden, wie
4
Antworten
Folgende code funktioniert einwandfrei: from jinja2 import Template mylist = ['some text \xc3'] template = Template('{{ list }}') print template.render(list=mylist) Wenn ich es ausführen, Ausgänge: ['some text \xc3'] Doch, wenn ich versuche, drucken Sie die aktuelle Liste
1
Antworten
Arbeite ich mit verschiedenen Artikeln und das problem das ich habe ist, dass verschiedene Autoren verwenden unterschiedliche Zeichen für Zeichen. Beispielsweise mehrere Dokumente, die ich derzeit arbeite, müssen mit Zeichen wie: \x91 \x92 \x{2018} \x{2019} Und alle
4
Antworten
Gibt es eine routine zur Verfügung, die in Delphi 2007 zu konvertieren die Zeichen in der großen Bandbreite der ANSI-Tabelle (>127) zu Ihrer Entsprechung in reinen ASCII - (<=127) entsprechend einem locale (codepage)? Ich weiß, dass manche
3
Antworten
Ich versuche, diese Funktion zu verwenden: import unicodedata def remove_accents(input_str): nkfd_form = unicodedata.normalize('NFKD', unicode(input_str)) return u"".join([c for c in nkfd_form if not unicodedata.combining(c)]) in den folgenden code (die öffnet und liest Dateien mit nicht-ASCII-strings). Aber ich bin
1
Antworten
Ich versuche, drucken ein Gedicht aus dem Lyrik-Stiftung täglichen Gedicht RSS-feed mit einem thermal-Drucker unterstützt, die eine Kodierung von CP437. Das bedeutet, dass ich übersetzen müssen einige Zeichen; in diesem Fall ist ein en-dash, um einen Bindestrich.
2
Antworten
Schreiben einer Datei-Dienstprogramm zum entfernen alle nicht-ASCII-Zeichen aus Dateien. Ich habe diese Regex: Regex rgx = new Regex(@"[^\u0000-\u007F]"); Welche gut funktioniert. Aber leider, ich habe entdeckt, dass einige dumme Menschen mit einem rechten Winkel () als Trennzeichen
7
Antworten
Ich suchte eine Menge, aber nirgendwo ist es geschrieben, wie entfernen von nicht-ASCII-Zeichen mit Notepad++. Muss ich wissen, was Befehl zu schreiben, suchen-und-ersetzen (mit Bild wäre Super). Wenn ich will, um eine white-Liste und Lesezeichen alle ASCII-Wörter/Zeilen,
6
Antworten
Bekomme ich Benutzereingaben, einschließlich nicht-ASCII-Zeichen und nicht druckbare Zeichen, wie \xc2d \xa0 \xe7 \xc3\ufffdd \xc3\ufffdd \xc2\xa0 \xc3\xa7 \xa0\xa0 Beispiel: email :
[email protected]\xa0\xa0 street : 123 Main St.\xc2\xa0 gewünschte Ausgabe: email :
[email protected] street : 123 Main St.
1
Antworten
Möchte ich für die überprüfung eines Strings mit einem Muster, dass nur Buchstaben enthalten (wie Buchstaben mit Akzenten). Hier ist der code, den ich verwenden, und es gibt immer "nok". Ich weiß nicht, was ich falsch mache,
1
Antworten
Meine bash-installation auf cygwin nicht handhaben akzentuierte Buchstaben richtig. Ich habe versucht, das hinzufügen set input-meta on # to accept 8-bit characters set output-meta on # to show 8-bit characters set convert-meta on # to show it
3
Antworten
Bin ich über ein sehr einfaches sed-Skript zum entfernen von Kommentaren : sed -e 's/--.*$//' Es funktioniert Super, bis nicht-ascii-Zeichen in einem Kommentar, z.B.: -- °. Diese Linie entspricht nicht dem regulären Ausdruck und wird nicht ersetzt.
2
Antworten
Derzeit nutze ich wieder.findall zu finden und zu isolieren, Wörter nach dem ' # ' - Zeichen für die hash-tags in einem string: hashtags = re.findall(r'#([A-Za-z0-9_]+)', str1) Er sucht str1 und sucht nach allen den hashtags. Dies
7
Antworten
Brauche ich ein Regex in einem C# - Programm. Habe ich zu erfassen, ein name einer Datei mit einer bestimmten Struktur. Verwendet habe ich das \w char-Klasse, aber das problem ist, dass diese Klasse nicht mit irgendeinem
6
Antworten
Wie kann ich entfernen Sie alle Sonderzeichen, die nicht fallen unter ASCII-Kategorie in VBA? Diese sind einige der Symbole, die angezeigt wird in meinem string, die beseitigt werden müssen. Œ Œ Š Š Ÿ ƒ Es gibt
3
Antworten
Ich bin ein Anfänger-Programmierer versucht, schreiben Sie ein python-script, das zufällige Passwörter generiert. Jedoch bekomme ich immer einen nicht-ASCII-Zeichen Fehler, obwohl ich erklärte, die Codierung #utf-8, wie erwähnt, in einer anderen, ähnlichen Frage hier in Stack-Überlauf. Dies
5
Antworten
Ich habe eine Datei in Spanisch, so ist es voll von Zeichen wie: á é í ó ú ñ Ñ Á É Í Ó Ú Ich habe die Datei gelesen, so dass ich dies tun: fr =
2
Antworten
>>> teststring = 'aõ' >>> type(teststring) <type 'str'> >>> teststring 'a\xf5' >>> print teststring aõ >>> teststring.decode("ascii", "ignore") u'a' >>> teststring.decode("ascii", "ignore").encode("ascii") 'a' das ist, was ich wirklich wollte, es zu speichern, intern wie Entferne ich nicht-ascii-Zeichen.
4
Antworten
Möchte ich entfernen, die nicht-ascii-chars, das aus einer Datei. Ich habe bereits versucht, diese vielen regexs. sed -e 's/[\d00-\d128]//g' # not working cat /bin/mkdir | sed -e 's/[\x00-\x7F]//g' >/tmp/aa aber diese Datei enthält auch einige nicht-ascii-chars. [root@asssdsada
3
Antworten
Ich habe einen text, der Zeichen enthält, z.B. "\xaf", "\xbe", die, so wie ich es verstehe aus diese Frage, sind ASCII-codierte Zeichen. Möchte ich umwandeln in Python, um Ihre UTF-8-äquivalente. Die üblichen string.encode("utf-8") wirft UnicodeDecodeError. Gibt es
6
Antworten
Habe ich einige Texte in Französisch (mit Akzent-Zeichen wie "é"), gespeichert in einer MySQL-Tabelle, deren collation utf8_unicode_ci (sowohl die Tabelle und die Spalten), will ich die Ausgabe auf eine HTML5-Seite. Die HTML-Seite charset ist UTF-8< meta charset="utf-8"
2
Antworten
Ich muss ein Wort wie 'César' für die regex wie diese /^cesar/i. Ist es eine option, wie /i zu konfigurieren, die regex so ignoriert die akute Akzente?. Oder ist die einzige Lösung, um einen regex verwenden, wie
9
Antworten
Bin ich mit einer AJAX-basierten Suche nach Namen, die ein Benutzer sucht in einer text-box. Ich bin die Annahme, dass alle Namen in der Datenbank werden transliteriert zu europäischen Alphabeten (d.h. kein Kyrillisch, Japanisch, Chinesisch). Allerdings, die
2
Antworten
Ich versuche zu importieren einer CSV -, mit diesem code: import csv import sys def load_csv(filename): # Open file for reading file = open(filename, 'r') # Read in file return csv.reader(file, delimiter=',', quotechar='\n') def main(argv): csv_file =
5
Antworten
Ich versuche zu importieren einer CSV-codierte als OEM-866 (Kyrillisch Zeichensatz) in R unter Windows. Ich habe auch eine Kopie, die umgewandelt wurde in UTF-8 w/o BOM. Diese beiden Dateien sind lesbar für alle anderen Anwendungen auf meinem
2
Antworten
Ich versuche zu finden, die Werte, die meinem lokalen system weist Sie auf die Pfeil-Schlüssel, die speziell in Python. Ich benutze folgende script um dies zu tun: import sys,tty,termios class _Getch: def __call__(self): fd = sys.stdin.fileno() old_settings
2
Antworten
Ich habe ein Bündel von csv Dateien, lese ich in R und darunter in einem Paket/data-Ordner in .rdata - format. Leider nicht-ASCII-Zeichen in den Daten scheitern Sie die Prüfung. Die tools Paket hat zwei Funktionen zu überprüfen,
4
Antworten
Wie Schreibe ich nichtASCII Zeichen mit echo? Gibt es eine escape-Sequenz, wie \012 oder sowas? Ich möchte append-ASCII-Zeichen in eine Datei mit: echo ?? >> file InformationsquelleAutor der Frage flybywire | 2009-03-18
11
Antworten
Ich versuche zu ersetzen Sonderzeichen mit den normalen Ersatz. Unten ist das, was ich bin derzeit dabei. $string = "Éric Cantona"; $strict = strtolower($string); echo "After Lower: ".$strict; $patterns[0] = '/[á|â|à|å|ä]/'; $patterns[1] = '/[ð|é|ê|è|ë]/'; $patterns[2] = '/[í|î|ì|ï]/';
5
Antworten
var str="INFO] :谷���新道, ひば���ヶ丘2丁���, ひばりヶ���, 東久留米市 (Higashikurume)"; und ich entfernen müssen alle nicht-ascii-Zeichen aus string, Mittel str enthalten nur "INFO] (Higashikurume)"; InformationsquelleAutor der Frage Dev | 2013-12-31
2
Antworten
Habe ich ein schema in "utf8 -- UTF-8 Unicode" - Zeichensatz und eine Sortierung von "utf8_spanish_ci". Alle innerhalb von Tabellen sind InnoDB-mit dem gleichen Zeichensatz und Sortierung wie bereits erwähnt. Hier kommt das problem: mit einer Abfrage
7
Antworten
suchte ich eine Menge, aber nicht, wo Ihr geschrieben, wie entfernen von nicht-ASCII-Zeichen, die von notepad+?? muss ich wissen, was Befehl zu schreiben, suchen-und-ersetzen (mit Bild wäre Super) wenn ich will, um eine white-Liste und Lesezeichen alle
4
Antworten
Ich versuche zu pass-big-strings von zufälligen html durch reguläre Ausdrücke und meine Python 2.6 Skript Würgen auf dieser: UnicodeEncodeError: 'ascii' codec can T encode character Ich verfolgte es zurück, um eine Marke Hochgestellt am Ende dieses Wortes:
3
Antworten
Habe ich gelesen, die durch die anderen Fragen auf Stackoverflow, aber immer noch nicht näher. Sorry, wenn dies bereits beantwortet, aber ich habe nichts vorgeschlagen, dort zu arbeiten. >>> import re >>> m = re.match(r'^/by_tag/(?P<tag>\w+)/(?P<filename>(\w|[.,!#%{}()@])+)$', '/by_tag/xmas/xmas1.jpg') >>>
8
Antworten
Wie kann man Zeilen mit nicht-ASCII-Zeichen zurückgegeben werden, die mit SQL Server? Wenn Sie zeigen können, wie es für eine Spalte wäre Super. Bin ich etwas wie diese jetzt, aber es funktioniert nicht select * from Staging.APARMRE1
5
Antworten
Also diese web-Seite ist das rendering mit diese Symbole und Sie finden sich auf dieser website/- Applikation, jedoch auf keine anderen Seiten. Kann mir jemand sagen 1) welches symbol ist 2) warum zeigt Sie nur in einem
8
Antworten
Ich brauche zum abrufen von Daten aus einer URL mit nicht-ascii-Zeichen, aber urllib2.urlopen sich weigert, öffnen Sie die Ressource und erhöht: UnicodeEncodeError: 'ascii' codec can't encode character u'\u0131' in position 26: ordinal not in range(128) Weiß ich