Tag: character-properties

Charakter-Eigenschaften sind eine Reihe von Parametern geliefert, die durch den Unicode-Standard. Für jedes Zeichen, enthalten in es, viele Eigenschaften angegeben, in Bezug auf Prozesse oder algorithmen, die Sie interpretieren, um zu implementieren, die den Charakter Verhalten.

Lateinische Zeichen überprüfen

Anzahl der Antworten 3 Antworten
gibt es einige ähnliche Fragen gibt, aber keine, die sind ziemlich die gleichen, oder haben Sie eine Antwort, die für mich funktioniert. Brauche ich eine javascript-Funktion, die überprüft, ob ein text-Feld enthält alle gültigen lateinischen Zeichen, also

Was ist der {L} Unicode-Kategorie?

Anzahl der Antworten 2 Antworten
Stieß ich auf einige reguläre Ausdrücke enthalten [^\\p{L}]. Ich verstehe, dass dies mit irgendeiner form von Unicode-Kategorie ist, aber wenn ich überprüft die Dokumentation, ich fand nur die folgende "L" Kategorien: Lu Uppercase letter UPPERCASE_LETTER Ll Lowercase

Python regex-matching-Unicode-Eigenschaften

Anzahl der Antworten 6 Antworten
Perl und einige andere aktuelle regex-engines unterstützen die Unicode-Eigenschaften, wie etwa die Kategorie, in einer regex. E. g. in Perl können Sie \p{Ll} übereinstimmung einer beliebigen Kleinbuchstaben, oder p{Zs} für jeden Raum-Trenner. Ich sehe keine Unterstützung für

Macht \w entsprechen alle alphanumerischen Zeichen definiert der Unicode-standard?

Anzahl der Antworten 3 Antworten
Hat Perl \w mit allen alphanumerischen Zeichen definiert der Unicode-standard? Beispielsweise \w mit allen (sagen), Chinesisch und Russisch alphanumerische Zeichen? Schrieb ich ein einfaches test-Skript (siehe unten), was darauf hindeutet, dass \w tatsächlich übereinstimmen "wie erwartet" für

Gibt Es eine Möglichkeit, dass mit einer Unicode nicht-Alphabetische Zeichen?

Anzahl der Antworten 2 Antworten
Ich habe einige Dokumente, die ging durch OCR-Konvertierung von PDF in HTML. Weil dem so ist, aufgezogen mit viel random-unicode Satzzeichen, wo der Konverter Durcheinander (also Ellipsen, etc...). Sie sind auch richtig, haben eine Reihe von Nicht-englischen,

Passende Unicode-Zeichen in PCRE/PHP

Anzahl der Antworten 3 Antworten
Ich bin versucht, zu schreiben, einigermaßen permissiv-validator für Namen in PHP, und mein Erster Versuch besteht aus folgenden Muster: //unicode letters, apostrophe, hyphen, space $namePattern = "/^([\\p{L}'\\- ])+$/"; Dies ist schließlich vergangen, um einen Anruf zu preg_match().

Javascript + Unicode-regexes

Anzahl der Antworten 8 Antworten
Wie kann ich die Verwendung der Unicode-aware reguläre Ausdrücke in JavaScript? Zum Beispiel sollte es so etwas wie \w, die sich mit jeder code-point in Buchstaben oder Markierungen, Kategorie (nicht nur für ASCII), und hoffentlich haben Sie

Wie erstelle ich eine Perl-regex passt nicht-alphanumerische Zeichen außer Leerzeichen?

Anzahl der Antworten 3 Antworten
Habe ich ein Perl-regex /\W/i für alle nicht-alphanumerischen Zeichen, aber es passt auch Räume, die ich ignorieren wollen. Wie bekomme ich das mit nicht-alphanumerischen Zeichen außer Leerzeichen? InformationsquelleAutor Joe Schmoe | 2010-10-20

Java regex für ein beliebiges symbol?

Anzahl der Antworten 2 Antworten
Gibt es eine regex die akzeptiert, dass jedes symbol? EDIT: um Zu verdeutlichen, was ich Suche.. ich will bauen, eine regex, die akzeptiert eine BELIEBIGE Anzahl von Leerzeichen und die es enthalten muss, mindestens 1 symbol (e.g

Ersetzen Der Unicode-Steuerzeichen

Anzahl der Antworten 1 Antworten
Brauche ich, um zu ersetzen Sie alle Sonder-control Zeichen in einem string in Java. Möchte ich Euch bitten, die Google maps API v3, Google scheint nicht, wie diese Zeichen. Beispiel: http://www.google.com/maps/api/geocode/json?sensor=false&Adresse=NEW%20YORK%C2%8F Diese URL enthält dieses Zeichen: http://www.fileformat.info/info/unicode/char/008f/index.htm

Regex für Namen mit Sonderzeichen (Unicode)

Anzahl der Antworten 7 Antworten
Okay, ich habe gelesen über regex den ganzen Tag jetzt, und immer noch nicht es richtig zu verstehen. Was ich versuche zu tun ist, überprüfen Sie einen Namen, aber die Funktionen, die ich finden kann für dieses

So überprüfen Sie beide Chinesisch (unicode) und englischer name?

Anzahl der Antworten 5 Antworten
Ich habe eine Mehrsprachige website (Chinesisch und Englisch). Ich gerne validieren ein text-Feld (Feld name) in javascript. Ich habe den folgenden code so weit. var chkName = /^[characters]{1,20}$/; if( chkName.test("[name value goes here]") ){ alert("validated"); } das

Matching (z.B.) ein Unicode-Zeichen mit Java regexps

Anzahl der Antworten 3 Antworten
Gibt es viele Fragen und Antworten hier auf StackOverflow, die davon ausgehen, ein "Buchstabe" zugeordnet werden kann, in einem regexp-von [a-zA-Z]. Aber mit Unicode gibt es viele weitere Zeichen, dass die meisten Menschen betrachten würde, wie einen

Trimmen von Unicode-Leerzeichen in PHP 5.2

Anzahl der Antworten 6 Antworten
Wie kann ich trimmen string(6) " page"wo das erste Leerzeichen ist ein 0xc2a0 non-breaking space? Ich habe versucht trim() und preg_match('/^\s*(.*)\s*$/u', $key, $m);. Andere Frage: Wie kann ich zuverlässig kopieren Sie diese Zeichen? Sie scheinen konvertiert zu

Regex und Unicode

Anzahl der Antworten 4 Antworten
Ich habe ein Skript Parsen der Dateinamen von TV-Episoden zeigen.name.s01e02.avi-Beispiel), greift die episode mit dem Namen (aus der www.thetvdb.com API) automatisch und benennt Sie in etwas schöner (Name der Show - [01x02].avi) Das Skript funktioniert, das heißt,

Unicode-Entsprechungen für \ w und \ b in regulären Java-Ausdrücken?

Anzahl der Antworten 3 Antworten
Vielen modernen regex-Implementierungen interpretieren die \w Charakter-Klasse Kürzel wie "beliebiger Buchstabe, eine Ziffer, oder eine Verbindung Interpunktion" (in der Regel: den Unterstrich). So ein regex wie \w+ entspricht Wörter wie helloélèveGOÄ_432 oder gefräßig. Leider Java nicht. In

übereinstimmende Unicode-Zeichen in regulären Python-Ausdrücken

Anzahl der Antworten 3 Antworten
Habe ich gelesen, die durch die anderen Fragen auf Stackoverflow, aber immer noch nicht näher. Sorry, wenn dies bereits beantwortet, aber ich habe nichts vorgeschlagen, dort zu arbeiten. >>> import re >>> m = re.match(r'^/by_tag/(?P<tag>\w+)/(?P<filename>(\w|[.,!#%{}()@])+)$', '/by_tag/xmas/xmas1.jpg') >>>

Python und regulärer Ausdruck mit Unicode

Anzahl der Antworten 2 Antworten
Ich löschen müssen einige Unicode-Zeichen aus dem string 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ' Ich weiß, Sie existieren hier sicher. Ich habe versucht: re.sub('([\u064B-\u0652\u06D4\u0670\u0674\u06D5-\u06ED]+)', '', 'بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ') aber es funktioniert nicht. String bleibt gleich. Was mache ich

Wie kyrillische Zeichen mit einem regulären Ausdruck übereinstimmen

Anzahl der Antworten 6 Antworten
Wie kann ich mit Französisch-und Russisch-kyrillische alphabet Zeichen mit einem regulären Ausdruck? Ich möchte nur die Buchstaben, keine zahlen oder Sonderzeichen. Jetzt habe ich [A-Za-z] Kommentar zu dem Problem Schauen Sie in diese Frage: Regex und unicode