MySQL passenden unicode-Zeichen mit ascii-version

Ich bin mit MySQL 5.1.50 und haben eine Tabelle, die wie folgt aussieht:

organizations | CREATE TABLE `organizations` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` text CHARACTER SET utf8 COLLATE utf8_unicode_ci NOT NULL,
  `url` text CHARACTER SET utf8 COLLATE utf8_unicode_ci DEFAULT NULL,
  `phone` varchar(20) CHARACTER SET utf8 COLLATE utf8_unicode_ci DEFAULT NULL,
  `timestamp` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`),
  KEY `id` (`id`)
) ENGINE=MyISAM AUTO_INCREMENT=25837 DEFAULT CHARSET=utf8 |

Das problem das ich habe ist, dass MySQL passenden unicode-Zeichen mit ascii-Versionen. Zum Beispiel, wenn ich Suche für ein Wort enthält ein 'é', es wird mit dem gleichen Wort, das ein 'e' statt, und Umgekehrt:

mysql> SET NAMES utf8;
Query OK, 0 rows affected (0.00 sec)

mysql> SELECT id, name FROM `organizations` WHERE `name` = 'Universite de Montreal';
    +-------+-------------------------+
| id    | name                    |
+-------+-------------------------+
| 16973 | Université de Montreal  |
+-------+-------------------------+
1 row in set (0.01 sec)

Bekomme ich diese Ergebnisse sowohl von PHP und die Kommandozeile Konsole. Wie bekomme ich exakte übereinstimmungen aus meinem SELECT-Abfragen?

Dank!

InformationsquelleAutor user825466 | 2011-07-01

12

Die Sie angegeben name Spalte als text CHARACTER SET utf8 COLLATE utf8_unicode_ci was sagt MySQL zu betrachten e und é als gleichwertig in passenden und Sortieren. Diese Sortierung und utf8_general_ci beide machen eine Menge Dinge entspricht.

http://www.collation-charts.org/ ist eine großartige Ressource, wenn Sie lernen, wie Sie die charts Lesen, das ist ziemlich einfach.

Wenn Sie möchten, e und é etc. um als unterschiedlich betrachtet werden, dann müssen Sie wählen Sie eine andere Sortierung. Finden Sie heraus, was Sortierungen werden auf dem server (vorausgesetzt, Sie beschränkt sich auf die UTF-8-Codierung):
```
mysql> show collation like 'utf8%';
```
Und wählen Sie mit Hilfe der Sortierung charts als Referenz.

Noch eine spezielle Sortierung ist utf8_bin im die es keine äquivalenzen, es ist eine binäre Entsprechung.

Nur MySQL-Unicode-Sortierungen, ich bin mir dessen bewusst, dass die nicht sprachspezifisch sind utf8_unicode_ci, utf8_general_ci und utf8_bin. Sie sind ziemlich seltsam. Der eigentliche Zweck der Sortierung ist, um das computer-Spiel und die Art, wie eine person von irgendwo erwarten würde. Ungarische und türkische Wörterbücher haben Ihre Einträge geordnet nach unterschiedlichen Regeln. Angeben einer Sortierung ermöglicht die Sortierung und entsprechen gemäß den lokalen Vorschriften.

Beispielsweise scheint es Dänen betrachten e und é gleichwertige, aber die Isländer nicht:
```
mysql> select _utf8'e' collate utf8_danish_ci
    -> = _utf8'é' collate utf8_danish_ci as equal;
+-------+
| equal |
+-------+
|     1 |
+-------+

mysql> select _utf8'e' collate utf8_icelandic_ci
    -> = _utf8'é' collate utf8_icelandic_ci as equal;
+-------+
| equal |
+-------+
|     0 |
+-------+
```
Einem anderen handy trick ist, füllen Sie eine ein-Spalten-Tabelle mit einer Reihe von Zeichen, die Sie interessiert sind (es ist einfacher, aus einem Skript) und dann MySQL kann Ihnen sagen, die äquivalenzen:
```
mysql> create table t (c char(1) character set utf8);
mysql> insert into t values ('a'), ('ä'), ('á');
mysql> select group_concat(c) from t group by c collate utf8_icelandic_ci;
+-----------------+
| group_concat(c) |
+-----------------+
| a               |
| á               |
| ä               |
+-----------------+

mysql> select group_concat(c) from t group by c collate utf8_danish_ci;
+-----------------+
| group_concat(c) |
+-----------------+
| a,á             |
| ä               |
+-----------------+

mysql> select group_concat(c) from t group by c collate utf8_general_ci;
+-----------------+
| group_concat(c) |
+-----------------+
| a,ä,á           |
+-----------------+
```
- Vielen Dank für die Gründliche Antwort!
- Wow!!! Sie erklärt sehr schön! Dank so viel.
InformationsquelleAutor
5

Natürlich, dies wird der Arbeit:
```
SELECT * FROM table WHERE name LIKE BINARY 'namé';
```
- Ich habe versucht, alle Arten von Sortierung Varianten und " %º%' (Ordnungszahl Kennzeichen, kein Grad-symbol ( ° ) gehalten übereinstimmende Dinge, die es nicht sollte. Sah dies und versuchte es und es funktionierte wie ein Charme. Danke!
InformationsquelleAutor

eine Sache, die Sie tun können, mit der Sie Ihre query-string Dekodieren...

< ?php
$query="उनकी"; // some Unicode characters
$query=urldecode($query);
$qry= "SELECT * FROM table WHERE books LIKE '%$query%'";

//rest of the code....
?>

es funktionierte für mich. 🙂

InformationsquelleAutor Amit Kumar Khare

1

Den Sie gesetzt haben, Sortierung utf8_unicode_ci das entspricht akzentuiert lateinischen Zeichen. Weitere Informationen finden Sie hier.
- user825466 setzten COLLATE utf8_unicode_ci - und dies ist der Grund, warum MySQL gibt Spiele wie in dem Beispiel, das er oder Sie NICHT will.
- Ja, ich wurde erklärt, zu der Frage, Schriftsteller warum Sie sahen die Sortierung. Mein Lesen der Frage war, dass Sie waren nicht bewusst.
- Sie sind beide Recht - ich wusste nicht, warum, und ich wollte auch nicht, dass es geschehen wird. Ich landete Codierung, um es mit PHP, aber wenn die Notwendigkeit entsteht in der Zukunft ich ' ll geben Sie die Sortierung in der SELECT-Anweisung. Danke.
InformationsquelleAutor borrible
0

Fand ich heraus, dass man das angeforderte Ergebnis mit REGEXP
```
SELECT * FROM table WHERE name REGEXP 'namé';
```
Aber nicht helfen, wenn Sie versuchen, die Gruppe genau mit Namen.

InformationsquelleAutor Zeal

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.