Wie zu tun ist, wie groß- / Kleinschreibung und Akzent insensitiv in PostgreSQL und JPA 2?

Ich habe ein Java-EE-Projekt mithilfe von PostgreSQL 9.X und JPA2 (Hibernate-Implementierung).
Wie kann ich die Kraft einer like-Abfrage groß-und Kleinschreibung und keine Unterscheidung nach Akzent?

Ich bin in der Lage, ändern Sie den Zeichensatz der DB, weil es das erste Projekt mit ihm.

Haben Sie versucht, ILIKE?
Sie sind mit Kriterien Abfragen oder JPQL? Siehe auch diese Frage: stackoverflow.com/questions/4580285/...
Siehe auch stackoverflow.com/questions/4218780/...
Ich bin mit Kriterien Abfragen, aber ich kann verwenden, JPQL, wenn nötig. Ich kenne den trick mit der oberen, aber es ist immer Akzent...

InformationsquelleAutor user1180339 | 2012-10-23

5

Im Allgemeinen es gibt keine standard-Weg, um zu schreiben "accent-insensitive" - code, oder zu vergleichen, Wörter für Gleichberechtigung und ignorieren Akzente. Die ganze Idee macht sehr wenig Sinn, da verschiedene Zeichen mit Akzent bedeutet, dass verschiedene Dinge in verschiedenen Sprachen/Dialekten, und Ihre "plain ascii" - Substitutionen/- Erweiterungen variieren je nach Sprache. Bitte tun Sie das nicht; resume und résumé sind verschiedene Wörter, und die situation wird noch schlimmer, wenn man jede language(s) other than English.

Für Fall-Gefühllosigkeit, die Sie verwenden können lower(the_col) like lower('%match_expression') in JPQL. Soweit ich weiß ilike ist nicht unterstützt in JPQL, aber ich habe nicht geprüft der standard um dies zu überprüfen. Es ist gut lesbar, so betrachten nur den Download der JPA2 spec und Lesen es. JPA2 Kriterien bietet Restrictions.ilike für den Zweck. Weder werden normalize/Streifen/ignorieren von Zeichen mit Akzent.

Zum Abisolieren Akzente, etc, werden Sie wahrscheinlich benötigen, um zu verwenden Datenbank-engine bestimmte gespeicherte Funktionen oder native queries. Siehe, zB diese Vorherige Antwort, oder wenn Sie bestimmt zu Ersatz Zeichen mit Akzent mit einem unbetont alternative das PostgreSQL-wiki-Eintrag - aber wieder bitte tun Sie das nicht außer für sehr begrenzte Zwecke wie die Suche nach Orten, wo Worte vielleicht schon "unbetont" durch falsche software oder Benutzer.

InformationsquelleAutor Craig Ringer
1

Wenn die unaccent Erweiterung installiert ist:
```
select unaccent(lower('ãóÊ'));
 unaccent 
----------
 aoe
```
- Ja, aber mit dieser Lösung muss ich eine native Abfrage.
InformationsquelleAutor Clodoaldo Neto

Ich hatte dieses Problem, und ich konnte nicht mit Datenbank-Funktionen. So anstelle habe ich eine REGEX Einschränkung in meinem Kriterien-code:

searchText = unaccent(searchText);
String expression = "firstName ~* '.*" + searchText + ".*'";
Criterion searchCriteria = Restrictions.sqlRestriction(expression);

Dann schrieb ich eine Funktion namens unaccent zu ändern Sie jedes Zeichen in eine oder-Anweisung, zum Beispiel jeden Buchstaben e wird (e|é|è). Eine Abfrage für "Hallo" wird zu "h(e|é|è)llo".

Hier ist die Funktion inspiriert von diesem thread Postgres Akzent unempfindlich WIE die Suche in Rails 3.1 auf Heroku

private String unaccent(String text) {
    String String charactersProcessed = ""; //To avoid doing a replace multiple times.
    String newText = text.toLowerCase();
    text = newText; //Case statement is expecting lowercase.
    for (int i = 0; i < text.length(); i++) {
        char c = text.charAt(i);
        if (charactersProcessed.contains(c + "")) {
            continue; //We have already processed this character.
        }
        String replacement = "";
        switch (c) {
        case '1': {
            replacement = "¹";
            break;
        }
        case '2': {
            replacement = "²";
            break;
        }
        case '3': {
            replacement = "³";
            break;
        }
        case 'a': {
            replacement = "á|à|â|ã|ä|å|ā|ă|ą|À|Á|Â|Ã|Ä|Å|Ā|Ă|Ą|Æ";
            break;
        }
        case 'c': {
            replacement = "ć|č|ç|©|Ć|Č|Ç";
            break;
        }
        case 'd': {
            replacement = "Đ|Ð";
            break;
        }
        case 'e': {
            replacement = "è|é|ê|ё|ë|ē|ĕ|ė|ę|ě|È|Ê|Ë|Ё|Ē|Ĕ|Ė|Ę|Ě|€";
            break;
        }
        case 'g': {
            replacement = "ğ|Ğ";
            break;
        }
        case 'i': {
            replacement = "ı|ì|í|î|ï|ì|ĩ|ī|ĭ|Ì|Í|Î|Ï|Ї|Ì|Ĩ|Ī|Ĭ";
            break;
        }
        case 'l': {
            replacement = "ł|Ł";
            break;
        }
        case 'n': {
            replacement = "ń|ň|ñ|Ń|Ň|Ñ";
            break;
        }
        case 'o': {
            replacement = "ò|ó|ô|õ|ö|ō|ŏ|ő|ø|Ò|Ó|Ô|Õ|Ö|Ō|Ŏ|Ő|Ø|Œ";
            break;
        }
        case 'r': {
            replacement = "ř|®|Ř";
            break;
        }
        case 's': {
            replacement = "š|ş|ș|ß|Š|Ş|Ș";
            break;
        }
        case 'u': {
            replacement = "ù|ú|û|ü|ũ|ū|ŭ|ů|Ù|Ú|Û|Ü|Ũ|Ū|Ŭ|Ů";
            break;
        }
        case 'y': {
            replacement = "ý|ÿ|Ý|Ÿ";
            break;
        }
        case 'z': {
            replacement = "ž|ż|ź|Ž|Ż|Ź";
            break;
        }
        }
        if (!replacement.isEmpty()) {
            charactersProcessed = charactersProcessed + c;
            newText = newText.replace(c + "", "(" + c + "|" + replacement + ")");
        }
    }

    return newText;
}

Bitte, Sie können verwenden Sie diese methode für public static String unaccent(String text) { return Normalizer.normalisieren(text, Normalizer.Form.NFD).replaceAll("[^\\p{ASCII}]", ""); }
Danke, wenn ich missverstanden das Ziel dieser Funktion Normalizer.normalize(text, Normalizer.Form.NFD).replaceAll("[^\\p{ASCII}]", "") scheint es, dass es normalisiert ist ein text in der Java-code. Die Notwendigkeit hier ist zu normalisieren, ist es in PostgreSQL. Die unaccent-Funktion, die ich schrieb, drehen Sie diese Zeichenfolge "hello" dieser "h(è|é|ê|ё|ë|ē|ĕ|ė|ę|ě|È|Ê|Ë|Ё|Ē|Ĕ|Ė|Ę|Ě|€)ll(ò|ó|ô|õ|ö|ō|ŏ|ő|ø|Ò|Ó|Ô|Õ|Ö|Ō|Ŏ|Ő|Ø|Œ)"
Die Lösung ist nicht optimal, außer für die Nutzung von native SQL.
Es ist möglich, eine ähnliche SQL-native-Funktion, aber in meinem Fall konnte ich nicht.
können Sie Tricks durch die, die konvertieren den String alphabet nach alphabet (nacheinander) und stellen Sie eine Verbindung zwischen allen Ergebnissen.
auf jeden Fall, keine Ahnung, warum ich das nicht tun!
Da kann ich nicht SQL native für die meisten Suchfunktionen. Akzent-und Kleinschreibung wird ignoriert.

InformationsquelleAutor motus

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.