Kann Sortieren von japanische kanji-Wörter, die programmgesteuert ausgeführt werden?

Ich habe vor kurzem entdeckt, zu meinem Erstaunen (da ich noch nie wirklich darüber nachgedacht, bevor), Maschinen-Sortieren von japanische Eigennamen ist offenbar nicht möglich.

Arbeite ich an einer Anwendung, muss der Benutzer wählen Sie ein Krankenhaus aus einem 3-Menü-Schnittstelle. Das erste Menü ist der Präfektur, der zweite ist der Name der Stadt, und die Dritte ist Krankenhaus. Jedes Menü sortiert werden sollen, wie Sie vielleicht erwarten, so dass die Nutzer finden, was Sie wollen in das Menü.

Lassen Sie mich skizzieren, was ich gefunden habe, als Präambel zu meiner Frage:

  1. Die erwartete Sortierreihenfolge für japanische Wörter auf Ihre Aussprache. Kanji haben keine inhärente Reihenfolge (es gibt zig-Tausende von Kanji in Gebrauch), aber der japanische phonetische syllabaries haben einen Auftrag: あ、い、う、え、お、か、き、く、け、こ... und auf der fünfzig traditionellen verschiedene Klänge (ein paar von denen sind veraltet in der modernen japanischen). Diese Sortierreihenfolge genannt 五十音順 (gojuu auf jun , oder '50-sound-order').

  2. Daher, Kanji-Wörter in derselben Reihenfolge sortiert wie Sie sein würde, wenn Sie geschrieben wurden, in hiragana. (Sie können ein einzelnes kanji-Wort im phonetischen hiragana im japanischen.)

  3. Der Clou: es gibt keine kanonische Möglichkeit zum bestimmen der Aussprache eines Wortes, geschrieben in kanji. Man weiß ja nie. Einige kanji haben zehn oder mehr verschiedene Aussprache, je nachdem, das Wort. Viele gemeinsame Wörter in das Wörterbuch, und ich könnte wahrscheinlich den hack gemeinsam einen Weg zu suchen, bis Sie von einem der kostenlosen Wörterbuch-Datenbanken, aber Eigennamen (z.B. Krankenhaus-Namen) sind nicht im Wörterbuch.

So, in meiner Anwendung habe ich eine Liste von jeder Präfektur, Stadt und hospital in Japan. Um die Sortierung dieser Listen, die eine Voraussetzung ist, brauche ich eine passende Liste von jeder dieser Namen in phonetischer form (kana).

Ich kann nicht kommen mit nichts anderes als die Zahlung jemanden, der fließend Japanisch (ich bin nur so-so) manuell transkribieren Sie Sie. Bevor ich das tun obwohl:

  • Ist es möglich, dass ich bin Total high on fire, und gibt es eigentlich eine Möglichkeit, das zu tun diese Sortierung ohne meine eigene Zuordnungen von kanji Wörter an die phonetischen Lesungen, das habe ich irgendwie übersehen?

  • Gibt es eine öffentlich zugängliche Kartierung der Präfektur/Stadt-Namen, von der Regierung oder so? Das reduziert die manuelle Zuordnung würde ich tun müssen, um nur Krankenhaus Namen.

  • Hat jemand andere Ratschläge, wie man zur Lösung dieses Problems? Jede Programmiersprache ist in Ordnung-ich arbeite mit Ruby on Rails, aber ich würde mich freuen, wenn ich könnte einfach ein Programm schreiben, dass würde die kanji-Eingabe (sagen, 40.000 Eigennamen) und geben dann die phonetischen Repräsentationen als Daten, die konnte ich importieren in meine Rails-app.

宜しくお願いします。

InformationsquelleAutor Mason | 2011-02-04
Schreibe einen Kommentar