Ungefähre string-matching

Ich weiß, diese Frage wurde gebeten, eine Menge Zeit.
Ich möchte einen Vorschlag machen, welcher Algorithmus ist geeignet für approximate string matching.

Die Anwendung ist speziell für Unternehmen name matching nur und sonst nichts.

Die größte Herausforderung ist wohl die Firma end-name-Teil und kurzen Namen Teil
Beispiel:
1. companyA pty ltd vs companyA pty. ltd. vs companyA
2. WES Engineering vs W. E. S. Engineering (sehr Seltenes Ereignis)

Denkst du Levenshtein Edit-Distanz ist angemessen?

Ich bin mit C#

Grüße,
Max

  • Ich denke, ich werde entfernen Sie alle dot char und verwenden Sie dann die levenshtein-Distanz danach. Nur eine Anmerkung, ich fand einen anderen Algorithmus, der ähnlich ist, aber schneller als levenshtein, der Typ, den Namen der Algorithmus sift3. Sehr interessant.
InformationsquelleAutor Max | 2010-11-18
Schreibe einen Kommentar