Algorithmus zum erkennen von ähnlichen Dokumenten in einem python-Skript

Schreiben brauche ich ein Modul zum erkennen von ähnlichen Dokumenten. Ich habe gelesen, dass viele Papiere von Fingerabdrücken von Dokumenten-Techniken und andere, aber ich weiß nicht, wie code zu schreiben, oder die Implementierung einer solchen Lösung. Der Algorithmus arbeiten soll für die chinesischen, japanischen, englischen und deutschen Sprache oder sprachunabhängig. Wie kann ich dies erreichen?

InformationsquelleAutor user17451 | 2008-09-19
Schreibe einen Kommentar