vergleichen Sie zwei pdf-Dateien (Ansatz) unter Verwendung der java

schreiben brauche ich eine java-Klasse, vergleicht zwei pdf-Dateien und zeigt die Unterschiede(Unterschiede in text/position/schriftart)
über irgendeine Art der Hervorhebung.
mein Erster Ansatz war die Verwendung pdfbox zum Parsen der Datei mit pdfbox und speichern Sie den extrahierten text mithilfe einiger Daten-Struktur, die mir helfen würde, zu vergleichen.
Gibt es eine java-Bibliothek, können extrahieren Sie den text,die Formatierung beibehalten werden,helfen Sie mir mit index und Vergleich.Kann ich mit tika/google-diff-Spiel für diese.
tika extrahiert text in form von xhtml, aber wie Vergleiche ich zwei xhtml-Dateien?

InformationsquelleAutor Alvin | 2013-08-14
Schreibe einen Kommentar