Lesen einer Tabelle oder Zelle mit Wert in einer pdf-Datei mit java?

Ich durchgemacht habe Java und PDF-Foren zu extrahieren, die einen text-Wert aus der Tabelle in einer pdf-Datei, aber konnte Sie nicht finden keine Lösung, außer JPedal (Es ist nicht opensource und lizenziert).

So, ich würde gerne wissen, jede opensource API ' s wie pdfbox, itext, um das gleiche Ergebnis zu erzielen wie JPedal.

Ref. Beispiel:

Lesen einer Tabelle oder Zelle mit Wert in einer pdf-Datei mit java?

  • Ich erinnere mich, mit einer kostenlosen Bibliothek mit dem Namen iText vor vielen Monden... itextpdf.com
  • iText lizensiert als open source zu. Siehe Ist iText-Java-Bibliothek, die kostenlos oder irgendwelche Gebühren zu zahlen? für mehr info. Nachdem dies gesagt ist, müssen Sie die Antwort auf diese Gegenfrage, bevor jemand Ihnen helfen kann: ist das PDF ein Tagged PDF ist oder nicht? Wenn nicht, es gibt keine Tabelle in der PDF-Datei. Uhr dieses video um mehr zu erfahren über die Struktur. Wo Ihre menschlichen Augen können sehen, ein Tisch, eine Maschine kann nur sehen, Linien und Zeichen, ohne irgendeine Struktur.
  • Wie Sie den text mit dem Wert aus der Tabelle in einer pdf-Datei?
  • Indem wir die X-und Y-Koordinaten, auf diese Weise JPedal implementiert die Logik.
  • Das ist möglich für andere auch.
InformationsquelleAutor sgelle | 2015-02-02
Schreibe einen Kommentar