Konvertieren von PDF in HTML-Datei Java-API
Möchte ich eine pdf-Datei konvertieren, um html-Datei mit java-Applikation. Die PDF-Datei enthält die Bilder , Texte usw. Nicht jeder weiß, einen guten java-API? (bitte nicht schlagen Aspose).
Ich habe versucht, Apache PDFBox aber nicht zufrieden
Ich kann nicht vorschlagen, eine Bibliothek, aber einige Allgemeine Ratschläge: PDF zu HTML ist nicht trivial. Sie sind zwei sehr verschiedene Formate und Konvertierung hängt stark von der Qualität und Struktur der PDF-Datei. Allein die Gewinnung der text in der richtigen Reihenfolge, kann schwierig sein. Geschweige denn die Formatierung und das layout. Oft eine manuelle Gespräch wird die beste praktische Lösung. Kann sein das größere Bild würde helfen, geben ausführliche Hilfe: Wie viele PDFs? Hast du Sie selbst machen? Oder allgemeiner: Warum tun Sie müssen dies?
InformationsquelleAutor user3505725 | 2014-04-07
Du musst angemeldet sein, um einen Kommentar abzugeben.
CSSBox Pdf2Dom ist eine Java-Bibliothek, die es ermöglicht (unter anderem) Konvertierung von PDF in HTML. Die distribution enthält auch eine PDFToHTML Kommandozeilen-tool basiert auf dieser Bibliothek, so dass Sie überprüfen können, ob die Ergebnisse entsprechen Ihren Bedürfnissen. Jedoch, die Umwandlung von PDF zu HTML ist immer schwierig, wie oben erwähnt. Die Ergebnisse sind abhängig von der Komplexität und der Struktur der jeweiligen PDF-Datei, so dass unterschiedliche Werkzeuge, die geeignet sein können für verschiedene PDF-Dateien.
InformationsquelleAutor radkovo
Check-out
JPedal, verarbeitet eingebettete Schriften sehr gut, aber nicht frei.
IcePDF, es ist kostenlos, aber afaik ist es nur können extrahieren von text/Bilder oder Rendern des PDF zu einem image.
Ressourcen hier
haben Sie bereits gefunden eine gute option?
InformationsquelleAutor 4dgaurav
Können Sie versuchen, zu verwenden, Print2Flash: http://www.print2flash.com Es kann in HTML konvertieren von Java nicht nur pdfs sondern auch andere Arten von Dokumenten: Office-Dokumente, AutoCAD-Zeichnungen, etc. Es löste alle Dokument-publishing-Bedürfnisse für unsere Unternehmens-Website.
InformationsquelleAutor alex
Versuchen, unsere Java-Bibliothek namens jPDFWeb bewahrt, Schriften und Bild-Auflösung aus der ursprünglichen PDF-Datei. Sie können laden Sie Ihre eigenen PDF-und probieren Sie die live-demo.
https://www.qoppa.com/pdfhtml/
InformationsquelleAutor Leila Holmann
vielleicht können Sie diese API verwenden: https://market.mashape.com/netservice/convert-pdf-to-html
funktioniert für java, node, php usw...
links, die auf eine api, die nicht funktioniert, oder keine Dokumentation.
InformationsquelleAutor Rob