Wie konvertiere ich ein Word-Dokument in PDF?
Wie konvertiere ich ein Word-Dokument in PDF, wo das Dokument enthält verschiedene Dinge, wie zum Beispiel Tabellen. Wenn Sie versuchen, zu verwenden, iText, ist das ursprüngliche Dokument sieht anders aus, um die konvertierte PDF-Datei. Ist es ein open-source-API /Bibliothek, anstatt den Aufruf einer ausführbaren Datei, die ich verwenden kann?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Dies ist eine sehr schwierige Aufgabe, immer härter, wenn Sie wollen perfekte Ergebnisse (unmöglich, ohne mithilfe von Word) als solche die Reihe von APIs, die einfach tun es alle für Sie in reinem Java entwickelt und open source ist null ich glaube (Update: ich bin falsch, siehe unten).
Ihre grundlegenden Optionen sind wie folgt:
Update - 2016-02-11
Hier ist ein Schnitt nach unten Kopie von meinem blog-post zu diesem Thema, die Umrisse der bestehenden Produkte, die Unterstützung von Word-zu-PDF-Datei in Java.
Konvertieren von Microsoft Office (Word, Excel) Dokumente zu PDF-Dateien in Java
Drei Produkte, die ich kenne, können das Rendern von Office-Dokumenten:
yeokm1/docs-to-pdf-Konverter
Unregelmäßig gepflegt, Reine Java-Open-Source -
Bündelt eine Reihe von Bibliotheken, die für die Konvertierung.
xdocreport
Aktiv entwickelt wird, Reine Java-Open-Source -
Es ist Java-API zum Zusammenführen von XML-Dokument erstellt mit MS Office (docx) oder OpenOffice (odt), LibreOffice (odt) mit einem Java-Modell zu generieren Bericht und konvertieren Sie es, wenn Sie benötigen ein anderes format (PDF, XHTML...).
Snowbound Imaging SDK
Closed Source, Pure Java
Snowbound scheint ein 100% - Java-Lösung und die Kosten über $2,500. Es enthält samples, die beschreiben, wie die Konvertierung der Dokumente in die evaluation download.
OpenOffice API
Open-Source -, Nicht Reines Java - Benötigt Open Office installiert
OpenOffice ist eine native Microsoft Office-suite unterstützt eine Java-API. Dies unterstützt das Lesen von Office-Dokumenten und für das schreiben von PDF-Dokumenten. Das SDK enthält ein Beispiel-Dokument-Konvertierung (examples/java/DocumentHandling/DocumentConverter.java). Zu schreiben, die PDFs, die Sie brauchen, um passieren die "writer_pdf_Export" Schriftsteller anstatt der "MS Word 97" ein.
Oder Sie verwenden den wrapper-API JODConverter.
JDocToPdf - Tot wie der 2016-02-11
Verwendet Apache POI zum Lesen der Word-Dokument und iText zu schreiben, die PDF-Datei. Komplett kostenlos, 100% Java, hat aber einige Einschränkungen.
Können Sie JODConverter für diesen Zweck. Es kann verwendet werden, um die Konvertierung von Dokumenten zwischen unterschiedlichen office-Formate. wie:
Mehr details darüber finden Sie hier:
http://www.artofsolving.com/opensource/jodconverter
Check-out docs-to-pdf-Konverter auf github. Seine eine leichte Lösung, die speziell für die Konvertierung von Dokumenten zu pdf.
Können Sie Cloudmersive native Java-Bibliothek. Es ist kostenlos für bis zu 50.000 Umbauten/Monat und ist viel höher treue in meiner Erfahrung als auch andere Dinge wie iText oder Apache-POI-basierten Methoden. Die Dokumente, die eigentlich gleich Aussehen, wie Sie in Microsoft Word tun, das ist für mich der Schlüssel. Übrigens kann es auch tun, XLSX -, PPTX -, und das alte DOC -, XLS-und PPT-Konvertierung in PDF.
Hier ist, was der code aussieht, fügen Sie zunächst Ihre Importe:
Dann eine Datei konvertieren:
Können Sie sich einen Dokument-Konvertierungs-API-Schlüssel kostenlos aus dem portal.
Stimme ich mit Poster Auflistung OpenOffice als high-fidelity-import/export Einrichtung von word - /pdf-docs mit einer Java-API und es funktioniert auch plattformübergreifend. OpenOffice-import/export-Filter sind ziemlich mächtig und bewahren die meisten Formatierungen bei der Konvertierung in verschiedene Formate inklusive PDF. Docmosis und JODReports Wert-hinzufügen-um das Leben einfacher als das erlernen der OpenOffice-API direkt, die kann eine Herausforderung sein, weil der Stil des UNO-api und der crash-Fehler.
Ich denke, dass JOD Converter ist die einfachste Weise zu implementieren, entnehmen Sie Bitte folgenden link für mehr Informationen.
http://mytechbites.blogspot.in/2014/10/convert-documents-to-pdf-in-java.html
Mit JAKOB nennen Office Word ist eine 100% perfekte Lösung. Aber es unterstützt nur auf Windows Plattform, da müssen Office Word installiert.
Mit JACOB API-Aufruf Office Word zu konvertieren doc/docx zu pdf.
}
Ich habe nicht versucht, es zu benutzen für MS Word, aber ich hatte einen guten Erfolg Lesen von MS Excel-Dokumenten unter Verwendung von Apache POI - http://poi.apache.org/
Blick in scripting OpenOffice.org um die Arbeit zu tun für Sie.
unoconv, es ist ein python-Werkzeug, arbeitete in UNIX.
Während ich mit Java aufrufen in der shell von UNIX, es funktioniert perfekt für mich. Mein source-code : UnoconvTool.java. Beide JODConverter und unoconv sind so zu verwenden, open office/libre office.
docx4j/docxreport, POI, PDFBox sind gut, aber es fehlen einige Formate bei der Konvertierung.
Es ist bereits 2019, ich kann nicht glauben, dass noch kein einfachste und conveniencest Weg, um zu konvertieren der beliebtesten Micro$oft Word-Dokument in eine Adobe PDF-format in der Java-Welt.
Ich fast versucht, jede Methode, die obigen Antworten erwähnt, und ich fand die beste und die einzige Art und Weise befriedigen kann meine Forderung ist durch die Verwendung von OpenOffice oder LibreOffice. Ich bin eigentlich nicht so genau wissen, der Unterschied zwischen Ihnen, scheint beide bieten
soffice
Befehlszeile.Meine Forderung ist:
Erste, was kam in den Sinn, ist
doc-to-pdf-converter
, aber es fehlt an Wartung, das Letzte update geschah vor 4 Jahren, ich werde nicht verwenden Sie ein niemand-Pflege-Lösung.Xdocreport
scheint eine vielversprechende Wahl, aber es kann nur konvertierendocx
, aber nichtdoc
binäre Datei, die ist Pflicht für mich. Mit Hilfe von Java zu nennen die OpenOffice-API scheint gut, aber zu kompliziert für eine so einfache Anforderung.Schließlich fand ich die beste Lösung: mit OpenOffice Befehlszeile ein, um den job zu beenden:
Ich immer der Meinung, dass der kürzeste code ist der beste code (natürlich sollte es verständlich sein), das ist es.