Das Parsen und die Generierung von Microsoft Office 2007-Dateien (.docx, .xlsx -, .pptx)
Ich habe ein web-Projekt, wo ich importieren muss, text und Bilder aus einem vom Benutzer gelieferten Dokument, und eines der möglichen Formate ist Microsoft Office 2007. Es gibt auch eine Notwendigkeit zu erzeugen, Dokumente in diesem format.
Dem server läuft CentOS 5.2 und hat PHP/Perl/Python installiert. Ich kann die Abwicklung von lokalen Binärdateien und shell-Skripten, wenn ich muss. Wir verwenden Apache 2.2, sondern wird die Umstellung auf Nginx, sobald es live geht.
Was sind meine Optionen? Jemand schon Erfahrung mit dieser?
InformationsquelleAutor der Frage DV. | 2008-10-06
Du musst angemeldet sein, um einen Kommentar abzugeben.
Office 2007-Dateiformate öffnen und gut dokumentiert. Grob gesprochen, all die neuen Datei-Formate mit der Endung "x" sind zip-komprimierte XML-Dokumente. Zum Beispiel:
Andere Datei-Formate sind in etwa vergleichbar. Ich kenne kein open-source-Bibliotheken für die Interaktion mit Ihnen als noch - aber je nach Ihren genauen Anforderungen, es sieht nicht allzu schwer zu Lesen und zu schreiben, einfache Dokumente. Sicherlich sollte es viel einfacher sein, als mit den älteren Formaten.
Wenn Sie Lesen müssen, die ältere Formate, OpenOffice hat eine API und kann Lesen und schreiben, Office 2003 und ältere Dokumente, die mit mehr oder weniger Erfolg.
InformationsquelleAutor der Antwort 1800 INFORMATION
Python docx-Modul erzeugen kann formatierte Microsoft-office-docx-Dateien aus reinem Python. Out of the box, es tut überschriften, Absätze, Tabellen, Aufzählungszeichen, aber die makeelement () - Modul kann erweitert werden, um arbiträre Elemente, wie Bilder.
InformationsquelleAutor der Antwort mikemaccana
Habe ich erfolgreich die OpenXML-Format-SDK in einem Projekt zu ändern, eine Excel-Tabelle per code. Dies würde erfordern .NET und ich bin mir nicht sicher, wie gut es funktionieren würde unter Mono.
InformationsquelleAutor der Antwort Hafthor
Wahrscheinlich können Sie den code für Sphider. Sie docs und pdfs, also ich bin mir sicher, dass Sie Lesen können. Könnte auch führen Sie in die richtige Richtung für andere Office-Formate.
InformationsquelleAutor der Antwort Darryl Hein