Lesen docx (Office Open XML) in PHP
Möchte ich hinzufügen, dass ein word-import-Funktion, um unser CMS, das einzige problem, das ich nicht zu finden, scheint eine gute Bibliothek für das Lesen von docx-Dateien (Word 2007).
Tun, hat jemand einige Empfehlungen, die Bibliothek sollte in der Lage sein, zu extrahieren Sie den Inhalt des Dokuments und basic-styling wie Kursiv, Fett, Hochgestellt?
Vielen Dank für Ihre Hilfe
Du musst angemeldet sein, um einen Kommentar abzugeben.
Oder, da Sie beantragt, eine Bibliothek, können Sie sich möglicherweise in so etwas wie Docvert. Ich war gerade auf der Suche rund, basierend auf Ihre Frage, und es ist mein Favorit bisher für PHP. Geben Sie die word-Datei Lage, es verwandelt ihn in etwas, das einfach mit den Attributen und all das gute Zeug.
docx
Dateien sind eigentlich nur Container für die XML-Dokuments. Sie sollten in der Lage sein, um entpacken Sie die docx-Datei und gehen Sie dann zu den word-Ordner im inneren, die sich dann zu document.xml. Dies ist der eigentliche text. Aber Dinge wie Schriftarten und Stile sind in anderen xml-Dateien im docx-container, so dass Sie wahrscheinlich wollen, um etwas rumbasteln und herauszufinden, was was ist und wie man es zuordnen (start durch die Verwendung von namespaces, ich Wette).Aber ja, entpacken Sie die Datei, dann verwenden simplexml konvertieren Sie es in etwas, was Sie eigentlich zu Durcheinander herum mit.
PHPDocX PRO umfasst eine TransformDoc Klasse, die Lesen können .docx-Format (zip -) Dateien, und generieren Sie XHTML (oder PDF) aus:
Gibt es eine Bibliothek, die dies tun, aber es funktioniert mit Zend framework werden können, wird es Ihnen helfen,
Es heißt phpLiveDocx : http://www.phplivedocx.org/downloads/
Die Bibliothek ist lizenziert unter der Neuen Bcd -
Habe ich nur eine Bibliothek, die sowohl Lesen und schreiben, unterstützen, überprüfen Sie es auf der codeplex-Schmiede http://openxmlapi.codeplex.com und ist lizensiert unter GPLv2 .
Konvertieren einer docx-Dokument in ein odt mit OpenOffice. Verwenden Sie dann eZ Components zu tun, die Parsen und importieren. Sie verwenden tatsächlich den import in Ihre CMZ eZ Publish.
Hier ist eine einfache, funktionierende Lösung, die ich gefunden
http://webcheatsheet.com/php/reading_the_clean_text_from_docx_odt.php