Hat eine Bibliothek vorhanden ist, zu entfernen Passwörter aus PDF-Dateien programmgesteuert?
Funktioniert eine Bibliothek vorhanden sein, um die "Besitzer" - Passwörter von PDF-Dokumenten, so dass der text kann dann programmgesteuert daraus? So etwas wie PDF-Technologien' Passwort Recovery-tool, aber callable von der Befehlszeile aus oder aus Python. Eine grafische Oberfläche ist nicht wirklich nützlich für mich, da die Anzahl der Dokumente so groß ist.
Bitte, keine Kommentare über die Rechtmäßigkeit des Prozesses. Die PDF-Dokumente in Frage zu stellen, sind im Besitz, und der text muss extrahiert werden, um keyword-Wolken für das Dokument festgelegt.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich weiß nicht, über python-Bibliotheken, aber für batch entfernen von Passwörtern von PDF-Dokumenten, meine Kollegen haben gute Erfahrungen mit PwdRemover (nicht kostenlos).
Hier sind zwei andere (open-source) tools für command-line-Verarbeitung:
QPDF: EIN Content-Erhaltung der PDF-Umwandlung-System:
pdftk - the pdf toolkit:
Wenn Sie Ihr Kennwort vergessen haben oder der Mitarbeiter, der verschlüsselt die Dokumente seitdem hat das Unternehmen verlassen, können Sie PDFCrack zu erholen das Passwort(s).