Python: so ersetzen Sie text in pdf
Ich habe eine pdf Datei und ich möchte Sie ersetzen Sie text in pdf-Datei und generiert eine neue pdf. Wie kann ich das in python?
Ich habe versucht reportlab , reportlab keine Funktion, um text suchen und ersetzen. Welche anderen module kann ich verwenden?
- bitte erklären Sie, was Sie versucht haben
- Hi @Dax! Herzlich willkommen auf Stack Overflow. Wie @adao7000 erwähnt - könnten Sie uns bitte ein Beispiel von dem, was Sie versucht haben? Bitte überprüfen Sie die Richtlinien zur Erstellung einer "Minimal", "geschlossen " überprüfbar" Beispiel hier: stackoverflow.com/help/mcve .
- Ich bin der upvoter. Hinweis zu den Kommentaren: @Dax ist nicht zu Fragen, für code, sondern für ein python-Modul. Beachten Sie, dass stackoverflow.com/help/on-topic besagt eindeutig, dass "aber wenn Ihre Frage in der Regel deckt...eine praktische, beantwortbar problem, das ist einzigartig in der software-Entwicklung..., dann sind Sie in der richtige Ort, um Ihre Frage!" Ich habe gerade hier auf der Suche für die gleiche Sache. Wenn jemand zu weisen uns in die richtige Richtung, das wäre genug.
- Dass die Seite, die Sie verlinken, auch enthält die folgenden: "Fragen, bitten, uns zu empfehlen, oder finden Sie ein Buch, tool, software library, tutorial oder andere off-site-resource off-topic für Stack-Überlauf, da Sie dazu neigen zu locken, rechthaberisch Antworten und spam. Stattdessen beschreiben Sie das problem, und was wurde bisher getan, um es zu lösen."
Du musst angemeldet sein, um einen Kommentar abzugeben.
Können Sie versuchen,Aspose.PDF-Cloud-SDK für Python, Aspose.PDF-Cloud ist eine REST-API, PDF-Verarbeitung Lösung. Es ist bezahlt-API und seine free-Paket planen, bietet 50 credits pro Monat.
Ich bin developer evangelist bei Aspose.
Einen Blick in DIESER thread für eine der vielen Möglichkeiten zum Lesen von text aus einer PDF-Datei. Dann müssen Sie erstellen Sie eine neue pdf-Datei, da Sie, soweit ich weiß, nicht abrufen beliebiger Formatierung für Sie.
Den CAM::PDF-Perl-Bibliothek ausgeben kann text, der sich nicht zu schwer zu analysieren (es scheint ziemlich zufällig split Zeilen text). Ich konnte nicht belästigt werden, zu lernen, zu viel von Perl, also schrieb ich diese wirklich grundlegenden Perl Kommandozeilen-Skripte, die eine liest eine einzelne pdf-Seiten in eine text-Datei
perl read.pl pdfIn.pdf textOut.txt
und eine, die schreibt den text (das können Sie ändern, in der Zwischenzeit) zu einer pdf -perl write.pl pdfIn.pdf textIn.txt pdfOut.pdf
.und
Können Sie rufen diese mit python beiden Seiten zu tun, einige regex etc Sachen auf den ausgegeben text-Datei.
Wenn Sie komplett neu in Perl (wie ich war), müssen Sie sicherstellen, dass Perl und CPAN installiert sind, dann laufen
sudo cpan
, dann in der Eingabeaufforderunginstall "CAM::PDF";
dies installiert die benötigten Module.Auch, ich merke, dass ich sollte wahrscheinlich stdout usw, aber ich war in Eile 🙂
Auch, irgendwelche Ideen was das format CAM-PDF-Ausgabe ist? gibt es eine doc für Sie?