Wie konvertieren von PDF zu HTML?
Gibt es eine richtige Bibliothek, die ich verwenden können, um konvertieren von PDF zu HTML oder ein anderes format konvertiert werden kann, um HTML einfach?
Suchte ich ähnliche Fragen, aber kein Glück.
Ich möchte in der Lage zum extrahieren von text aus PDF-Dateien, eventuell Bilder. Ich bin nicht auf der Suche nach Betten Sie das PDF-Dokument in das HTML-Format.
InformationsquelleAutor der Frage Luchian Grigore | 2011-12-03
Du musst angemeldet sein, um einen Kommentar abzugeben.
Wie ich bereits im Kommentar oben, es ist definitiv möglich, zu konvertieren von pdf in html mit dem tool Able2Extract7, die heruntergeladen werden kann von hier
Ich habe mit diesem tool für fast 2 Jahre jetzt, und ich bin ziemlich glücklich mit ihm. Mit diesem tool können Sie konvertieren von PDF zu Word -, Excel -, PowerPoint -, Publisher -, HTMLOO etc. Siehe screenshot
Imp Hinweis: Dieses tool ist nicht freeware.
HTH
InformationsquelleAutor der Antwort Siddharth Rout
Es ist technisch unmöglich, einfach "convert" - eine PDF-Datei in HTML. Das PDF-format ist mehr wie eine "Leinwand", wo Sie "Platz" Ihre Textbausteine und Bilder, während HTML-Anforderungen entweder CSS oder eine Menge von Tabellen "Ort" der Blöcke. Außerdem, PDF-Dateien einbetten der Bilder, in der Erwägung, dass HTML ruft einfach andere Dateien.
Es gibt viele andere Beispiele, Unterschiede, aber im wesentlichen ist es wie zu Fragen, zu konvertieren, ein Bild oder ein video mit text.
Können Sie jedoch Lesen einer PDF-Datei, und extrahieren Sie dann den text und die Bilder, die Verwendung von Bibliotheken oder andere fortgeschrittene Techniken. .Net hat ein paar Bibliotheken, zum Beispiel : http://forums.asp.net/post/2167442.aspx
Wenn Sie nur konvertieren Sie eine Datei einmal, können Sie öffnen Sie die pdf-Datei in Adobe Illustrator zum Beispiel, und exportieren Sie dann die in html. Oder Sie können wählen Sie das gesamte Dokument (Strg+a), kopieren es und fügen es in Word, und speichern Sie dann das Ergebnis in html. Es wird bei weitem nicht perfekt, aber es wird der Anfang sein.
InformationsquelleAutor der Antwort thomasb
Wenn Sie auf Linux sind, versuchen pdftohtml:
Den open-source-ebook-Konverter Kaliber können auch konvertieren von PDF Dateien zu HTML und ist verfügbar auf MacOS, Windows und Linux.
InformationsquelleAutor der Antwort moof2k
Download
vom http://pdfbox.apache.org/
Bitte beachten: Bilder nicht geschoben bekommen, um die HTML-Ausgabe.
InformationsquelleAutor der Antwort Sergio Muriel
Es ist nicht so schwer zu konvertieren von PDF in HTML. Es gibt viele online-Optionen, die möglicherweise, jedoch setzen Sie Ihre Daten an Dritte weiter. Gehen Sie folgendermaßen vor, und die Ausgabe ist toll.
Öffnen die PDF2HTMLEX Seite.
(Sie können entweder Folgen die nächsten Schritte, die ich erwähnt habe, oder befolgen Sie die Anweisungen von der Seite.)
Das Paket ist erhältlich zum download für Windows von hier.
Aus den vielen Optionen zur Verfügung, empfehle ich den Download "pdf2htmlEX-win32-0.14.6-upx-with-poppler-data.zip (pdf2htmlEx.exe ist mit UPX gepackt)"
Nach dem Download und der un-zippen-Konvertierung ist nur ein cmd-Befehl entfernt.
Letzte Befehl:
(Kann man natürlich kürzen Sie den Namen des Ordners, jedoch hielt ich es genauso wie du sehen würde, nach un-zippen Sie den download. Ich bin vorausgesetzt, Sie können ändern Sie das Verzeichnis in der cmd, um den gewünschten Ordner oder anderes Google wie.)
abc.pdf-Dokumente werden nach HTML konvertiert und gespeichert werden abc.html in den gleichen Ordner wie die exe.
InformationsquelleAutor der Antwort Kjk
Nicht sicher, dass es hilfreich sein kann, aber wenn man eins braucht-Zeit-Konvertierung können Sie versuchen, diese freien on-line-Werkzeug: https://www.readkong.com/
Verwendet diese Seite mehrere Male. Es produziert html-Code, der identisch zu pdf-ursprüngliche Quelle. Keine hässliche und kaputte markup, keine html-mashup und so weiter, auch für sehr komplexe pdf.
InformationsquelleAutor der Antwort Dmitry Belyaev
Ja, es ist definitiv möglich.
Wenn Ihr auf ubuntu linux
dann
Wenn Sie möchten, um zu sehen, was die Flaggen bedeuten, dann geben Sie einfach
Wenn Ihr nicht auf linux, es gibt eine Vielzahl von Werkzeugen gibt, die Sie verwenden können, um dies möglich zu machen.
InformationsquelleAutor der Antwort Samir Patel