Download alle links, die(zugehörigen Dokumente) auf eine Webseite mit Python
Habe ich zum download eine Menge von Dokumenten, von einer Webseite. Sie sind wmv-Dateien, PDF -, BMP etc. Natürlich, Sie haben alle die links zu Ihnen. Also jedes mal, ich habe zu RMC eine Datei, wählen Sie "Link Speichern unter", Dann speichern Sie dann als Dateityp Alle Dateien. Ist es möglich, dies zu tun in Python? Ich Suche die DB SO und die Leute haben geantwortet Frage, wie man die links von der Webseite. Ich möchte zum herunterladen der eigentlichen Dateien. Vielen Dank im Voraus. (Dies ist nicht eine HW-Frage :)).
InformationsquelleAutor Sumod | 2011-05-12
Du musst angemeldet sein, um einen Kommentar abzugeben.
Hier ist ein Beispiel, wie könnten Sie zum download einige ausgewählte Dateien aus http://pypi.python.org/pypi/xlwt
können, benötigen Sie den mechanisieren erste: http://wwwsearch.sourceforge.net/mechanize/download.html
Hinweis: In einigen Fällen möchten Sie vielleicht zu ersetzen
br.click_link(l)
mitbr.follow_link(l)
. Der Unterschied ist, dass click_link gibt ein Request-Objekt in der Erwägung, dass follow_link direkt den link zu öffnen. Sehen Mechanisieren Unterschied zwischen br.click_link() und br.follow_link()+1 für voll funktionierenden code!
robert kink, führe ich den code für nur ein download-zip-Dateien - der code ohne Fehler ausgeführt, aber in der chrom-download-Ordner ich die Dateien nicht angezeigt
hmm ich denke die Datei wird heruntergeladen und in den Ordner, den Sie lief das python-Skript aus. siehe stackoverflow.com/questions/5137497/...
InformationsquelleAutor robert king
--limit
,--recursive
und--accept
Befehl-Linien inWget
. Zum Beispiel:wget --accept wmv,doc --limit 2 --recursive http://www.example.com/files/
InformationsquelleAutor gsbabil