Wie lade ich. pdf-Datei über https mit python

Ich Schreibe ein python-Skript, speichern die pdf-Datei lokal nach dem format in der URL. für zB.

https://Hostname/saveReport/file_name.pdf   #saves the content in PDF file.

Bin ich diese URL durch python-Skript :

 import webbrowser
 webbrowser.open("https://Hostname/saveReport/file_name.pdf")

Die url enthält viele Bilder und text. Einmal diese URL wird geöffnet, möchte ich zum speichern einer Datei im pdf-format mittels python-Skript.

Dies ist, was ich bisher getan habe.

Code 1:

import requests
url="https://Hostname/saveReport/file_name.pdf"    #Note: It's https
r = requests.get(url, auth=('usrname', 'password'), verify=False)
file = open("file_name.pdf", 'w')
file.write(r.read())
file.close()

Code 2:

 import urllib2
 import ssl
 url="https://Hostname/saveReport/file_name.pdf"
 context = ssl._create_unverified_context()
 response = urllib2.urlopen(url, context=context)  #How should i pass authorization details here?
 html = response.read()

Im obigen code erhalte ich: urllib2.HTTPError: HTTP Error 401: Unauthorized

Wenn ich Code 2, wie kann ich pass Autorisierung details?

Wollen Sie eine Lösung, die mit webbrowser.open, requests.get oder urllib2.urlopen?
Ich habe versucht oben genannten Ansätze. Also Anfragen oder urllib2 alles funktioniert.

InformationsquelleAutor | 2015-11-02

Ich denke, das wird funktionieren,

import requests
url="https://Hostname/saveReport/file_name.pdf"    #Note: It's https
r = requests.get(url, auth=('usrname', 'password'), verify=False,stream=True)
r.raw.decode_content = True
with open("file_name.pdf", 'wb') as f:
        shutil.copyfileobj(r.raw, f)

InformationsquelleAutor Joran Beasley

Einer Weise, die Sie tun können, ist:

import urllib3
urllib3.disable_warnings()
url = r"https://websitewithfile.com/file.pdf"
fileName = r"file.pdf"
with urllib3.PoolManager() as http:
    r = http.request('GET', url)
    with open(fileName, 'wb') as fout:
        fout.write(r.data)

InformationsquelleAutor baji

0

Einigen Dateien - zumindest tar-Archiv (oder auch alle anderen Dateien) können Sie die pip:
```
import sys
from subprocess import call, run, PIPE
url = "https://blabla.bla/foo.tar.gz"
call([sys.executable, "-m", "pip", "download", url], stdout=PIPE, stderr=PIPE)
```
Aber Sie sollten bestätigen, dass der download erfolgreich war, auf eine andere Weise als pip würde Fehler für alle Dateien, die nicht archiviert mit setup.py daher stderr=PIPE (Oder möglicherweise können Sie bestimmen, ob der download erfolgreich war, durch analysieren der Teilprozess Fehlermeldung).

InformationsquelleAutor Peter Zagubisalo
-1

Können Sie versuchen so etwas wie :
```
import requests
response = requests.get('https://websitewithfile.com/file.pdf',verify=False, auth=('user', 'pass'))
with open('file.pdf','w') as fout:
   fout.write(response.read()):
```
- response.text ist wahrscheinlich eine schlechte Wahl, da es sich um eine Dekodierung Schritt. Vielleicht öffnen Sie die Datei mit wb und schreiben response.content statt.
- Antwort.raw denke ich
- Offenbar response.iter_chunk ist request's "bevorzugte und empfohlene Weg, um ein Dokument empfangen": "docs.python-requests.org/en/latest/user/quickstart/...
- Ich bearbeitet habe, mit einem besseren Weg, um in der response-content
InformationsquelleAutor Raphaël Vigée

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.