Anfrage.get(url) gibt leeren Inhalt
Ich versuche, dies herauszufinden, hatte aber kein Glück:
import requests
r = requests.get('http://example.com/m7ppct4', allow_redirects=True)
r.status_code
zurück 200
, und r.content
zurück ''
.
r.headers
gibt die folgenden Wörterbuch:
{'content-length': '0',
'content-language': 'en-US',
'x-powered-by': 'Servlet/3.0',
'set-cookie': '__cfduid=d4b3d47d43189ac72be14b1d2a2bed98a1408989649815; expires=Mon, 23-Dec-2019 23:50:00 GMT; path=/; domain=.azdoa.gov; HttpOnly, LWJSESSIONID=0000SESSIONMANAGEMENTAFFINI:18h1v85u3; Path=/; HttpOnly, NSC_batubufkpctWTTTM=ffffffff09f39f1545525d5f4f58455e445a4a42378b;expires=Mon, 25-Aug-2014 18:02:49 GMT;path=/;secure;httponly',
'expires': 'Thu, 01 Dec 1994 16:00:00 GMT',
'server': 'cloudflare-nginx',
'connection': 'keep-alive',
'x-ua-compatible': 'IE=EmulateIE9',
'cache-control': 'no-cache="set-cookie, set-cookie2"',
'date': 'Mon, 25 Aug 2014 18:00:49 GMT',
'cf-ray': '15f9b0ff50cf0d6d-LAX',
'content-type': 'application/octet-stream'}
Wenn ich öffnen Sie die Seite in einem browser, den ich eindeutig Inhalte.
Irgendwelche Gedanken auf, wie ich kann gehen Sie Debuggen das? Ich würde gerne den Inhalt der Seite mit einem requests.get()
nennen.
- welche version von Anfragen verwenden Sie?
requests.__version__
zurück'2.3.0'
- so ist es
allow_redirects
wunderte ich mich - falsch hier. Ich habe es richtig ist im code. Danke für den Hinweis. Korrigiert.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Müssen Sie senden user-agent:
Es sieht aus wie die Webseite von tinyurl (azstatejobs) filtert Anforderungen auf der Basis von user-agents. Spoofing die Chrome user-agent für mich gearbeitet:
(
allow_redirect
ist standardmäßig true)Möchten Sie vielleicht zu versuchen, verschiedene user-agents und sehen, was macht, dass die website nicht wie der python-requests user-agent.