Wie die download-Datei von der website, Anmeldung erforderlich Informationen mit Python?
Ich versuche, laden Sie einige Daten von einer website auf Basis von Python. Wenn Sie kopieren Sie einfach und fügen Sie die url, es zeigt nichts, es sei denn, Sie füllen die login-Informationen. Ich habe den login-Namen und Passwort, aber wie soll ich diese in Python?
Mein aktuelle code:
import urllib, urllib2, cookielib
username = my_user_name
password = my_pwd
link = 'www.google.com' # just for instance
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
login_data = urllib.urlencode({'username' : username, 'j_password' : password})
opener.open(link, login_data)
resp = opener.open(link,login_data)
print resp.read()
Gibt es keine Fehlermeldung erscheint, allerdings resp.read() ist eine Reihe von CSS-und es hat nur die Meldungen wie "Sie müssen sich anmelden, bevor das Lesen von Nachrichten hier."
Also, wie kann ich abrufen, die die Seite nach der Anmeldung?
Ist nur aufgefallen, dass die website erfordert 3 Eingaben:
Company:
Username:
Password:
Habe ich alle von Ihnen, aber wie kann ich alle drei in der login-variable?
Wenn ich es starten ohne Anmeldung es gibt:
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
opener.open(dd)
resp = opener.open(dd)
print resp.read()
Hier ist die print-outs:
<DIV id=header>
<DIV id=strapline><!-- login_display -->
<P><FONT color=#000000>All third party users of this website and/or data produced by the Baltic do so at their own risk. The Baltic owes no duty of care or any other obligation to any party other than the contractual obligations which it owes to its direct contractual partners. </FONT></P><IMG src="images/top-strap.gif"> <!-- template [strapline]--></DIV><!-- end strapline -->
<DIV id=memberNav>
<FORM class=members id=form1 name=form1 action=client_login/client_authorise.asp?action=login method=post onsubmits="return check()">
- Es funktioniert nicht, der Druck-resp.read() immer noch gibt "<td><p>der Zugriff auf diese Daten ist nur durch Abonnement. <a href="freetrialapplication/">hier Klicken</a> für eine Kostenlose Testversion.</p></td>"
- Ich habe bemerkt, dass die Seite braucht 3 items anmelden, ich habe alle von Ihnen, aber ich bin nicht sicher, wie sollte ich es in der login_info?
- Ich bearbeitet aber nicht sicher, ob dies ist, was Sie gefragt haben. Ich didnt finden <form> in der print-resp.read () - Ergebnisse..
Du musst angemeldet sein, um einen Kommentar abzugeben.
Dieser code sollte funktionieren, mit Python-Requests - Sie ersetzen nur die
...
mit dem tatsächlichen domain und natürlich die login-Daten.Usign scrapy für das crawling, das Daten, Scrapy
Dann können Sie einfach diesen