Die Bestimmung umgeleitet, die URL in Python
Ich machte einen kleinen parser mit HTMLparser und ich würde gerne wissen, wo ein link umgeleitet wird. Ich weiß nicht, wie dies zu erklären, so schauen Sie bitte diesem Beispiel:
Auf meiner Seite habe ich einen link auf die Quelle: http://www.myweb.com?out=147
, die Umleitungen zu http://www.mylink.com
. Ich kann analysieren http://www.myweb.com?out=147
ohne Probleme, aber ich weiß nicht, wie man http://www.mylink.com
.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Können Sie
urllib2
(das urllib.Anfrage
in Python 3) und seineHTTPRedirectHandler
, um heraus zu finden, wo eine URL umleiten. Hier ist eine Funktion, die das tut:Können Sie nicht fassen die URL-Umleitung durch das Parsen der HTML-source-code.
Umleitungen ausgelöst werden, indem der server und NICHT der client. Sie müssen führen Sie eine HTTP-Anforderung an den zugehörigen URL und überprüfen Sie die HTTP-response des Servers - insbesondere für die HTTP-status-code 304 (Umleitung) und die neue URL.