Wie zum extrahieren von URLs aus einer HTML-Seite in Python

Ich zu schreiben, ein web-crawler in Python. Ich weiß nicht, wie das Parsen einer Seite und extrahieren der URLs aus HTML. Wohin soll ich gehen und zu studieren, zu schreiben, wie ein Programm?

In anderen Worten, ist es ein einfaches python-Programm, das verwendet werden kann als eine Vorlage für einen Allgemeinen web-crawler? Idealerweise sollten die Module verwenden, die sind relativ einfach zu verwenden und es sollten auch viele der Kommentare, um zu beschreiben, was jede Zeile code zu tun.

InformationsquelleAutor user2189704 | 2013-03-20

Schreibe einen Kommentar