Wie Sie das Crawlen einer website/extrahieren von Daten in die Datenbank mit python?

Ich würde gerne bauen, eine webapp zu helfen anderen Studenten an meiner Universität erstellen Ihre Zeitpläne. Zu tun, dass ich zu kriechen, die das master Schedule (ein riesiges html-Seite) sowie einen link zu einer detaillierten Beschreibung für jeden Kurs in eine Datenbank, vorzugsweise in python. Auch, ich brauche die log-in Zugriff auf die Daten.

  • Wie würde das funktionieren?
  • Welche Werkzeuge/Bibliotheken kann/sollte ich verwenden?
  • Gibt es gute tutorials?
  • Wie kann ich das beste Angebot mit binären Daten (z.B. Recht pdf)?
  • Gibt es bereits gute Lösungen für das?

InformationsquelleAutor McEnroe | 2011-12-01

Schreibe einen Kommentar