BeautifulSoup: Hole den Inhalt einer bestimmten Tabelle
Meine lokalen Flughafen disgracefully blockiert Benutzer ohne IE, und sieht schrecklich. Ich möchte schreiben Sie ein Python-Skripte, die die Inhalte der an-und Abreise die Seiten alle paar Minuten, und zeigen Sie Sie in einem besser lesbaren Weise.
Meine tools der Wahl sind mechanisieren für Betrug die Website zu glauben, dass ich den IE nutzen, und BeautifulSoup für die Analyse von Seite zu Holen Sie sich die Flüge von Daten der Tabelle.
Ganz ehrlich, ich habe verloren in den BeautifulSoup Dokumentation, und kann nicht verstehen, wie man die Tabelle (deren Titel ich weiß) aus dem gesamten Dokument, und wie man eine Liste der Zeilen aus dieser Tabelle.
Irgendwelche Ideen?
InformationsquelleAutor Adam Matan | 2010-05-29
Du musst angemeldet sein, um einen Kommentar abzugeben.
Dies ist nicht der spezifische code, den Sie benötigen, nur eine demo, wie man mit BeautifulSoup. Er findet die Tabelle, die id ist "Tabelle1" und ruft alle seine tr-Elemente.
In der Tat grossartig! Überprüfen Sie Ihre Facebook-Postfach, ich habe dir eine Nachricht geschickt.
irgendwelche Ideen, wie man eine bestimmte Tabelle, wenn es keine id oder Titel zu unterscheiden... zum Beispiel.. ich möchte in der Dritten Tabelle mit der html-Datei... (es gibt keine anderen Indikatoren).
Ich mag diese Lösung sehr viel mehr als es scheint viel klarer im Vorsatz!
FYI, "has_key" ist jetzt veraltet. Verwenden has_attr("id") statt. Ich werde Bearbeiten Sie die original-Antwort.
InformationsquelleAutor Ofri Raviv
erhalten Sie die Dritte
table
. (Sie möchten zu prüfen die Länge, bevor Sie tun dies aber, nur um sicher zu sein.)InformationsquelleAutor goggin13
Nur, wenn Sie Pflege, BeautifulSoup ist nicht mehr gepflegt, und der ursprüngliche maintainer deutet einen übergang zu lxml. Xpath sollte den trick tun es genauso gut.
Das ist nicht mehr wahr. BeautifulSoup 4 ist die aktuelle version, und die ist mehr als zwei Jahre jünger als diese Antwort.
Ich bin mit BeautifulSoup jetzt, so dass es vorhanden und voll funktionsfähig.
InformationsquelleAutor user338971