web-scraping (football Quote)
Ich bin neu in web-scraping und Recht jetzt ich versuche, es zu verstehen, um die Automatisierung, der ein Wetten-Wettbewerb mit Freunden über die Deutsche bundesliga. (Die Plattform, die wir verwenden, ist kicktipp.de). Ich habe es schon geschafft, zur Anmeldung auf der website und post-Fußball-Ergebnisse mit python. Leider sind nur poisson-verteilt randoms Zahl so weit. Um diese zu verbessern, meine Idee ist die download-Quote von bwin. Je genauer ich versuche zu downloaden die Quoten für die genauen Ergebnisse. Hier beginnt das Problem. So weit ich war nicht in der Lage, diese zu extrahieren mit BeautifulSoup. Verwendung von google chrome, die ich versuche zu verstehen, welcher Teil der html-code, den ich brauche. Aber für einige Gründe, warum ich nicht finden können, diejenigen Teile, die mit BeautifulSoup.
Mein code im moment nicht so Aussehen:
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
my_url = "https://sports.bwin.com/de/sports/4/wetten/fußball#categoryIds=192&eventId=&leagueIds=43&marketGroupId=&page=0&sportId=4&templateIds=0.8649061927316986"
# opening up connection, grabbing the page
uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
# html parsing
page_soup = soup(page_html, "html.parser")
containers1 = page_soup.findAll("div", {"class": "marketboard-event-
group__item--sub-group"})
print(len(containers1))
containers2 = page_soup.findAll("table", {"class": "marketboard-event-with-
header__markets-list"})
print(len(containers2))
Aus der Länge der Behälter kann ich bereits erkennen, dass entweder Sie enthalten mehr Elemente, dann ich erwartet hatte oder Sie leer sind, aus unbekannten Gründen... Hoffe, dass u kann mich. Vielen Dank im Voraus!
- Tut es zeigt alle Tabellen, wie Sie erwarten, wenn Sie drucken
page_soup.prettify()
? Auch haben Sie betrachtet mit Anfragen anstatt das urllib.Anfrage?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Können Sie
Selen
zusammen mitChromeDriver
zu kratzen, eine Seite, die generiert JavaScript-Inhalte, denn dies ist hier der Fall.Nun
containers
hat wirklich, was wir wollen, ist, dass die Tabellen-Elemente, Inspektion mehr, es ist leicht zu sehen, dass unsere gewünschten Texte in wechselnden<div>
- tags, so können wirzip
unditer
zu erstellen, die eine Liste von Tupeln von Ergebnis und Quoten zusammen, abwechselnd diedivs
Liste Elemente:Demo:
Je nachdem, wie Sie möchten, dass Ihre Daten möchten, können Sie auch Holen die Titel jeder Tabelle mit so etwas wie:
driver.quit()
oder similars. Und das wäre, sobaldsoup
erstellt.