Beautifulsoup: Parsen von html – Teil des href
Ich versuche zu analysieren
<td height="16" class="listtable_1"><a href="http://steamcommunity.com/profiles/76561198134729239" target="_blank">76561198134729239</a></td>
für die 76561198134729239. und ich kann nicht herausfinden, wie es zu tun. was habe ich versucht:
import requests
from lxml import html
from bs4 import BeautifulSoup
r = requests.get("http://ppm.rep.tf/index.php?p=banlist&page=154")
content = r.content
soup = BeautifulSoup(content, "html.parser")
element = soup.find("td",
{
"class":"listtable_1",
"target":"_blank"
})
print(element.text)
InformationsquelleAutor nooby | 2017-01-18
Du musst angemeldet sein, um einen Kommentar abzugeben.
Gibt es viele solcher Einträge in HTML. Um alle von Ihnen könnten Sie Folgendes verwenden:
Dies würde dann wieder:
InformationsquelleAutor Martin Evans
"target":"_blank"
ist eine Klasse von Anker-taga
innerhalb dertd
tag. Es ist nicht eine Klasse vontd
tag.Können Sie es gerne so:
Ausgabe:
InformationsquelleAutor MYGz
Wie andere erwähnt Sie versuchen, überprüfen Sie die Attribute der verschiedenen Elemente in einem einzigen
find()
. Sie können stattdessen Kettefind()
Anrufe als MYGz vorgeschlagen, oder verwenden Sie eine einzelne CSS-Selektor:Wenn Sie brauchen, um zu suchen Sie können mehrere Elemente auf diese Weise, verwenden
select()
:InformationsquelleAutor alecxe
"class":"listtable_1"
gehörentd
tag undtarget="_blank"
gehörena
tag, sollten Sie nicht verwenden Sie Sie zusammen.sollten Sie verwenden
Steam Community
als Anker, um die zahlen zu finden, nachdem es.ODER verwenden Sie URL, Die URL enthalten die Informationen, die Sie brauchen, und es ist leicht zu finden, finden Sie die URL und teilen Sie es durch
/
:Code:
out:
InformationsquelleAutor 宏杰李