python/beautifulsoup zu finden, alle <a href> mit spezifischen Anker-text
Ich versuche, mit schönen Suppe zum analysieren von html und finden Sie alle href-mit einer spezifischen Anker-tag
<a href="http://example.com">TEXT</a>
<a href="http://example.com/link">TEXT</a>
<a href="http://example.com/page">TEXT</a>
alle links, die ich Suche, haben die exakt gleichen anchor-text, in diesem Fall TEXT. Ich bin NICHT auf der Suche nach der word-TEXT, möchte ich den word-TEXT zu finden, die alle unterschiedliche HREF
edit:
zur Verdeutlichung der Suche nach etwas ähnliches mit der Klasse zu analysieren, für die links
<a href="http://example.com" class="visible">TEXT</a>
<a href="http://example.com/link" class="visible">TEXT</a>
<a href="http://example.com/page" class="visible">TEXT</a>
und dann mit
findAll('a', 'visible')
außer dem HTML bin ich Parsen muss nicht eine Klasse, sondern immer den gleichen anchor-text
InformationsquelleAutor cwal | 2012-11-05
Du musst angemeldet sein, um einen Kommentar abzugeben.
Würde so etwas funktionieren?
Oh, gotcha (mein schlechtes langen Tag 🙂 ). Versuchen Sie die aktualisierte version - Sie baut es in die filter. Nicht, dass tun, was Sie wollen? Dieser laden wird, Sie als generator im Gegensatz zum laden von allen von Ihnen, so glaube ich, dies ist die Schnellste, die Sie erhalten (wie es braucht, um einen Weg nach vorne für BS zu prüfen, ob ein link passt gut zu deinen Kriterien). Glücklich zu helfen, denken Sie über einen anderen Weg, wenn das nicht funktioniert.
dies sicherlich sieht aus wie es funktioniert! Ich hatte dies versucht, aber ohne die href=true und es nicht zu funktionieren scheint. Leider habe ich nicht die Zeit jetzt, um zu überprüfen, ob es funktioniert für mich, aber ich werde so bald wie möglich und poste wieder meine Ergebnisse. danke!!!
Ich glaube, in diesem code wird zurückgegeben, der text-Knoten, nicht den element-node. Versuchen Sie, es zu drucken-link.parent['href']
Können Sie
re.compile()
auf den text-parameter?InformationsquelleAutor RocketDonkey