python/beautifulsoup zu finden, alle <a href> mit spezifischen Anker-text

Ich versuche, mit schönen Suppe zum analysieren von html und finden Sie alle href-mit einer spezifischen Anker-tag

<a href="http://example.com">TEXT</a>
<a href="http://example.com/link">TEXT</a>
<a href="http://example.com/page">TEXT</a>

alle links, die ich Suche, haben die exakt gleichen anchor-text, in diesem Fall TEXT. Ich bin NICHT auf der Suche nach der word-TEXT, möchte ich den word-TEXT zu finden, die alle unterschiedliche HREF

edit:

zur Verdeutlichung der Suche nach etwas ähnliches mit der Klasse zu analysieren, für die links

<a href="http://example.com" class="visible">TEXT</a>
<a href="http://example.com/link" class="visible">TEXT</a>
<a href="http://example.com/page" class="visible">TEXT</a>

und dann mit

findAll('a', 'visible')

außer dem HTML bin ich Parsen muss nicht eine Klasse, sondern immer den gleichen anchor-text

InformationsquelleAutor cwal | 2012-11-05

Schreibe einen Kommentar