Wie kann ich extrahieren nur text in scrapy-Selektor in python

Habe ich diesen code

   site = hxs.select("//h1[@class='state']")
   log.msg(str(site[0].extract()),level=log.ERROR)

Den Ausgang

 [scrapy] ERROR: <h1 class="state"><strong>
            1</strong>
            <span> job containing <strong>php</strong> in <strong>region</strong> paying  <strong>$30-40k per year</strong></span>
                </h1>

Ist es möglich, nur den text ohne html-tags

InformationsquelleAutor der Frage user825904 | 2012-11-21

Schreibe einen Kommentar