BeautifulSoup - wie soll ich mich erhalten, den Körper Inhalt

Ich bin Parsen HTML mit BeautifulSoup. Am Ende, ich möchte zu erhalten, die body Inhalt, aber ohne die body - tags. Aber BeautifulSoup fügt html, head, und body - tags. Ich diese googlegrops Diskussion eine mögliche Lösung vorgeschlagen:

>>> from bs4 import BeautifulSoup as Soup
>>> soup = Soup('<p>Some paragraph</p>')
>>> soup.body.hidden = True
>>> soup.body.prettify()
u' <p>\n  Some paragraph\n </p>'

Diese Lösung ist ein hack. Es sollte eine bessere und offensichtliche Weg, es zu tun.

InformationsquelleAutor Philipp Zedler | 2014-01-30

Schreibe einen Kommentar