BeautifulSoup übergeordneten Tags

Habe ich einige html -, ich will zum extrahieren von text aus. Hier ist ein Beispiel für html:

<p>TEXT I WANT <i> &#8211; </i></p>

Nun, es gibt, natürlich, viel  - tags in diesem Dokument. Also find('p') ist nicht ein guter Weg, um den text extrahieren möchten. Jedoch, dass  - tag ist der einzige in dem Dokument. So, ich dachte, ich könnte einfach den  und gehen Sie dann zu den Eltern.

Ich versucht habe:

up = soup.select('p i').parent

und

up = soup.select('i')
print(up.parent)

und ich habe versucht, es mit .parents ich habe versucht find_all('i'), find('i')... Aber ich bekomme immer:

'list' object has no attribute "parent"

Was mache ich falsch?

InformationsquelleAutor porteclefs | 2014-02-25

6

Dies funktioniert:
```
i_tag = soup.find('i')
my_text = str(i_tag.previousSibling).strip()
```
Ausgabe:
```
'TEXT I WANT'
```
Wie bereits in anderen Antworten find_all() gibt eine Liste, in der Erwägung, dass find() gibt das erste match oder None

Wenn Sie unsicher über die Anwesenheit eines i-tag, Sie könnte einfach mit einem try/except block

sooo, das sieht aus wie (bs4) Knoten.find_parent()

InformationsquelleAutor Totem
8

find_all() eine Liste zurückgibt. find('i') gibt die ersten passende element, oder None.

So verwenden:
```
try:
 up = soup.find('i').parent
except AttributeError:
 # no element
```
Demo:
```
>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup('TEXT I WANT &#8211; ')
>>> soup.find('i').parent
TEXT I WANT – 
>>> soup.find('i').parent.text
u'TEXT I WANT \u2013 '
```
Erwähnenswert ist, dass, wenn Sie möchten, verwenden Sie css-Selektoren, können Sie auch tun soup.select('.foo').parent.
Nein, .select() eine Liste zurückgibt. Es würde die Arbeit mit soup.select_one('.foo').parent.
mein schlechtes, das ist es, was ich meinte zu schreiben.

InformationsquelleAutor Martijn Pieters
2

Beide select() und find_all() kehren Sie ein array von Elementen. Sie sollten tun, wie folgt:
```
for el in soup.select('i'):
    print el.parent.text
```
Auf den ersten redaction der Frage, gab es nichts über das, was wirklich benötigt. Ich habe aktualisiert mein code-Beispiel.

InformationsquelleAutor amaslenn
0

soup.select() gibt eine Python-Liste. So haben Sie 'unlist' die variable
z.B.:
```
>>> [up] = soup.select('i')
>>> print(up.parent)
```
oder
```
>>> up = soup.select('i')
>>> print(up[0].parent)
```
InformationsquelleAutor Chad Frederick

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.