BeautifulSoup: Wie man verschachtelte divs

Folgenden code:

<html>
<body>
<div class="category1" id="foo">
      <div class="category2" id="bar">
            <div class="category3">
            </div>
            <div class="category4">
                 <div class="category5"> test
                 </div>
            </div>
      </div>
</div>
</body>
</html>

Gewusst wie: extrahieren Sie das Wort test aus <div class="category5"> test mit BeautifulSoup ich.e, wie man mit verschachtelten divs? Ich habe versucht Suche auf dem Internet, aber ich finde nicht jeden Fall behandeln, dass ein eingängiges Beispiel, so richte ich diese ein. Danke.

  • Was ist mit verschachtelten divs? Was versuchen Sie zu extrahieren, und warum verschachtelte divs bilden ein Hindernis für dieses Ziel? Sie können nur die Suche nach diesen speziellen divs verschachtelt oder nicht.
  • Mögliche Duplikate von: stackoverflow.com/questions/1058599/...
  • Ich denke, das problem kommt von der Tatsache, dass die divs verschachtelt sind, in jedem anderen, denn wenn ich mysoup.findAll('div', attrs={'class':'category5'}) der return-Wert Keiner !
  • es ist nicht eine doppelte Lesen die andere Frage, die du verlinkt uns auch. Hier sind wir mit attrs={...} die Lösung ist anders, wenn man eine Reine Tags wie <td>
  • Nein, wenn Sie nicht finden können, das div mit der Suche, dann ist es nicht in den Baum.
  • welche version von BeautifulSoup verwenden Sie? Was ist eigentlich HTML? Wenn Sie mit BeautifulSoup, haben Sie lxml installiert?
  • dies wurde nichts zu tun, mit Schachteln. Die OP kann nicht finden, ein bestimmtes div, aber die Suche ist korrekt. Was bedeutet, dass das div-Element nicht da ist, die hervorgerufenen werden konnte durch mehrere verschiedene Dinge, nicht zuletzt durch die version von BeautifulSoup und welche parser verwendet wird.

InformationsquelleAutor torr | 2014-10-29
Schreibe einen Kommentar