Tag: beautifulsoup

Beautiful Soup ist ein Python-package zum Parsen von HTML/XML. Die neueste version dieses Pakets ist die version 4, importiert bs4.

Python reguläre Ausdrücke für Schöne Suppe

Anzahl der Antworten 1 Antworten
Ich bin mit Schönen Suppe, ziehen aus bestimmten div-tags, und es scheint, ich kann nicht verwenden einfache string-matching. Die Seite hat einige Markierungen in form von <div class="comment form new"...> was ich will, Sie zu ignorieren, und

Wie zu beheben AttributeError: 'NoneType' object hat keine attribute 'encode' in python

Anzahl der Antworten 1 Antworten
for comment_entry in comment_feed.entry: content = comment_entry.ToString() parse = BeautifulSoup(content) for con in parse.find('ns0:content'): print con.string s = con.string file.write(s.encode('utf8')) Fehler, die ich immer bin: File "channel_search.py", line 108, in youtube_search file.write(s.encode('utf8')) AttributeError: 'NoneType' object has no

Python wird nicht in Datei schreiben

Anzahl der Antworten 2 Antworten
Ich bin versucht zu schreiben, eine ziemlich gedruckte E-Mail .txt-Datei, so kann ich besser sehen, was ich möchte, zu analysieren. Hier ist dieser Abschnitt aus meinem code: result, data = mail.uid('search', None, "(FROM '[email protected]')") # search and

Extrahieren der Inhalte der Tabellen aus html-Seiten mit python und BeautifulSoup

Anzahl der Antworten 1 Antworten
Möchte ich zum extrahieren bestimmter Informationen aus einem html-Dokument. E. g. es enthält eine Tabelle (unter anderem Tabellen und andere Inhalte) wie folgt: <table class="details"> <tr> <th>Advisory:</th> <td>RHBA-2013:0947-1</td> </tr> <tr> <th>Type:</th> <td>Bug Fix Advisory</td> </tr> <tr> <th>Severity:</th>

Parsen von nicht-standard-XML - (CDATA-tag)

Anzahl der Antworten 2 Antworten
Wenn ich will) bis zum Parsen von XML-Dokument mit Python Bibliothek BeautifulSoup, Ich stellte mich vor einige Probleme. Das XML-Dokument, das ich will, zu analysieren: <item> <title><![CDATA[Title Sample]]></title> <link /><![CDATA[http://banhada.kr/?cateCode=09&viewCode=S0941580]]> <time_start>2011-10-10 09:00:00</time_start> <time_end>2011-10-17 09:00:00</time_end> <price_original>35000</price_original> <price_now>20000</price_now> </item>

BeautifulSoup - wie soll ich mich erhalten, den Körper Inhalt

Anzahl der Antworten 1 Antworten
Ich bin Parsen HTML mit BeautifulSoup. Am Ende, ich möchte zu erhalten, die body Inhalt, aber ohne die body - tags. Aber BeautifulSoup fügt html, head, und body - tags. Ich diese googlegrops Diskussion eine mögliche Lösung

Holen Sie sich Inhalte von div-id mit BeautifulSoup

Anzahl der Antworten 1 Antworten
Bin ich mit python2.7.6, urllib2, und BeautifulSoup extrahieren von html-Code aus einer website und speichern Sie in einer Variablen. Wie kann ich nur den html-Inhalt einer div mit einer id durch die Verwendung von beautifulsoup? <div id='theDiv'>

BeautifulSoup übergeordneten Tags

Anzahl der Antworten 4 Antworten
Habe ich einige html -, ich will zum extrahieren von text aus. Hier ist ein Beispiel für html: <p>TEXT I WANT <i> &#8211; </i></p> Nun, es gibt, natürlich, viel <p> - tags in diesem Dokument. Also find('p')

Kann nicht install BeautifulSoup python 3.6

Anzahl der Antworten 6 Antworten
Ich habe die letzten 45 Minuten hoffnungslos versuchen zu laufen: from bs4 import BeautifulSoup Aber ohne Erfolg. Ich habe versucht die Befehle: python -m pip install beautifulsoup4 wo es heißt: Requirement already satisfied: beautifulsoup4 in c:\python27\lib\site-packages Habe

Wie kann ich Informationen aus einem <a href> - tag im <div> - tags mit BeautifulSoup und Python?

Anzahl der Antworten 2 Antworten
alle. Ich habe eine kurze Frage über BeautifulSoup Python-Skript. Ich habe mehrere bits von HTML, die wie folgt Aussehen (die einzigen Unterschiede sind die links-und Produktnamen), und ich versuche, den link von der "href" - Attribut. <div

Nicht importieren Sie Schöne Suppe

Anzahl der Antworten 6 Antworten
Ich bin versucht, BeautifulSoup, und trotz der Verwendung der import-Anweisung: from bs4 import BeautifulSoup Bin ich immer die Fehlermeldung: ImportError: cannot import name BeautifulSoup import bs4 gibt keine Fehler. Habe ich auch schon versucht import bs4.BeautifulSoup und

So finden alle Kommentare mit Schönen Suppe

Anzahl der Antworten 2 Antworten
Diese Frage gefragt wurde, vor vier Jahren, aber die Antwort ist jetzt out-of-date für BS4. Möchte ich löschen alle Kommentare in meine html-Datei mit schöne Suppe. Da BS4 macht jeder Kommentar als eine Besondere Art von schiffbaren

Holen Sie sich alle HTML-tags mit Schönen Suppe

Anzahl der Antworten 1 Antworten
Ich versuche zu bekommen eine Liste von allen html-tags aus dem schönen Suppe. Sehe ich alle suchen, aber ich muss wissen, den Namen der tag, bevor ich Suche. Wenn es nur text ist, wie html = """<div>something</div>

Suche in tags mit BeautifulSoup Python

Anzahl der Antworten 2 Antworten
Wollte ich-Suche innerhalb der Metadaten: <div id="cmeProductSlatePaginiationTop" class="cmePaginiation"> <ul> <li class="disabled"> <li class="active"> <li class="away-1"> <li> </ul> </div> Grundsätzlich möchte ich die Anzahl der occurunces von <li ..> in diesem div. Allerdings, wenn ich verwendet, beautifulsoup, das

ZERLEGUNG von HTML -, link-text und Ziel -

Anzahl der Antworten 4 Antworten
Gegeben, einen HTML-link wie <a href="urltxt" class="someclass" close="true">texttxt</a> wie kann ich isolieren Sie die url und den text? Updates Ich bin mit der Schönen Suppe, und bin nicht in der Lage, herauszufinden, wie zu tun. Habe ich

So entfernen Sie Leerzeichen in BeautifulSoup

Anzahl der Antworten 3 Antworten
Ich habe eine Reihe von HTML-ich bin parsing mit BeautifulSoup und es läuft ziemlich gut, außer für einen kleinen Haken. Ich möchte speichern Sie die Ausgabe in eine single-gefüttert-string, mit dem folgenden, da meine aktuelle Ausgabe: <li><span

wie installiere ich schöne Suppe für python auf meinem mac? siehe Fehler

Anzahl der Antworten 2 Antworten
Ich bin mit Mac OS X 10.7.3 auf einem Macbook Pro. Es kam mit Python 2.7.1 installiert. Ich brauche das schöne Suppe Bibliothek. Also habe ich Folgendes gemacht: 1) ging crummy.com und heruntergeladen werden beautifulsoup4-4.0.2.tar.gz 2), nicht

BeautifulSoup findall mit class-Attribut - unicode-encode Fehler

Anzahl der Antworten 3 Antworten
Ich bin mit BeautifulSoup zum extrahieren von Nachrichten Geschichten(nur die Titel) von Hacker News und haben soviel bis jetzt- import urllib2 from BeautifulSoup import BeautifulSoup HN_url = "http://news.ycombinator.com" def get_page(): page_html = urllib2.urlopen(HN_url) return page_html def get_stories(content):

Erhalten Sie sofortigen übergeordnetes tag mit BeautifulSoup Python

Anzahl der Antworten 1 Antworten
Habe ich recherchiert, diese Frage, aber habe nicht gesehen, eine tatsächliche Lösung zu einer Lösung. Ich bin mit BeautifulSoup mit Python und was weis ich zu tun ist, erhalten alle image-tags von einer Seite, Schleife über jede

Scraping, Daten von Facebook mit Python

Anzahl der Antworten 4 Antworten
Ich versuche schon seit mehreren Tagen (erfolglos) zu kratzen Städten von über 500 Facebook-URLs. Jedoch, Facebook behandelt seine Daten in eine sehr seltsame Weise, und ich kann nicht herausfinden, was Los ist unter der Haube zu verstehen,