Tag: beautifulsoup

Beautiful Soup ist ein Python-package zum Parsen von HTML/XML. Die neueste version dieses Pakets ist die version 4, importiert bs4.

Holen Sie sich meta-tag content-Eigenschaft mit Python und BeautifulSoup

Anzahl der Antworten 2 Antworten
Ich versuche die Verwendung von python und schöne Suppe, den Inhalt zu extrahieren-Teil des tags unten: <meta property="og:title" content="Super Fun Event 1" /> <meta property="og:url" content="http://superfunevents.com/events/super-fun-event-1/" /> Ich bin immer BeautifulSoup zu laden Sie die Seite einfach

BeautifulSoup webscraping find_all( ): Suche nach exakter übereinstimmung

Anzahl der Antworten 2 Antworten
Bin ich mit Python und BeautifulSoup für web-scraping. Können sagen, ich habe den folgenden html-code zu kratzen: <body> <div class="product">Product 1</div> <div class="product">Product 2</div> <div class="product special">Product 3</div> <div class="product special">Product 4</div> </body> Mit BeautifulSoup, ich will

Schön ist Suppe erhältlich für Python 3.4.1?

Anzahl der Antworten 4 Antworten
Ich will, um zu versuchen und machen ein Programm, dass downloads von Bildern aus dem internet, die ich gefunden habe, eine Anleitung, die verwendet Schöne Suppe. Ich habe gehört, der Schöne Suppe vor, so dass ich dachte,

Entfernen <br> - tags analysiert eine Schöne Suppe Liste?

Anzahl der Antworten 4 Antworten
Ich bin derzeit immer in eine for-Schleife mit allen Zeilen, die ich will: page = urllib2.urlopen(pageurl) soup = BeautifulSoup(page) tables = soup.find("td", "bodyTd") for row in tables.findAll('tr'): An dieser Stelle, ich habe meine Informationen, aber die <br

Wie kann ich ersetzen oder entfernen von HTML-Entitäten wie "&nbsp;" mit BeautifulSoup 4

Anzahl der Antworten 3 Antworten
Bin ich die Verarbeitung von HTML mittels Python und BeautifulSoup 4 Bibliothek und ich kann nicht finden, eine offensichtliche Weise zu ersetzen &nbsp; mit einem Leerzeichen. Stattdessen scheint es konvertiert eine Unicode-non-breaking space character. Übersehe ich hier

Die Prüfung für Attribute in BeautifulSoup?

Anzahl der Antworten 4 Antworten
Ich bin Parsen, Daten aus HTML zu Fuß durch die Elemente auf einer bestimmten Ebene mit nextSibling, und machen verschiedene Dinge je nach tag-name und Klasse von jedem element begegnet. z.B., if n.name == "p" and n.class

Ubuntu - Wie installiert man ein Python-Modul (BeautifulSoup) auf Python 3.3 anstelle von Python 2.7?

Anzahl der Antworten 4 Antworten
Habe ich diesen code (wie geschrieben BS4 documentaion): from bs4 import BeautifulSoup Wenn ich das Skript (mit Python ist3) bekomme ich die Fehlermeldung: ImportError: No module named 'bs4' So installiert BeatifulSoup von: sudo pip install BeatifulSoup4 Aber

Extrahieren von Daten aus HTML-Dateien mit Python und BeautifulSoup

Anzahl der Antworten 1 Antworten
Brauche ich zum extrahieren von Daten aus HTML-Dateien. Die betroffenen Dateien sind, die meisten wahrscheinlich automatisch generiert. Hochgeladen habe ich den code einer dieser Dateien auf Pastebin: http://pastebin.com/9Nj2Edfv. Das ist der link zu der eigentlichen Seite: http://eur-lex.europa.eu/Notice.do?checktexts=checkbox&val=60504%3Acs&pos=1&page=1&lang=en&pgs=10&nbl=1&list=60504%3Acs%2C&hwords=&action=GO&visu=%23texte

Wie man ein verschachteltes element in der schönen Suppe

Anzahl der Antworten 2 Antworten
Ich bin kämpfen mit der erforderlichen syntax zu greifen einige hrefs in einer td. Die table -, tr-und td-Elemente müssen keine Klasse oder id. Wenn ich wollte, greifen Sie den Anker in diesem Beispiel, was würde ich

Wo ist BeautifulSoup4 versteckt?

Anzahl der Antworten 3 Antworten
Habe ich sudo pip install BeautifulSoup4 und bekam eine schrecklich optimistisch Antwort: Downloading/unpacking beautifulsoup4 Running setup.py egg_info for package beautifulsoup4 Installing collected packages: beautifulsoup4 Running setup.py install for beautifulsoup4 Successfully installed beautifulsoup4 Cleaning up.. aber wenn ich

beautifulSoup html csv

Anzahl der Antworten 1 Antworten
Guten Abend, ich habe BeautifulSoup zu extrahieren einige Daten von einer website wie folgt: from BeautifulSoup import BeautifulSoup from urllib2 import urlopen soup = BeautifulSoup(urlopen('http://www.fsa.gov.uk/about/media/facts/fines/2002')) table = soup.findAll('table', attrs={ "class" : "table-horizontal-line"}) print table Dies gibt die

Python-beautifulsoup - erste input-Wert

Anzahl der Antworten 2 Antworten
Habe ich viele Zeilen wie diese: <tr> <td>100</td> <td>200</td> <td><input type="radio" value="123599"></td> </tr> Durchlaufen mit: table = BeautifulSoup(response).find(id="sometable") # Make soup. for row in table.find_all("tr")[1:]: # Find rows. cells = row.find_all("td") # Find cells. points = int(cells[0].get_text())

Vorschläge get_text() in BeautifulSoup

Anzahl der Antworten 2 Antworten
Ich bin mit BeautifulSoup Parsen einige Inhalte aus einer html-Seite. Kann ich extrahieren aus dem html die Inhalte, die ich will (also den text in ein span definiert durch die class myclass"). result = mycontent.find(attrs={'class':'myclass'}) Ich erhalten

BeautifulSoup: Hole den Inhalt einer bestimmten Tabelle

Anzahl der Antworten 3 Antworten
Meine lokalen Flughafen disgracefully blockiert Benutzer ohne IE, und sieht schrecklich. Ich möchte schreiben Sie ein Python-Skripte, die die Inhalte der an-und Abreise die Seiten alle paar Minuten, und zeigen Sie Sie in einem besser lesbaren Weise.

mit python urllib2 POST-Anforderung zu senden und eine Reaktion zu erhalten

Anzahl der Antworten 1 Antworten
Ich versuche die HTML-Seite zurück sendet eine POST-Anforderung: import httplib import urllib import urllib2 from BeautifulSoup import BeautifulSoup headers = { 'Host': 'digitalvita.pitt.edu', 'Connection': 'keep-alive', 'Content-Length': '325', 'Origin': 'https://digitalvita.pitt.edu', 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_4)

Wie speichern zurück änderungen an einer HTML-Datei mit BeautifulSoup Python?

Anzahl der Antworten 1 Antworten
Python noob hier... Ich habe das Skript unten, das ändert die hrefs für eine html-Datei (in der Zukunft wird es eine Liste von HTML-Dateien in einem Verzeichnis). Mit beautifulSoup ich es geschafft, Zugriff auf die tag-Werte und

Konvertieren einer HTML-Tabelle zu JSON

Anzahl der Antworten 1 Antworten
Ich versuche zu konvertieren eine Tabelle, die ich entpackt habe über BeautifulSoup in JSON. Bisher habe ich es geschafft zu isolieren, die alle Zeilen, aber ich bin mir nicht sicher, wie Sie mit den Daten von hier

python/beautifulsoup zu finden, alle <a href> mit spezifischen Anker-text

Anzahl der Antworten 1 Antworten
Ich versuche, mit schönen Suppe zum analysieren von html und finden Sie alle href-mit einer spezifischen Anker-tag <a href="http://example.com">TEXT</a> <a href="http://example.com/link">TEXT</a> <a href="http://example.com/page">TEXT</a> alle links, die ich Suche, haben die exakt gleichen anchor-text, in diesem Fall TEXT.

Analysieren von Daten mit BeautifulSoup Python

Anzahl der Antworten 2 Antworten
Ich bin versucht, BeautifulSoup Parsen durch einen DOM-Baum, und extrahieren Sie die Namen der Autoren. Unten ist ein Ausschnitt des HTML-zeigen die Struktur des Codes werde ich kratzen. <html> <body> <div class="list-authors"> <span class="descriptor">Authors:</span> <a href="/find/astro-ph/1/au:+Lin_D/0/1/0/all/0/1">Dacheng Lin</a>,

Python-BeautifulSoup findAll von "class" - Attribut

Anzahl der Antworten 2 Antworten
Möchte ich die folgenden code, das ist, was BS Dokumentation zu tun, sagt, das problem ist nur, dass das Wort "Klasse" ist nicht nur ein Wort. Es kann gefunden werden innerhalb von HTML, aber es ist auch