Tag: beautifulsoup

Beautiful Soup ist ein Python-package zum Parsen von HTML/XML. Die neueste version dieses Pakets ist die version 4, importiert bs4.

Mit beautifulsoup zum extrahieren von text zwischen Zeilenumbrüche (z.B. <br /> - tags)

Anzahl der Antworten 3 Antworten
Habe ich den folgenden HTML-Code, der innerhalb eines größeren Dokuments <br /> Important Text 1 <br /> <br /> Not Important Text <br /> Important Text 2 <br /> Important Text 3 <br /> <br /> Non

BeautifulSoup: Holen Sie sich Inhalt[] als eine einzelne Zeichenfolge

Anzahl der Antworten 4 Antworten
Weiss jemand einen eleganten Weg, um den gesamten Inhalt einer Suppe Objekt als eine einzelne Zeichenfolge? Im moment bin ich immer contentsdas ist natürlich eine Liste, und dann iteriert es: notices = soup.find("div", {"class" : "middlecontent"}) con

Fehler beim installieren von Paket Schöne Suppe. Fehlermeldung ist "SyntaxError: Missing Klammern in call to 'print'"

Anzahl der Antworten 3 Antworten
Habe ich installiert Python 3.5 auf meinem Windows 8 Computer. Ich habe auch installiert Pycharm Community-Version 5.0.4. Ich bin nicht in der Lage zu installieren BeautifulSoup-Modul über "Einstellungen" - Option in Pycharm. Ich erhalte die folgende Fehlermeldung

How to re-install lxml?

Anzahl der Antworten 4 Antworten
Ich bin mit python 2,7.5 auf mac 10.7.5, beautifulsoup 4.2.1. Werde ich parse eine xml-Seite mit der lxml-Bibliothek, wie gelehrt in der beautifulsoup tutorial. Jedoch, wenn ich meinen code, es zeigt bs4.FeatureNotFound: Couldn't find a tree builder

So finden Sie tags nur bestimmte Attribute - BeautifulSoup

Anzahl der Antworten 5 Antworten
Wie würde ich, mit BeautifulSoup, Suche für tags enthält NUR die Attribute, die ich Suche? Zum Beispiel, ich möchte alle zu finden <td valign="top"> - tags. Den folgenden code: raw_card_data = soup.fetch('td', {'valign':re.compile('top')}) bekommt alle Daten, die

wie zu kratzen links mit phantomjs

Anzahl der Antworten 3 Antworten
Kann PhantomJS verwendet werden, eine alternative zu BeautifulSoup? Ich bin mit der Suche auf Etsy und besuchen Sie alle links, die in der Bezeichnung. In Python, ich weiß, wie Sie dies tun (mit BeautifulSoup) aber heute will

Beste Weg für einen Anfänger zu lernen, screen scraping von Python

Anzahl der Antworten 6 Antworten
Könnte dies eine jener Fragen, die sind schwierig zu beantworten, aber hier geht: Ich nicht denke, dass mein selbst Programmierer, aber ich würde gerne 🙂 ich habe gelernt R, denn ich war krank und müde von spss,

Mittels Python und BeautifulSoup (gespeicherte Webseite source-codes in eine lokale Datei)

Anzahl der Antworten 3 Antworten
Ich bin mit Python 2.7 + BeautifulSoup 4.3.2. Ich versuche mittels Python und BeautifulSoup, um Informationen auf einer Webseite. Weil die Webseite ist in der Unternehmens-website setzt die Anmeldung und Umleitung, so dass ich kopieren Sie die

Auszug-element ohne Attribut class

Anzahl der Antworten 2 Antworten
Muss ich navigieren um ein html-element von einem bestimmten Typ. Jedoch gibt es viele solche Elemente auf der Seite, mit vielen verschiedenen Klassen. Ich brauche eine, die keine class-Attribut. Sollte ich für einen Blick mit class ==

Import bs4 in Python 3.5

Anzahl der Antworten 3 Antworten
Ich beide installiert Python-3.5 und Beautifulsoup4. Wenn ich versuche zu importieren, bs4, bekomme ich die Fehlermeldung unten. Gibt es eine Lösung für das? Oder soll ich das einfach installieren von Python 3.4 statt? Bitte sehr explizit -

Set lxml als Standard-BeautifulSoup parser

Anzahl der Antworten 2 Antworten
Arbeite ich an einem web scraping project und lief in Probleme mit der Geschwindigkeit. Zu versuchen, es zu beheben, will ich mit lxml anstelle von html.parser als BeautifulSoup - parser. Ich habe in der Lage, dies zu

Wie finden Kinder von Knoten mit Schönen Suppe

Anzahl der Antworten 6 Antworten
Möchte ich, um alle <a> tags, welche Kinder <li> <div> <li class="test"> <a>link1</a> <ul> <li> <a>link2</a> </li> </ul> </li> </div> Ich weiß, wie zu finden-element mit Besondere Klasse, wie dies soup.find("li", { "class" : "test" }) Aber

TypeError: ein bytes-Objekt wie erforderlich ist, nicht 'str' in python-und CSV

Anzahl der Antworten 3 Antworten
TypeError: ein bytes-Objekt wie erforderlich ist, nicht 'str' immer oben genannten Fehler während der Ausführung unter python-code zu speichern Sie die HTML-Tabelle Daten in der Csv-Datei. weiß nicht, wie man rideup.pls helfen Sie mir. import csv import

Mit BeautifulSoup Extrahieren von Text ohne Tags

Anzahl der Antworten 2 Antworten
Meine Webseite ist so etwas wie das - <p> <strong class="offender">YOB:</strong> 1987<br /> <strong class="offender">RACE:</strong> WHITE<br /> <strong class="offender">GENDER:</strong> FEMALE<br /> <strong class="offender">HEIGHT:</strong> 5'05''<br /> <strong class="offender">WEIGHT:</strong> 118<br /> <strong class="offender">EYE COLOR:</strong> GREEN<br /> <strong class="offender">HAIR COLOR:</strong>

ImportError: Kein Modul namens BeautifulSoup

Anzahl der Antworten 5 Antworten
Habe ich installiert BeautifulSoup mit easy_install und versuchen, führen Sie Folgendes Skript from BeautifulSoup import BeautifulSoup import re doc = ['<html><head><title>Page title</title></head>', '<body><p id="firstpara" align="center">This is paragraph <b>one</b>.', '<p id="secondpara" align="blah">This is paragraph <b>two</b>.', '</html>'] soup =

So finden Sie Elemente nach Klasse

Anzahl der Antworten 9 Antworten
Ich habe Probleme mit dem Parsen von html-Elementen mit der Klasse "class" - Attribut mit Beautifulsoup. Der code sieht so aus soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"]=="stylelistrow"): print div Bekomme ich

Wie kann ich ein neues Tag in ein BeautifulSoup-Objekt einfügen?

Anzahl der Antworten 3 Antworten
Versucht in meinen Kopf zu kriegen html-Bau mit BS. Ich versuche, fügen Sie ein neues tag: self.new_soup.body.insert(3, """<div id="file_history"></div>""") wenn ich das Ergebnis bekomme ich: &lt;div id="file_histor"y&gt;&lt;/div&gt; So, ich bin einfügen einer Zeichenfolge, wird desinfiziert für websichere

Wie kann ich eine Website mit Selenium und Beautifulsoup in Python analysieren?

Anzahl der Antworten 3 Antworten
Neues zu Programmieren und haben herausgefunden, wie um zu navigieren, wo ich gehen müssen mit Selen. Ich möchte die Daten analysieren jetzt aber nicht sicher wo zu beginnen. Kann jemand meine hand halten Sie eine Sekunde, und

Passende IDs in BeautifulSoup

Anzahl der Antworten 4 Antworten
Ich bin mit BeautifulSoup - python-Modul. Ich habe nach einem Hinweis auf das div mit der id wie: 'post-#'. Zum Beispiel: <div id="post-45">...</div> <div id="post-334">...</div> Wie kann ich filtern? html = '<div id="post-45">...</div> <div id="post-334">...</div>' soupHandler =

BeautifulSoup HTML-Tabellenanalyse

Anzahl der Antworten 2 Antworten
Ich versuche zu analysieren, die Informationen (html-Tabellen) von dieser Seite: http://www.511virginia.org/RoadConditions.aspx?j=All&r=1 Derzeit bin ich mit BeautifulSoup und der code, den ich habe, sieht wie folgt aus from mechanize import Browser from BeautifulSoup import BeautifulSoup mech = Browser()

BeautifulSoup: Einfach in ein Tag einsteigen, egal wie viele umschließende Tags es gibt

Anzahl der Antworten 4 Antworten
Ich versuche, die kratzen alle die innere html von der <p> - Elemente in eine web-Seite mit BeautifulSoup. Es werden interne tags, aber das ist mir egal, ich will einfach nur, um die internen text. Beispielsweise für:

Python / BeautifulSoup - Wie entferne ich alle Tags von einem Element?

Anzahl der Antworten 6 Antworten
Wie kann ich die Bänder einfach alle tags aus einem element finde ich in BeautifulSoup? InformationsquelleAutor der Frage Daniele B | 2013-04-25

Schöne Suppe: 'ResultSet' Objekt hat kein Attribut 'find_all'?

Anzahl der Antworten 3 Antworten
Ich versuche, mich zu kratzen, eine einfache Tabelle mit Schöne Suppe. Hier ist mein code: import requests from bs4 import BeautifulSoup url = 'https://gist.githubusercontent.com/anonymous/c8eedd8bf41098a8940b/raw/c7e01a76d753f6e8700b54821e26ee5dde3199ab/gistfile1.txt' r = requests.get(url) soup = BeautifulSoup(r.text) table = soup.find_all(class_='dataframe') first_name = last_name

Wie kann ich href-Links von HTML mit Python bekommen?

Anzahl der Antworten 6 Antworten
import urllib2 website = "WEBSITE" openwebsite = urllib2.urlopen(website) html = getwebsite.read() print html So weit So gut. Aber ich will nur href-links aus der plain text HTML. Wie kann ich dieses problem lösen? InformationsquelleAutor der Frage user371012

Wie kann UTF-8-codiertes HTML mit BeautifulSoup korrekt in Unicode-Strings umgewandelt werden?

Anzahl der Antworten 2 Antworten
Bin ich mit einem Python-Programm liest eine UTF-8-codierte web-Seite, und ich extrahiere text aus dem HTML mit BeautifulSoup. Jedoch, wenn ich Schreibe diesen text in eine Datei (oder drucken Sie es auf der Konsole), es wird geschrieben

ImportError: Kein Modul namens bs4 (BeautifulSoup)

Anzahl der Antworten 7 Antworten
Arbeite ich in Python mit Flask. Wenn ich mit meinem main Python-Datei auf meinem computer, es funktioniert perfekt, aber wenn ich aktivieren venv und führen Sie den Kolben Python-Datei in das terminal, es sagt, dass mein main

UnicodeEncodeError: 'ascii' Codec kann das Zeichen u '\ xa0' nicht an Position 20 codieren: Ordnungszahl nicht im Bereich (128)

Anzahl der Antworten 20 Antworten
Ich Probleme mit dem Umgang mit unicode-Zeichen aus dem text geholt von verschiedenen web-Seiten (auf verschiedenen Websites). Ich bin mit BeautifulSoup. Das problem ist, dass der Fehler nicht immer reproduzierbar; manchmal funktioniert es mit einigen Seiten, und

Konvertieren von HTML in Text mit Python

Anzahl der Antworten 5 Antworten
Ich versuche zu konvertieren ein html-block, um den text mit Python. Eingang: <div class="body"><p><strong></strong></p> <p><strong></strong>Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa</p> <p>Consectetuer adipiscing elit. <a href="http://example.com/" target="_blank" class="source">Some Link</a>

Unterschied zwischen .string und .text BeautifulSoup

Anzahl der Antworten 3 Antworten
Bemerkte ich etwas sonderbares über die bei der Arbeit mit BeautifulSoup und konnte Sie nicht finden, keine Dokumentation zur Unterstützung dieser also ich wollte Fragen hier. Sagen, wir haben eine tags wie diesen, haben wir analysiert, mit

Python BeautifulSoup gibt mehrere Tags an findAll

Anzahl der Antworten 2 Antworten
Ich bin auf der Suche nach einem Weg, um findAll, um zwei tags, in der Reihenfolge, wie Sie erscheinen auf der Seite. Derzeit habe ich: import requests import BeautifulSoup def get_soup(url): request = requests.get(url) page = request.text

Unterschied zwischen BeautifulSoup und Scrapy Crawler?

Anzahl der Antworten 5 Antworten
Ich möchte eine website zu machen, zeigt der Vergleich zwischen amazon und e-bay-Produkt-Preis. Welche dieser arbeiten besser und warum? Ich bin ein wenig vertraut mit BeautifulSoup aber nicht so viel mit Scrapy crawler. InformationsquelleAutor der Frage Nishant

Extrahieren eines Attributwertes mit beautifulsoup

Anzahl der Antworten 5 Antworten
Ich versuche, den Inhalt zu extrahieren eines einzigen "Wert" - Attribut in einem bestimmten "input" - Tags auf einer Webseite. Ich verwende den folgenden code: import urllib f = urllib.urlopen("http://58.68.130.147") s = f.read() f.close() from BeautifulSoup import

Testen Sie, ob ein Attribut in BeautifulSoup in einem Tag vorhanden ist

Anzahl der Antworten 6 Antworten
Ich würde gerne alle <script> - tags in einem Dokument und dann jeweils basierend auf dem Vorhandensein (oder fehlen) bestimmter Attribute. E. g., für jede <script> tag, wenn das Attribut for vorhanden ist, etwas tun, sonst, wenn

Schöne Suppe und extrahieren ein div und seinen Inhalt nach ID

Anzahl der Antworten 10 Antworten
soup.find("tagName", { "id" : "articlebody" }) Warum wird diese NICHT wieder die <div id="articlebody"> ... </div> tags und Zeug dazwischen? Es gibt nichts zurück. Und ich weiß, für eine Tatsache, dass es existiert, weil ich bin Recht

BeautifulSoup Grab Visible Webpage Text

Anzahl der Antworten 8 Antworten
Im Grunde will ich mit BeautifulSoup zu greifen, ausschließlich die sichtbaren text auf einer Webseite. Zum Beispiel, diese Webseite ist mein test-Fall. Und möchte ich hauptsächlich nur den text (Artikel) und vielleicht noch ein paar Registerkarte Namen

Kann ich Skript-Tags mit BeautifulSoup entfernen?

Anzahl der Antworten 3 Antworten
Können script-tags und Ihre Inhalte entfernt werden, die aus HTML mit BeautifulSoup, oder muss ich Reguläre Ausdrücke verwenden oder etwas anderes? InformationsquelleAutor der Frage Sam | 2011-04-08

Wie BeautifulSoup Benutzer Warnung loswerden?

Anzahl der Antworten 2 Antworten
Installiert, nachdem ich BeautifulSoup, Wenn ich meine Python-cmd, diese Warnung kommt. D:\Application\python\lib\site-packages\beautifulsoup4-4.4.1-py3.4.egg\bs4\__init__.py:166: UserWarning: No parser was explicitly specified, so I'm using the best available HTML parser for this system ("html.parser"). This usually isn't a problem, but if

Entfernen Sie ein Tag mit BeautifulSoup, aber behalten Sie den Inhalt bei

Anzahl der Antworten 10 Antworten
Aktuell habe ich code so etwas wie dieses: soup = BeautifulSoup(value) for tag in soup.findAll(True): if tag.name not in VALID_TAGS: tag.extract() soup.renderContents() Außer ich will nicht Weg zu werfen, den Inhalt im inneren der ungültigen tag. Wie

Bildschirm-Scraping: Fortbewegung "HTTP Error 403: Anfrage nicht erlaubt von robots.txt"

Anzahl der Antworten 8 Antworten
Gibt es einen Weg, um die folgenden? httperror_seek_wrapper: HTTP Error 403: request disallowed by robots.txt Ist der einzige Weg, um dieses zu Kontaktieren, die Website-Besitzer (barnesandnoble.com).. ich bin den Aufbau einer Website, das würde Sie bringen mehr

BeautifulSoup innerhtml?

Anzahl der Antworten 5 Antworten
Sagen wir, ich habe eine Seite mit einem div. Kann ich das div mit soup.find(). Nun, dass ich das Ergebnis, ich möchte drucken Sie die GESAMTE innerhtml des div: ich meine, ich brauche einen string mit ALLEN

Schöne Suppe, URL zu analysieren, um andere URLs zu erhalten

Anzahl der Antworten 3 Antworten
Ich brauche zum analysieren einer url, um eine Liste von urls, die einen link auf eine detail-Seite. Dann von dieser Seite aus die ich brauche, um all die details aus, die Seite. Ich muss es tun, weil

BeautifulSoup verwenden, um ein HTML-Tag zu finden, das bestimmten Text enthält

Anzahl der Antworten 3 Antworten
Ich versuche, die Elemente in einem HTML-Dokument, enthalten die folgenden Muster-text: #\S{11} <h2> this is cool #12345678901 </h2> So, die bisherigen passen würden, durch den Einsatz von: soup('h2',text=re.compile(r' #\S{11}')) Und das Ergebnis wäre so etwas wie: [u'blahblah

Parsing HTML in Python - Lxml oder BeautifulSoup? Welche davon ist besser für welche Zwecke?

Anzahl der Antworten 7 Antworten
Aus, was kann ich machen, die beiden wichtigsten HTML-parsing-libraries in Python sind lxml und BeautifulSoup. Ich habe mich entschieden BeautifulSoup für ein Projekt an dem ich arbeite, aber ich wählte es für sich keine besonderen anderen Grund,

UnicodeEncodeError: 'Charmap' Codec kann keine Zeichen codieren

Anzahl der Antworten 3 Antworten
Ich versuche, mich zu kratzen, eine website, aber es gibt mir eine Fehlermeldung. Ich bin mit dem folgenden code: import urllib.request from bs4 import BeautifulSoup get = urllib.request.urlopen("https://www.website.com/") html = get.read() soup = BeautifulSoup(html) print(soup) Und ich

Python BeautifulSoup extrahiert Text zwischen Elementen

Anzahl der Antworten 7 Antworten
Ich versuche, zu extrahieren "DIES IST MEIN TEXT" aus dem folgenden HTML-Code: <html> <body> <table> <td class="MYCLASS"> <!-- a comment --> <a hef="xy">Text</a> <p>something</p> THIS IS MY TEXT <p>something else</p> </br> </td> </table> </body> </html> Versuchte ich

Beautiful Soup kann keine CSS-Klasse finden, wenn das Objekt auch andere Klassen besitzt

Anzahl der Antworten 4 Antworten
wenn eine Seite <div class="class1"> und <p class="class1">dann soup.findAll(True, 'class1') finden Sie beides. Wenn es <p class="class1 class2"> wird es aber nicht gefunden werden. Wie finde ich alle Objekte mit einer bestimmten Klasse, unabhängig davon, ob Sie

Python BeautifulSoup Parsingtabelle

Anzahl der Antworten 2 Antworten
Lerne ich python requests und BeautifulSoup. Für eine übung, die ich ausgewählt haben, schreiben Sie eine kurze NYC parking ticket-parser. Ich bin in der Lage zu bekommen, eine html-Antwort, die ist ziemlich hässlich. Ich brauche zu greifen,

Python: BeautifulSoup - Ermittelt einen Attributwert basierend auf dem Attribut name

Anzahl der Antworten 6 Antworten
Will ich drucken Sie den Attributwert basierend auf Ihren Namen, nehmen Sie zum Beispiel <META NAME="City" content="Austin"> Ich möchte so etwas wie dies tun soup = BeautifulSoup(f) //f is some HTML containing the above meta tag for

HTML in einfachen Text mit Python gerendert

Anzahl der Antworten 2 Antworten
Ich versuche, zu konvertieren, ein Stück HTML-text mit BeautifulSoup. Hier ist ein Beispiel: <div> <p> Some text <span>more text</span> even more text </p> <ul> <li>list item</li> <li>yet another list item</li> </ul> </div> <p>Some other text</p> <ul> <li>list

Python und BeautifulSoup Codierungsprobleme

Anzahl der Antworten 5 Antworten
Ich Schreibe ein crawler mit Python mit BeautifulSoup und alles ging swimmingly, bis ich lief in dieser Website: http://www.elnorte.ec/ Ich bin immer der Inhalt mit den Anforderungen der Bibliothek: r = requests.get('http://www.elnorte.ec/') content = r.content Wenn ich