Tag: beautifulsoup

Beautiful Soup ist ein Python-package zum Parsen von HTML/XML. Die neueste version dieses Pakets ist die version 4, importiert bs4.

Mit beautifulsoup zum extrahieren von text zwischen Zeilenumbrüche (z.B. <br /> - tags)

Anzahl der Antworten

3 Antworten

Habe ich den folgenden HTML-Code, der innerhalb eines größeren Dokuments <br /> Important Text 1 <br /> <br /> Not Important Text <br /> Important Text 2 <br /> Important Text 3 <br /> <br /> Non

beautifulsoup html html-parsing python

BeautifulSoup: Holen Sie sich Inhalt[] als eine einzelne Zeichenfolge

Anzahl der Antworten

4 Antworten

Weiss jemand einen eleganten Weg, um den gesamten Inhalt einer Suppe Objekt als eine einzelne Zeichenfolge? Im moment bin ich immer contentsdas ist natürlich eine Liste, und dann iteriert es: notices = soup.find("div", {"class" : "middlecontent"}) con

beautifulsoup python

Fehler beim installieren von Paket Schöne Suppe. Fehlermeldung ist "SyntaxError: Missing Klammern in call to 'print'"

Anzahl der Antworten

3 Antworten

Habe ich installiert Python 3.5 auf meinem Windows 8 Computer. Ich habe auch installiert Pycharm Community-Version 5.0.4. Ich bin nicht in der Lage zu installieren BeautifulSoup-Modul über "Einstellungen" - Option in Pycharm. Ich erhalte die folgende Fehlermeldung

beautifulsoup python python-3.x

How to re-install lxml?

Anzahl der Antworten

4 Antworten

Ich bin mit python 2,7.5 auf mac 10.7.5, beautifulsoup 4.2.1. Werde ich parse eine xml-Seite mit der lxml-Bibliothek, wie gelehrt in der beautifulsoup tutorial. Jedoch, wenn ich meinen code, es zeigt bs4.FeatureNotFound: Couldn't find a tree builder

beautifulsoup easy-install lxml python

So finden Sie tags nur bestimmte Attribute - BeautifulSoup

Anzahl der Antworten

5 Antworten

Wie würde ich, mit BeautifulSoup, Suche für tags enthält NUR die Attribute, die ich Suche? Zum Beispiel, ich möchte alle zu finden <td valign="top"> - tags. Den folgenden code: raw_card_data = soup.fetch('td', {'valign':re.compile('top')}) bekommt alle Daten, die

beautifulsoup python

wie zu kratzen links mit phantomjs

Anzahl der Antworten

3 Antworten

Kann PhantomJS verwendet werden, eine alternative zu BeautifulSoup? Ich bin mit der Suche auf Etsy und besuchen Sie alle links, die in der Bezeichnung. In Python, ich weiß, wie Sie dies tun (mit BeautifulSoup) aber heute will

beautifulsoup casperjs javascript phantomjs

Beste Weg für einen Anfänger zu lernen, screen scraping von Python

Anzahl der Antworten

6 Antworten

Könnte dies eine jener Fragen, die sind schwierig zu beantworten, aber hier geht: Ich nicht denke, dass mein selbst Programmierer, aber ich würde gerne 🙂 ich habe gelernt R, denn ich war krank und müde von spss,

beautifulsoup lxml python scrapy screen-scraping

Mittels Python und BeautifulSoup (gespeicherte Webseite source-codes in eine lokale Datei)

Anzahl der Antworten

3 Antworten

Ich bin mit Python 2.7 + BeautifulSoup 4.3.2. Ich versuche mittels Python und BeautifulSoup, um Informationen auf einer Webseite. Weil die Webseite ist in der Unternehmens-website setzt die Anmeldung und Umleitung, so dass ich kopieren Sie die

beautifulsoup python

Auszug-element ohne Attribut class

Anzahl der Antworten

2 Antworten

Muss ich navigieren um ein html-element von einem bestimmten Typ. Jedoch gibt es viele solche Elemente auf der Seite, mit vielen verschiedenen Klassen. Ich brauche eine, die keine class-Attribut. Sollte ich für einen Blick mit class ==

beautifulsoup python

Import bs4 in Python 3.5

Anzahl der Antworten

3 Antworten

Ich beide installiert Python-3.5 und Beautifulsoup4. Wenn ich versuche zu importieren, bs4, bekomme ich die Fehlermeldung unten. Gibt es eine Lösung für das? Oder soll ich das einfach installieren von Python 3.4 statt? Bitte sehr explizit -

beautifulsoup html-parsing python python-3.5 python-3.x

Set lxml als Standard-BeautifulSoup parser

Anzahl der Antworten

2 Antworten

Arbeite ich an einem web scraping project und lief in Probleme mit der Geschwindigkeit. Zu versuchen, es zu beheben, will ich mit lxml anstelle von html.parser als BeautifulSoup - parser. Ich habe in der Lage, dies zu

beautifulsoup html html-parsing lxml python

Wie finden Kinder von Knoten mit Schönen Suppe

Anzahl der Antworten

6 Antworten

Möchte ich, um alle <a> tags, welche Kinder <li> <div> <li class="test"> <a>link1</a> <ul> <li> <a>link2</a> </li> </ul> </li> </div> Ich weiß, wie zu finden-element mit Besondere Klasse, wie dies soup.find("li", { "class" : "test" }) Aber

beautifulsoup html python

TypeError: ein bytes-Objekt wie erforderlich ist, nicht 'str' in python-und CSV

Anzahl der Antworten

3 Antworten

TypeError: ein bytes-Objekt wie erforderlich ist, nicht 'str' immer oben genannten Fehler während der Ausführung unter python-code zu speichern Sie die HTML-Tabelle Daten in der Csv-Datei. weiß nicht, wie man rideup.pls helfen Sie mir. import csv import

beautifulsoup csv html-table python-3.x

Mit BeautifulSoup Extrahieren von Text ohne Tags

Anzahl der Antworten

2 Antworten

Meine Webseite ist so etwas wie das - <p> <strong class="offender">YOB:</strong> 1987<br /> <strong class="offender">RACE:</strong> WHITE<br /> <strong class="offender">GENDER:</strong> FEMALE<br /> <strong class="offender">HEIGHT:</strong> 5'05''<br /> <strong class="offender">WEIGHT:</strong> 118<br /> <strong class="offender">EYE COLOR:</strong> GREEN<br /> <strong class="offender">HAIR COLOR:</strong>

beautifulsoup python web-scraping

ImportError: Kein Modul namens BeautifulSoup

Anzahl der Antworten

5 Antworten

Habe ich installiert BeautifulSoup mit easy_install und versuchen, führen Sie Folgendes Skript from BeautifulSoup import BeautifulSoup import re doc = ['<html><head><title>Page title</title></head>', '<body><p id="firstpara" align="center">This is paragraph <b>one</b>.', '<p id="secondpara" align="blah">This is paragraph <b>two</b>.', '</html>'] soup =

beautifulsoup python

So finden Sie Elemente nach Klasse

Anzahl der Antworten

9 Antworten

Ich habe Probleme mit dem Parsen von html-Elementen mit der Klasse "class" - Attribut mit Beautifulsoup. Der code sieht so aus soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"]=="stylelistrow"): print div Bekomme ich

beautifulsoup html python

Wie kann ich ein neues Tag in ein BeautifulSoup-Objekt einfügen?

Anzahl der Antworten

3 Antworten

Versucht in meinen Kopf zu kriegen html-Bau mit BS. Ich versuche, fügen Sie ein neues tag: self.new_soup.body.insert(3, """<div id="file_history"></div>""") wenn ich das Ergebnis bekomme ich: <div id="file_histor"y></div> So, ich bin einfügen einer Zeichenfolge, wird desinfiziert für websichere

beautifulsoup python

Wie kann ich eine Website mit Selenium und Beautifulsoup in Python analysieren?

Anzahl der Antworten

3 Antworten

Neues zu Programmieren und haben herausgefunden, wie um zu navigieren, wo ich gehen müssen mit Selen. Ich möchte die Daten analysieren jetzt aber nicht sicher wo zu beginnen. Kann jemand meine hand halten Sie eine Sekunde, und

beautifulsoup python selenium

Passende IDs in BeautifulSoup

Anzahl der Antworten

4 Antworten

Ich bin mit BeautifulSoup - python-Modul. Ich habe nach einem Hinweis auf das div mit der id wie: 'post-#'. Zum Beispiel: <div id="post-45">...</div> <div id="post-334">...</div> Wie kann ich filtern? html = '<div id="post-45">...</div> <div id="post-334">...</div>' soupHandler =

beautifulsoup python

BeautifulSoup HTML-Tabellenanalyse

Anzahl der Antworten

2 Antworten

Ich versuche zu analysieren, die Informationen (html-Tabellen) von dieser Seite: http://www.511virginia.org/RoadConditions.aspx?j=All&r=1 Derzeit bin ich mit BeautifulSoup und der code, den ich habe, sieht wie folgt aus from mechanize import Browser from BeautifulSoup import BeautifulSoup mech = Browser()

beautifulsoup html-parsing html-table mechanize python

BeautifulSoup: Einfach in ein Tag einsteigen, egal wie viele umschließende Tags es gibt

Anzahl der Antworten

4 Antworten

Ich versuche, die kratzen alle die innere html von der <p> - Elemente in eine web-Seite mit BeautifulSoup. Es werden interne tags, aber das ist mir egal, ich will einfach nur, um die internen text. Beispielsweise für:

beautifulsoup python

Python / BeautifulSoup - Wie entferne ich alle Tags von einem Element?

Anzahl der Antworten

6 Antworten

Wie kann ich die Bänder einfach alle tags aus einem element finde ich in BeautifulSoup? InformationsquelleAutor der Frage Daniele B | 2013-04-25

beautifulsoup python

Schöne Suppe: 'ResultSet' Objekt hat kein Attribut 'find_all'?

Anzahl der Antworten

3 Antworten

Ich versuche, mich zu kratzen, eine einfache Tabelle mit Schöne Suppe. Hier ist mein code: import requests from bs4 import BeautifulSoup url = 'https://gist.githubusercontent.com/anonymous/c8eedd8bf41098a8940b/raw/c7e01a76d753f6e8700b54821e26ee5dde3199ab/gistfile1.txt' r = requests.get(url) soup = BeautifulSoup(r.text) table = soup.find_all(class_='dataframe') first_name = last_name

beautifulsoup python

Wie kann ich href-Links von HTML mit Python bekommen?

Anzahl der Antworten

6 Antworten

import urllib2 website = "WEBSITE" openwebsite = urllib2.urlopen(website) html = getwebsite.read() print html So weit So gut. Aber ich will nur href-links aus der plain text HTML. Wie kann ich dieses problem lösen? InformationsquelleAutor der Frage user371012

beautifulsoup href html hyperlink python

Wie kann UTF-8-codiertes HTML mit BeautifulSoup korrekt in Unicode-Strings umgewandelt werden?

Anzahl der Antworten

2 Antworten

Bin ich mit einem Python-Programm liest eine UTF-8-codierte web-Seite, und ich extrahiere text aus dem HTML mit BeautifulSoup. Jedoch, wenn ich Schreibe diesen text in eine Datei (oder drucken Sie es auf der Konsole), es wird geschrieben

beautifulsoup python unicode urllib2 utf-8

ImportError: Kein Modul namens bs4 (BeautifulSoup)

Anzahl der Antworten

7 Antworten

Arbeite ich in Python mit Flask. Wenn ich mit meinem main Python-Datei auf meinem computer, es funktioniert perfekt, aber wenn ich aktivieren venv und führen Sie den Kolben Python-Datei in das terminal, es sagt, dass mein main

beautifulsoup flask importerror python

UnicodeEncodeError: 'ascii' Codec kann das Zeichen u '\ xa0' nicht an Position 20 codieren: Ordnungszahl nicht im Bereich (128)

Anzahl der Antworten

20 Antworten

Ich Probleme mit dem Umgang mit unicode-Zeichen aus dem text geholt von verschiedenen web-Seiten (auf verschiedenen Websites). Ich bin mit BeautifulSoup. Das problem ist, dass der Fehler nicht immer reproduzierbar; manchmal funktioniert es mit einigen Seiten, und

beautifulsoup python python-2.x python-unicode unicode

Konvertieren von HTML in Text mit Python

Anzahl der Antworten

5 Antworten

Ich versuche zu konvertieren ein html-block, um den text mit Python. Eingang: <div class="body"><p><strong></strong></p> <p><strong></strong>Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa</p> <p>Consectetuer adipiscing elit. <a href="http://example.com/" target="_blank" class="source">Some Link</a>

beautifulsoup python web-scraping

Unterschied zwischen .string und .text BeautifulSoup

Anzahl der Antworten

3 Antworten

Bemerkte ich etwas sonderbares über die bei der Arbeit mit BeautifulSoup und konnte Sie nicht finden, keine Dokumentation zur Unterstützung dieser also ich wollte Fragen hier. Sagen, wir haben eine tags wie diesen, haben wir analysiert, mit

beautifulsoup python

Python BeautifulSoup gibt mehrere Tags an findAll

Anzahl der Antworten

2 Antworten

Ich bin auf der Suche nach einem Weg, um findAll, um zwei tags, in der Reihenfolge, wie Sie erscheinen auf der Seite. Derzeit habe ich: import requests import BeautifulSoup def get_soup(url): request = requests.get(url) page = request.text

beautifulsoup python

Unterschied zwischen BeautifulSoup und Scrapy Crawler?

Anzahl der Antworten

5 Antworten

Ich möchte eine website zu machen, zeigt der Vergleich zwischen amazon und e-bay-Produkt-Preis. Welche dieser arbeiten besser und warum? Ich bin ein wenig vertraut mit BeautifulSoup aber nicht so viel mit Scrapy crawler. InformationsquelleAutor der Frage Nishant

beautifulsoup python scrapy web-crawler

Extrahieren eines Attributwertes mit beautifulsoup

Anzahl der Antworten

5 Antworten

Ich versuche, den Inhalt zu extrahieren eines einzigen "Wert" - Attribut in einem bestimmten "input" - Tags auf einer Webseite. Ich verwende den folgenden code: import urllib f = urllib.urlopen("http://58.68.130.147") s = f.read() f.close() from BeautifulSoup import

attributes beautifulsoup parsing python

Testen Sie, ob ein Attribut in BeautifulSoup in einem Tag vorhanden ist

Anzahl der Antworten

6 Antworten

Ich würde gerne alle <script> - tags in einem Dokument und dann jeweils basierend auf dem Vorhandensein (oder fehlen) bestimmter Attribute. E. g., für jede <script> tag, wenn das Attribut for vorhanden ist, etwas tun, sonst, wenn

beautifulsoup python

Schöne Suppe und extrahieren ein div und seinen Inhalt nach ID

Anzahl der Antworten

10 Antworten

soup.find("tagName", { "id" : "articlebody" }) Warum wird diese NICHT wieder die <div id="articlebody"> ... </div> tags und Zeug dazwischen? Es gibt nichts zurück. Und ich weiß, für eine Tatsache, dass es existiert, weil ich bin Recht

beautifulsoup python

BeautifulSoup Grab Visible Webpage Text

Anzahl der Antworten

8 Antworten

Im Grunde will ich mit BeautifulSoup zu greifen, ausschließlich die sichtbaren text auf einer Webseite. Zum Beispiel, diese Webseite ist mein test-Fall. Und möchte ich hauptsächlich nur den text (Artikel) und vielleicht noch ein paar Registerkarte Namen

beautifulsoup html-content-extraction python text

Kann ich Skript-Tags mit BeautifulSoup entfernen?

Anzahl der Antworten

3 Antworten

Können script-tags und Ihre Inhalte entfernt werden, die aus HTML mit BeautifulSoup, oder muss ich Reguläre Ausdrücke verwenden oder etwas anderes? InformationsquelleAutor der Frage Sam | 2011-04-08

beautifulsoup html python

Wie BeautifulSoup Benutzer Warnung loswerden?

Anzahl der Antworten

2 Antworten

Installiert, nachdem ich BeautifulSoup, Wenn ich meine Python-cmd, diese Warnung kommt. D:\Application\python\lib\site-packages\beautifulsoup4-4.4.1-py3.4.egg\bs4\__init__.py:166: UserWarning: No parser was explicitly specified, so I'm using the best available HTML parser for this system ("html.parser"). This usually isn't a problem, but if

beautifulsoup python user-warning

Entfernen Sie ein Tag mit BeautifulSoup, aber behalten Sie den Inhalt bei

Anzahl der Antworten

10 Antworten

Aktuell habe ich code so etwas wie dieses: soup = BeautifulSoup(value) for tag in soup.findAll(True): if tag.name not in VALID_TAGS: tag.extract() soup.renderContents() Außer ich will nicht Weg zu werfen, den Inhalt im inneren der ungültigen tag. Wie

beautifulsoup python

Bildschirm-Scraping: Fortbewegung "HTTP Error 403: Anfrage nicht erlaubt von robots.txt"

Anzahl der Antworten

8 Antworten

Gibt es einen Weg, um die folgenden? httperror_seek_wrapper: HTTP Error 403: request disallowed by robots.txt Ist der einzige Weg, um dieses zu Kontaktieren, die Website-Besitzer (barnesandnoble.com).. ich bin den Aufbau einer Website, das würde Sie bringen mehr

beautifulsoup http-status-code-403 mechanize python screen-scraping

BeautifulSoup innerhtml?

Anzahl der Antworten

5 Antworten

Sagen wir, ich habe eine Seite mit einem div. Kann ich das div mit soup.find(). Nun, dass ich das Ergebnis, ich möchte drucken Sie die GESAMTE innerhtml des div: ich meine, ich brauche einen string mit ALLEN

beautifulsoup html innerhtml python

Schöne Suppe, URL zu analysieren, um andere URLs zu erhalten

Anzahl der Antworten

3 Antworten

Ich brauche zum analysieren einer url, um eine Liste von urls, die einen link auf eine detail-Seite. Dann von dieser Seite aus die ich brauche, um all die details aus, die Seite. Ich muss es tun, weil

beautifulsoup html parsing python

BeautifulSoup verwenden, um ein HTML-Tag zu finden, das bestimmten Text enthält

Anzahl der Antworten

3 Antworten

Ich versuche, die Elemente in einem HTML-Dokument, enthalten die folgenden Muster-text: #\S{11} <h2> this is cool #12345678901 </h2> So, die bisherigen passen würden, durch den Einsatz von: soup('h2',text=re.compile(r' #\S{11}')) Und das Ergebnis wäre so etwas wie: [u'blahblah

beautifulsoup html-content-extraction python regex

Parsing HTML in Python - Lxml oder BeautifulSoup? Welche davon ist besser für welche Zwecke?

Anzahl der Antworten

7 Antworten

Aus, was kann ich machen, die beiden wichtigsten HTML-parsing-libraries in Python sind lxml und BeautifulSoup. Ich habe mich entschieden BeautifulSoup für ein Projekt an dem ich arbeite, aber ich wählte es für sich keine besonderen anderen Grund,

beautifulsoup html-parsing lxml python

UnicodeEncodeError: 'Charmap' Codec kann keine Zeichen codieren

Anzahl der Antworten

3 Antworten

Ich versuche, mich zu kratzen, eine website, aber es gibt mir eine Fehlermeldung. Ich bin mit dem folgenden code: import urllib.request from bs4 import BeautifulSoup get = urllib.request.urlopen("https://www.website.com/") html = get.read() soup = BeautifulSoup(html) print(soup) Und ich

beautifulsoup python urllib

Python BeautifulSoup extrahiert Text zwischen Elementen

Anzahl der Antworten

7 Antworten

Ich versuche, zu extrahieren "DIES IST MEIN TEXT" aus dem folgenden HTML-Code: <html> <body> <table> <td class="MYCLASS">  <a hef="xy">Text</a> <p>something</p> THIS IS MY TEXT <p>something else</p> </br> </td> </table> </body> </html> Versuchte ich

beautifulsoup python

Beautiful Soup kann keine CSS-Klasse finden, wenn das Objekt auch andere Klassen besitzt

Anzahl der Antworten

4 Antworten

wenn eine Seite <div class="class1"> und <p class="class1">dann soup.findAll(True, 'class1') finden Sie beides. Wenn es <p class="class1 class2"> wird es aber nicht gefunden werden. Wie finde ich alle Objekte mit einer bestimmten Klasse, unabhängig davon, ob Sie

beautifulsoup python screen-scraping

Python BeautifulSoup Parsingtabelle

Anzahl der Antworten

2 Antworten

Lerne ich python requests und BeautifulSoup. Für eine übung, die ich ausgewählt haben, schreiben Sie eine kurze NYC parking ticket-parser. Ich bin in der Lage zu bekommen, eine html-Antwort, die ist ziemlich hässlich. Ich brauche zu greifen,

beautifulsoup python

Python: BeautifulSoup - Ermittelt einen Attributwert basierend auf dem Attribut name

Anzahl der Antworten

6 Antworten

Will ich drucken Sie den Attributwert basierend auf Ihren Namen, nehmen Sie zum Beispiel <META NAME="City" content="Austin"> Ich möchte so etwas wie dies tun soup = BeautifulSoup(f) //f is some HTML containing the above meta tag for

beautifulsoup python

HTML in einfachen Text mit Python gerendert

Anzahl der Antworten

2 Antworten

Ich versuche, zu konvertieren, ein Stück HTML-text mit BeautifulSoup. Hier ist ein Beispiel: <div> <p> Some text <span>more text</span> even more text </p> <ul> <li>list item</li> <li>yet another list item</li> </ul> </div> <p>Some other text</p> <ul> <li>list

beautifulsoup python

Python und BeautifulSoup Codierungsprobleme

Anzahl der Antworten

5 Antworten

Ich Schreibe ein crawler mit Python mit BeautifulSoup und alles ging swimmingly, bis ich lief in dieser Website: http://www.elnorte.ec/ Ich bin immer der Inhalt mit den Anforderungen der Bibliothek: r = requests.get('http://www.elnorte.ec/') content = r.content Wenn ich

beautifulsoup python unicode utf-8

1
2
3
4
5
6
7
8