Tag: beautifulsoup
Beautiful Soup ist ein Python-package zum Parsen von HTML/XML. Die neueste version dieses Pakets ist die version 4, importiert bs4.
3
Antworten
Habe ich den folgenden HTML-Code, der innerhalb eines größeren Dokuments <br /> Important Text 1 <br /> <br /> Not Important Text <br /> Important Text 2 <br /> Important Text 3 <br /> <br /> Non
4
Antworten
Weiss jemand einen eleganten Weg, um den gesamten Inhalt einer Suppe Objekt als eine einzelne Zeichenfolge? Im moment bin ich immer contentsdas ist natürlich eine Liste, und dann iteriert es: notices = soup.find("div", {"class" : "middlecontent"}) con
3
Antworten
Habe ich installiert Python 3.5 auf meinem Windows 8 Computer. Ich habe auch installiert Pycharm Community-Version 5.0.4. Ich bin nicht in der Lage zu installieren BeautifulSoup-Modul über "Einstellungen" - Option in Pycharm. Ich erhalte die folgende Fehlermeldung
4
Antworten
Ich bin mit python 2,7.5 auf mac 10.7.5, beautifulsoup 4.2.1. Werde ich parse eine xml-Seite mit der lxml-Bibliothek, wie gelehrt in der beautifulsoup tutorial. Jedoch, wenn ich meinen code, es zeigt bs4.FeatureNotFound: Couldn't find a tree builder
5
Antworten
Wie würde ich, mit BeautifulSoup, Suche für tags enthält NUR die Attribute, die ich Suche? Zum Beispiel, ich möchte alle zu finden <td valign="top"> - tags. Den folgenden code: raw_card_data = soup.fetch('td', {'valign':re.compile('top')}) bekommt alle Daten, die
3
Antworten
Kann PhantomJS verwendet werden, eine alternative zu BeautifulSoup? Ich bin mit der Suche auf Etsy und besuchen Sie alle links, die in der Bezeichnung. In Python, ich weiß, wie Sie dies tun (mit BeautifulSoup) aber heute will
6
Antworten
Könnte dies eine jener Fragen, die sind schwierig zu beantworten, aber hier geht: Ich nicht denke, dass mein selbst Programmierer, aber ich würde gerne 🙂 ich habe gelernt R, denn ich war krank und müde von spss,
3
Antworten
Ich bin mit Python 2.7 + BeautifulSoup 4.3.2. Ich versuche mittels Python und BeautifulSoup, um Informationen auf einer Webseite. Weil die Webseite ist in der Unternehmens-website setzt die Anmeldung und Umleitung, so dass ich kopieren Sie die
2
Antworten
Muss ich navigieren um ein html-element von einem bestimmten Typ. Jedoch gibt es viele solche Elemente auf der Seite, mit vielen verschiedenen Klassen. Ich brauche eine, die keine class-Attribut. Sollte ich für einen Blick mit class ==
3
Antworten
Ich beide installiert Python-3.5 und Beautifulsoup4. Wenn ich versuche zu importieren, bs4, bekomme ich die Fehlermeldung unten. Gibt es eine Lösung für das? Oder soll ich das einfach installieren von Python 3.4 statt? Bitte sehr explizit -
2
Antworten
Arbeite ich an einem web scraping project und lief in Probleme mit der Geschwindigkeit. Zu versuchen, es zu beheben, will ich mit lxml anstelle von html.parser als BeautifulSoup - parser. Ich habe in der Lage, dies zu
6
Antworten
Möchte ich, um alle <a> tags, welche Kinder <li> <div> <li class="test"> <a>link1</a> <ul> <li> <a>link2</a> </li> </ul> </li> </div> Ich weiß, wie zu finden-element mit Besondere Klasse, wie dies soup.find("li", { "class" : "test" }) Aber
3
Antworten
TypeError: ein bytes-Objekt wie erforderlich ist, nicht 'str' immer oben genannten Fehler während der Ausführung unter python-code zu speichern Sie die HTML-Tabelle Daten in der Csv-Datei. weiß nicht, wie man rideup.pls helfen Sie mir. import csv import
2
Antworten
Meine Webseite ist so etwas wie das - <p> <strong class="offender">YOB:</strong> 1987<br /> <strong class="offender">RACE:</strong> WHITE<br /> <strong class="offender">GENDER:</strong> FEMALE<br /> <strong class="offender">HEIGHT:</strong> 5'05''<br /> <strong class="offender">WEIGHT:</strong> 118<br /> <strong class="offender">EYE COLOR:</strong> GREEN<br /> <strong class="offender">HAIR COLOR:</strong>
5
Antworten
Habe ich installiert BeautifulSoup mit easy_install und versuchen, führen Sie Folgendes Skript from BeautifulSoup import BeautifulSoup import re doc = ['<html><head><title>Page title</title></head>', '<body><p id="firstpara" align="center">This is paragraph <b>one</b>.', '<p id="secondpara" align="blah">This is paragraph <b>two</b>.', '</html>'] soup =
9
Antworten
Ich habe Probleme mit dem Parsen von html-Elementen mit der Klasse "class" - Attribut mit Beautifulsoup. Der code sieht so aus soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"]=="stylelistrow"): print div Bekomme ich
3
Antworten
Versucht in meinen Kopf zu kriegen html-Bau mit BS. Ich versuche, fügen Sie ein neues tag: self.new_soup.body.insert(3, """<div id="file_history"></div>""") wenn ich das Ergebnis bekomme ich: <div id="file_histor"y></div> So, ich bin einfügen einer Zeichenfolge, wird desinfiziert für websichere
3
Antworten
Neues zu Programmieren und haben herausgefunden, wie um zu navigieren, wo ich gehen müssen mit Selen. Ich möchte die Daten analysieren jetzt aber nicht sicher wo zu beginnen. Kann jemand meine hand halten Sie eine Sekunde, und
4
Antworten
Ich bin mit BeautifulSoup - python-Modul. Ich habe nach einem Hinweis auf das div mit der id wie: 'post-#'. Zum Beispiel: <div id="post-45">...</div> <div id="post-334">...</div> Wie kann ich filtern? html = '<div id="post-45">...</div> <div id="post-334">...</div>' soupHandler =
2
Antworten
Ich versuche zu analysieren, die Informationen (html-Tabellen) von dieser Seite: http://www.511virginia.org/RoadConditions.aspx?j=All&r=1 Derzeit bin ich mit BeautifulSoup und der code, den ich habe, sieht wie folgt aus from mechanize import Browser from BeautifulSoup import BeautifulSoup mech = Browser()
4
Antworten
Ich versuche, die kratzen alle die innere html von der <p> - Elemente in eine web-Seite mit BeautifulSoup. Es werden interne tags, aber das ist mir egal, ich will einfach nur, um die internen text. Beispielsweise für:
6
Antworten
Wie kann ich die Bänder einfach alle tags aus einem element finde ich in BeautifulSoup? InformationsquelleAutor der Frage Daniele B | 2013-04-25
3
Antworten
Ich versuche, mich zu kratzen, eine einfache Tabelle mit Schöne Suppe. Hier ist mein code: import requests from bs4 import BeautifulSoup url = 'https://gist.githubusercontent.com/anonymous/c8eedd8bf41098a8940b/raw/c7e01a76d753f6e8700b54821e26ee5dde3199ab/gistfile1.txt' r = requests.get(url) soup = BeautifulSoup(r.text) table = soup.find_all(class_='dataframe') first_name = last_name
6
Antworten
import urllib2 website = "WEBSITE" openwebsite = urllib2.urlopen(website) html = getwebsite.read() print html So weit So gut. Aber ich will nur href-links aus der plain text HTML. Wie kann ich dieses problem lösen? InformationsquelleAutor der Frage user371012
2
Antworten
Bin ich mit einem Python-Programm liest eine UTF-8-codierte web-Seite, und ich extrahiere text aus dem HTML mit BeautifulSoup. Jedoch, wenn ich Schreibe diesen text in eine Datei (oder drucken Sie es auf der Konsole), es wird geschrieben
7
Antworten
Arbeite ich in Python mit Flask. Wenn ich mit meinem main Python-Datei auf meinem computer, es funktioniert perfekt, aber wenn ich aktivieren venv und führen Sie den Kolben Python-Datei in das terminal, es sagt, dass mein main
20
Antworten
Ich Probleme mit dem Umgang mit unicode-Zeichen aus dem text geholt von verschiedenen web-Seiten (auf verschiedenen Websites). Ich bin mit BeautifulSoup. Das problem ist, dass der Fehler nicht immer reproduzierbar; manchmal funktioniert es mit einigen Seiten, und
5
Antworten
Ich versuche zu konvertieren ein html-block, um den text mit Python. Eingang: <div class="body"><p><strong></strong></p> <p><strong></strong>Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa</p> <p>Consectetuer adipiscing elit. <a href="http://example.com/" target="_blank" class="source">Some Link</a>
3
Antworten
Bemerkte ich etwas sonderbares über die bei der Arbeit mit BeautifulSoup und konnte Sie nicht finden, keine Dokumentation zur Unterstützung dieser also ich wollte Fragen hier. Sagen, wir haben eine tags wie diesen, haben wir analysiert, mit
2
Antworten
Ich bin auf der Suche nach einem Weg, um findAll, um zwei tags, in der Reihenfolge, wie Sie erscheinen auf der Seite. Derzeit habe ich: import requests import BeautifulSoup def get_soup(url): request = requests.get(url) page = request.text
5
Antworten
Ich möchte eine website zu machen, zeigt der Vergleich zwischen amazon und e-bay-Produkt-Preis. Welche dieser arbeiten besser und warum? Ich bin ein wenig vertraut mit BeautifulSoup aber nicht so viel mit Scrapy crawler. InformationsquelleAutor der Frage Nishant
5
Antworten
Ich versuche, den Inhalt zu extrahieren eines einzigen "Wert" - Attribut in einem bestimmten "input" - Tags auf einer Webseite. Ich verwende den folgenden code: import urllib f = urllib.urlopen("http://58.68.130.147") s = f.read() f.close() from BeautifulSoup import
6
Antworten
Ich würde gerne alle <script> - tags in einem Dokument und dann jeweils basierend auf dem Vorhandensein (oder fehlen) bestimmter Attribute. E. g., für jede <script> tag, wenn das Attribut for vorhanden ist, etwas tun, sonst, wenn
10
Antworten
soup.find("tagName", { "id" : "articlebody" }) Warum wird diese NICHT wieder die <div id="articlebody"> ... </div> tags und Zeug dazwischen? Es gibt nichts zurück. Und ich weiß, für eine Tatsache, dass es existiert, weil ich bin Recht
8
Antworten
Im Grunde will ich mit BeautifulSoup zu greifen, ausschließlich die sichtbaren text auf einer Webseite. Zum Beispiel, diese Webseite ist mein test-Fall. Und möchte ich hauptsächlich nur den text (Artikel) und vielleicht noch ein paar Registerkarte Namen
3
Antworten
Können script-tags und Ihre Inhalte entfernt werden, die aus HTML mit BeautifulSoup, oder muss ich Reguläre Ausdrücke verwenden oder etwas anderes? InformationsquelleAutor der Frage Sam | 2011-04-08
2
Antworten
Installiert, nachdem ich BeautifulSoup, Wenn ich meine Python-cmd, diese Warnung kommt. D:\Application\python\lib\site-packages\beautifulsoup4-4.4.1-py3.4.egg\bs4\__init__.py:166: UserWarning: No parser was explicitly specified, so I'm using the best available HTML parser for this system ("html.parser"). This usually isn't a problem, but if
10
Antworten
Aktuell habe ich code so etwas wie dieses: soup = BeautifulSoup(value) for tag in soup.findAll(True): if tag.name not in VALID_TAGS: tag.extract() soup.renderContents() Außer ich will nicht Weg zu werfen, den Inhalt im inneren der ungültigen tag. Wie
8
Antworten
Gibt es einen Weg, um die folgenden? httperror_seek_wrapper: HTTP Error 403: request disallowed by robots.txt Ist der einzige Weg, um dieses zu Kontaktieren, die Website-Besitzer (barnesandnoble.com).. ich bin den Aufbau einer Website, das würde Sie bringen mehr
5
Antworten
Sagen wir, ich habe eine Seite mit einem div. Kann ich das div mit soup.find(). Nun, dass ich das Ergebnis, ich möchte drucken Sie die GESAMTE innerhtml des div: ich meine, ich brauche einen string mit ALLEN
3
Antworten
Ich brauche zum analysieren einer url, um eine Liste von urls, die einen link auf eine detail-Seite. Dann von dieser Seite aus die ich brauche, um all die details aus, die Seite. Ich muss es tun, weil
3
Antworten
Ich versuche, die Elemente in einem HTML-Dokument, enthalten die folgenden Muster-text: #\S{11} <h2> this is cool #12345678901 </h2> So, die bisherigen passen würden, durch den Einsatz von: soup('h2',text=re.compile(r' #\S{11}')) Und das Ergebnis wäre so etwas wie: [u'blahblah
7
Antworten
Aus, was kann ich machen, die beiden wichtigsten HTML-parsing-libraries in Python sind lxml und BeautifulSoup. Ich habe mich entschieden BeautifulSoup für ein Projekt an dem ich arbeite, aber ich wählte es für sich keine besonderen anderen Grund,
3
Antworten
Ich versuche, mich zu kratzen, eine website, aber es gibt mir eine Fehlermeldung. Ich bin mit dem folgenden code: import urllib.request from bs4 import BeautifulSoup get = urllib.request.urlopen("https://www.website.com/") html = get.read() soup = BeautifulSoup(html) print(soup) Und ich
7
Antworten
Ich versuche, zu extrahieren "DIES IST MEIN TEXT" aus dem folgenden HTML-Code: <html> <body> <table> <td class="MYCLASS"> <!-- a comment --> <a hef="xy">Text</a> <p>something</p> THIS IS MY TEXT <p>something else</p> </br> </td> </table> </body> </html> Versuchte ich
4
Antworten
wenn eine Seite <div class="class1"> und <p class="class1">dann soup.findAll(True, 'class1') finden Sie beides. Wenn es <p class="class1 class2"> wird es aber nicht gefunden werden. Wie finde ich alle Objekte mit einer bestimmten Klasse, unabhängig davon, ob Sie
2
Antworten
Lerne ich python requests und BeautifulSoup. Für eine übung, die ich ausgewählt haben, schreiben Sie eine kurze NYC parking ticket-parser. Ich bin in der Lage zu bekommen, eine html-Antwort, die ist ziemlich hässlich. Ich brauche zu greifen,
6
Antworten
Will ich drucken Sie den Attributwert basierend auf Ihren Namen, nehmen Sie zum Beispiel <META NAME="City" content="Austin"> Ich möchte so etwas wie dies tun soup = BeautifulSoup(f) //f is some HTML containing the above meta tag for
2
Antworten
Ich versuche, zu konvertieren, ein Stück HTML-text mit BeautifulSoup. Hier ist ein Beispiel: <div> <p> Some text <span>more text</span> even more text </p> <ul> <li>list item</li> <li>yet another list item</li> </ul> </div> <p>Some other text</p> <ul> <li>list
5
Antworten
Ich Schreibe ein crawler mit Python mit BeautifulSoup und alles ging swimmingly, bis ich lief in dieser Website: http://www.elnorte.ec/ Ich bin immer der Inhalt mit den Anforderungen der Bibliothek: r = requests.get('http://www.elnorte.ec/') content = r.content Wenn ich