Tag: bs4

BeautifulSoup Ausgang zu .txt-Datei

Anzahl der Antworten 2 Antworten
Ich versuche meine Daten exportieren, als .txt-Datei from bs4 import BeautifulSoup import requests import os import os os.getcwd() '/home/folder' os.mkdir("Probeersel6") os.chdir("Probeersel6") os.getcwd() '/home/Desktop/folder' os.mkdir("img") #now `folder` url = "http://nos.nl/artikel/2093082-steeds-meer-nekklachten-bij-kinderen-door-gebruik-tablets.html" r = requests.get(url) soup = BeautifulSoup(r.content) data =

'NoneType' - Objekt hat kein Attribut 'text'

Anzahl der Antworten 1 Antworten
Wie soll ich extrahieren "£70,004" text in dd, das weglassen von "Investment gesucht" text in dt. from bs4 import BeautifulSoup import urllib2 url="https://www.seedrs.com/tanorganic" page = urllib2.urlopen(url) soup = BeautifulSoup(page.read(), "html.parser") target = soup.find("dl", class_="investment_sought").text print target figure

Auszug News-Artikel Inhalte von gespeichert .html-Seiten

Anzahl der Antworten 5 Antworten
Bin ich das Lesen von text aus html-Dateien und das tun einige Analyse. Diese .html-Dateien sind news-Artikel. Code: html = open(filepath,'r').read() raw = nltk.clean_html(html) raw.unidecode(item.decode('utf8')) Jetzt möchte ich nur dem Inhalt des Artikels und nicht der rest

So finden alle Kommentare mit Schönen Suppe

Anzahl der Antworten 2 Antworten
Diese Frage gefragt wurde, vor vier Jahren, aber die Antwort ist jetzt out-of-date für BS4. Möchte ich löschen alle Kommentare in meine html-Datei mit schöne Suppe. Da BS4 macht jeder Kommentar als eine Besondere Art von schiffbaren