2
Antworten
Ich versuche meine Daten exportieren, als .txt-Datei from bs4 import BeautifulSoup import requests import os import os os.getcwd() '/home/folder' os.mkdir("Probeersel6") os.chdir("Probeersel6") os.getcwd() '/home/Desktop/folder' os.mkdir("img") #now `folder` url = "http://nos.nl/artikel/2093082-steeds-meer-nekklachten-bij-kinderen-door-gebruik-tablets.html" r = requests.get(url) soup = BeautifulSoup(r.content) data =
1
Antworten
Wie soll ich extrahieren "£70,004" text in dd, das weglassen von "Investment gesucht" text in dt. from bs4 import BeautifulSoup import urllib2 url="https://www.seedrs.com/tanorganic" page = urllib2.urlopen(url) soup = BeautifulSoup(page.read(), "html.parser") target = soup.find("dl", class_="investment_sought").text print target figure
5
Antworten
Bin ich das Lesen von text aus html-Dateien und das tun einige Analyse. Diese .html-Dateien sind news-Artikel. Code: html = open(filepath,'r').read() raw = nltk.clean_html(html) raw.unidecode(item.decode('utf8')) Jetzt möchte ich nur dem Inhalt des Artikels und nicht der rest
2
Antworten
Diese Frage gefragt wurde, vor vier Jahren, aber die Antwort ist jetzt out-of-date für BS4. Möchte ich löschen alle Kommentare in meine html-Datei mit schöne Suppe. Da BS4 macht jeder Kommentar als eine Besondere Art von schiffbaren