Wie zu Lesen, die html von einer url in python 3

Sah ich bei früheren ähnlichen Fragen und bekam nur noch mehr verwirrt.

In python 3.4, die ich Lesen möchte eine html-Seite als string gegebene url.

In perl kann ich das mit LWP::Simple, mit get().

Einen matplotlib 1.3.1 Beispiel sagt: import urllib; u1=urllib.urlretrieve(url).
Python ist3 nicht finden können urlretrieve.

Versuchte ich u1 = urllib.request.urlopen(url), die angezeigt wird, um eine HTTPResponse Objekt, aber ich kann nicht drucken oder sich eine Länge drauf, oder index.

u1.body existiert nicht. Ich kann nicht finden, eine Beschreibung der HTTPResponse in Python ist3.

Ist es ein Attribut in der HTTPResponse Objekt, was mir die raw-bytes der html-Seite?

(Irrelevante Sachen von anderen Fragen gehören urllib2, die nicht vorhanden ist in meinem python -, csv-Parser, etc).

Edit:

Fand ich etwas in einer vorherigen Frage, die teilweise (meist) der job:

u2 = urllib.request.urlopen('http://finance.yahoo.com/q?s=aapl&ql=1')

for lines in u2.readlines():
    print (lines)

Ich sagen 'teilweise', weil ich nicht wollen, zu Lesen, separate Linien, sondern nur einen großen string.

Konnte ich nur verketten die Zeilen, aber jede Zeile, die gedruckt hat, ein Zeichen 'b' vorangestellt.

Woher kommt das?

Wieder, ich nehme an, dass ich löschen könnte das erste Zeichen vor der Verkettung, aber nicht bekommen, um ein kloodge.

Hier ist die Beschreibung von HTTPResponse Objekte in der Python-3-Dokumentation.

InformationsquelleAutor user1067305 | 2014-06-11

Schreibe einen Kommentar