Nehmen Sie einen screenshot von einer website, die von der Kommandozeile oder mit python

werde ich einen screenshot von dieser Seite: http://books.google.de/books?id=gikDAAAAMBAJ&pg=PA1&img=1&w=2500 oder speichern Sie das Bild, das es gibt.

Aber ich kann nicht einen Weg finden. Mit wget/curl bekomme ich ein "nicht verfügbar Fehler" und auch mit anderen tools wie webkit2png/wkhtmltoimage/wkhtmltopng.

Ist es eine saubere Art und Weise, es zu tun mit python oder von der Kommandozeile?

Beste Grüße!

ich glaube, das beantwortet wurde in einem anderen thread?
Soweit verstehe ich das, Sie nehmen kein screenshot von einer Webseite, die nur von einem geöffneten Fenster. Aber mein plan ist, es zu tun, ohne öffnen Sie die url durch meine selbst. Es ~1000 Bilder zu speichern. Nur die cover von einigen Büchern.

InformationsquelleAutor danbruegge | 2013-05-02

6

Manchmal benötigen Sie zusätzliche http-Header wie User-Agent zu bekommen, downloads zu arbeiten. In python 2.7, können Sie:
```
import urllib2
request = urllib2.Request(
    r'http://books.google.de/books?id=gikDAAAAMBAJ&pg=PA1&img=1&w=2500',
    headers={'User-Agent':'Mozilla/5.0 (X11; U; Linux i686) Gecko/20071127 firefox/2.0.0.11'})
page = urllib2.urlopen(request)

with open('somefile.png','wb') as f:
    f.write(page.read())
```
Oder kann man sich die params für das hinzufügen von http-Headern in wget oder curl.
- Großen Dank, ich weiß es, es muss der user-agent. 🙂
- Doch es wird nicht ein Bild erzeugen, in der erfassten website. Das Bild wird gebrochen zu werden.
- Ich lief dieses script und verifiziert, dass eine nicht-gebrochene-Bild heruntergeladen. Dieser dauerte weniger als eine minute. Kannst du bitte legen Sie ein minimum an Arbeit vor unbegründeten Forderungen.
- Es wird das richtige Bild nur dann, wenn die url ist direct link to image. Für andere html-basierte web-Seite, das funktioniert nicht. Außerdem kann man direkt verwenden urllib.urlretrieve wenn die url ist mit Sicherheit ein Bild.
- Es kann für jede einzelne Ressource, wie ein Bild, eine Webseite, einen mp3 -, pdf-und etc... Es macht keinen links Folgen, oder erstellen Sie ein composite web-Seite, aber das ist nicht das, was der Benutzer nach. Er zeigte uns eine url zu einem Bild und sagte, er wollte einen "screenshot" das Bild. Aber der "screenshot" ist nur die Datei selbst. Es gibt mehrere Möglichkeiten, um download-web-Inhalte - mein Beispiel ist vollkommen normal akzeptiert Weg.
InformationsquelleAutor tdelaney
14

Können Sie verwenden ghost.py wenn Sie wie.
http://jeanphix.me/Ghost.py/

Hier ist ein Beispiel, wie es zu benutzen.
```
from ghost import Ghost
ghost = Ghost(wait_timeout=4)
ghost.open('http://www.google.com')
ghost.capture_to('screen_shot.png')
```
Die Letzte Zeile speichert das Bild in Ihrem aktuellen Verzeichnis.

Hoffe, das hilft
- Nice one. Sieht wirklich gut aus, aber ich will nicht zu installieren Qt. :/
InformationsquelleAutor Sason Torosean
6

Ich hatte Schwierigkeiten, Geist nehmen Sie einen screenshot konsequent auf einen headless Centos VM. Selen und PhantomJS für mich gearbeitet:
```
from selenium import webdriver
br = webdriver.PhantomJS()
br.get('http://www.stackoverflow.com')
br.save_screenshot('screenshot.png')
br.quit
```
- Ich bin immer diese Fehlermeldung wenn Sie dies ausführen:Traceback (most recent call last): File "C:\bunker\Lib\site-packages\custom_selenium.py", line 2, in <module> br = webdriver.PhantomJS() File "C:\bunker\Lib\site-packages\selenium\webdriver\phantomjs\webdriver.py", line 49, in __init__ service_args=service_args,log_path=service_log_path) TypeError: __init__() got an unexpected keyword argument 'log_path'
- hmm, nicht sicher, aber ich Frage mich, was passiert, wenn Sie Sie Bearbeiten webdriver.py init, und entfernen Sie die log_path argument
InformationsquelleAutor billrichards

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.