scrapy von Skript-Ausgabe in json
Ich bin mit scrapy
in einem python-Skript
def setup_crawler(domain):
dispatcher.connect(stop_reactor, signal=signals.spider_closed)
spider = ArgosSpider(domain=domain)
settings = get_project_settings()
crawler = Crawler(settings)
crawler.configure()
crawler.crawl(spider)
crawler.start()
reactor.run()
erfolgreich ausgeführt und beendet, aber wo ist das Ergebnis ? Ich möchte das Ergebnis im json-format, wie kann ich das tun?
result = responseInJSON
wie wir mit dem Befehl
scrapy crawl argos -o result.json -t json
InformationsquelleAutor der Frage Wasif Khalil | 2014-05-09
Du musst angemeldet sein, um einen Kommentar abzugeben.
Müssen Sie
FEED_FORMAT
undFEED_URI
Einstellungen manuell:Wenn Sie möchten, bekommen Sie die Ergebnisse in eine variable, die Sie definieren können
Pipeline
Klasse, würde sammeln Sie Elemente in der Liste. Verwenden Sie diespider_closed
signal handler um die Ergebnisse zu sehen:FYI, schauen Sie, wie Scrapy analysiert Kommandozeilen-Argumente.
Siehe auch: Die Erfassung stdout innerhalb des gleichen Prozesses in Python.
InformationsquelleAutor der Antwort alecxe
Habe ich es geschafft, damit es funktioniert, indem Sie einfach
FEED_FORMAT
undFEED_URI
zu denCrawlerProcess
Konstruktor, mit dem basic-Scrapy-API-tutorial-code wie folgt:InformationsquelleAutor der Antwort Alvaro Cavalcanti
Einfach!
Setzen, script, wo du
scrapy.cfg
InformationsquelleAutor der Antwort Aminah Nuraini