Ist das web scraping erlaubt?
Arbeite ich an einem Projekt, das erfordert, dass bestimmte Statistiken auf einer anderen website, und ich ' ve erstellt eine HTML-scraper, die Daten erhält alle 15 Minuten automatisch. Allerdings habe ich aufgehört den bot jetzt, als in Ihren Nutzungsbedingungen, die Sie erwähnen, Sie erlauben es nicht.
Ich wirklich wollen, dies respektieren, und vor allem, wenn es ein Gesetz verbietet, mich von diesen Daten, aber ich habe die Kontaktaufnahme mit Ihnen per E-Mail mehrere Male ohne eine einzige Antwort, so jetzt hab ich zu dem Schluss gekommen, dass ich Sie einfach schnappen Sie sich die Daten, wenn es legal ist.
Auf bestimmte Foren habe ich gelesen, dass es legal IST, aber ich würde viel lieber eine "präzise" Antwort, die hier auf StackOverflow.
Und lassen Sie uns sagen, dass dies in der Tat nicht illegal, dann hätten Sie keine software zu erkennen meinen bot mehrere verbindungen alle 15 Minuten?
Auch, wenn man über die, die Ihre Daten, wir reden über eine einzige Nummer für jedes "team", und diese Zahl werde ich die übertragung in unsere eigene Nummer.
die Antwort ist "es hängt"
verschiedene Jurisdiktionen haben verschiedene Gesetze.
stellen Sie sich ein Dialogfeld, in: Webmaster: "ich sage,
Crawl-delay: 5 > robots.txt
". Bot: "Okay... not more than once in 5 minute...
". Webmaster: "Nein! Schlecht! Bad robot! Geh Weg!"... Ist es das, was du meintest? LOL xDrechtliche Fragen sind off-topic für die so gefasste Natur. ich würde einen Rechtsanwalt konsultieren.
InformationsquelleAutor Mikkel | 2015-09-06
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich zitiere Pablo Hoffman (Scrapinghub co-Gründer) Antwort auf die Frage "Was ist die Rechtmäßigkeit von web-scraping?", Ich habe auf der anderen Seite:
InformationsquelleAutor Andrés Pérez-Albela H.
Muss es
robots.txt
- Datei im root-Ordner der Website.Gibt es Pfade, die
forbidden
zu belästigen mit scrappers, und diejenigen, dieallowed
(mit akzeptablen timeouts angegeben).Wenn diese Datei nicht existiert, alles ist erlaubt, und Sie übernehmen keine Verantwortung für die website-Eigentümer nicht zur Verfügung, info.
Auch, hier finden Sie einige Erklärungen zum
robots exclusion standard
.Nur, wenn Sie nicht tragen ein Zeichen, das sagt "please don' T hit me".
Obwohl es ethisch zu Lesen robots.txt und kriechen nur erlaubt, Seiten, die rechtlich nicht durchgesetzt
InformationsquelleAutor ankhzet