Gute Quelle für Crawler / Spider IP-Adressen
Wo finde ich eine umfassende Liste der Crawler oder Spider IP-Adresse. Ich brauche die IPs von google, yahoo, microsoft und anderen Suchmaschinen, die regelmäßig durchforsten meiner Seiten.
Möchte ich nicht deaktivieren, Sie so zu halten robots.txt Datei aus die Antworten. Die Liste ist für die filter, das tut der statistischen Berichterstattung über die Aktivität auf jeder Seite.
Bitte posten Sie links zu guten Quellen, die verwendet werden könnten. Bezahlt oder kostenlos.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ihre web-server-logs. Ich glaube, Sie sind frei.
Werden Sie wahrscheinlich nicht wollen, dies zu tun, indem Sie die IP-Adresse. Die meisten crawler senden Sie eine eindeutige Benutzer-agent-string, wenn Sie kriechen Ihre Website, und es ist viel mehr wahrscheinlich, dass Sie verwenden möchten, dass Sie zu identifizieren. Ich weiß nicht, wo Sie finden eine gute Liste von denen, obwohl
EDIT: Eigentlich diese Seite habe ich gefunden mit google scheint sowohl die Antwort auf Ihre Frage ein wenig, und auch die user agents (die immer noch eher ein besserer Ansatz)
Es ist nicht eine triviale Angelegenheit, um zu wissen, die berechtigten IPs von web-Suchmaschinen. User-agents können problemlos manipuliert werden. Das beste, was Sie tun können, ist zu gehen durch Protokolle manuell und beobachten Sie Ihr Verhalten. IPs kann auch über die Zeit ändern und sogar gefälscht werden für bestimmte bösartige Absicht.
>> Aktualisierte Liste <<
Liste wie bei Jan 16, 2016
Shodan.IO bot ip-Adressen gefunden werden
198.20.69.72 - 198.20.69.79
198.20.69.96 - 198.20.69.103
Ich bin sicher, möglicherweise gibt es andere Adressen in Verwendung, aber diese sind die, die ich fand, mit ein wenig Graben...