Proxy-IP für Scrapy framework

Ich bin die Entwicklung einer web-crawling-Projekt mit Python und Scrapy Rahmen. Es krabbelt approax 10k web-Seiten von e-commerce-shopping-websites. ganze Projekt ist in Ordnung, aber bevor der code vom Testserver in die Produktion server ich möchte wählen Sie eine bessere proxy-ip-provider-Dienst, so dass ich nicht sorgen über meine IP-Blockierung oder Verweigert den Zugriff von websites auf meine Spinnen .

Bis jetzt bin ich mit middleware Scrapy manuell drehen die ip von freien proxy-ip-Liste zur Verfügung, von verschiedenen websites wie diese

Nun bin ich verwirrt über die Optionen sollte ich wählen

  1. Kaufen premium-proxy-Liste von http://www.ninjasproxy.com/ oder http://hidemyass.com/
  2. Verwenden TOR
  3. Verwenden VPN-Dienst wie http://www.hotspotshield.com/
  4. Jede Option besser als die drei oben genannten

InformationsquelleAutor Rohit.nib | 2013-10-18

Schreibe einen Kommentar