Tor-Web-Crawler

Ok, hier ist, was ich brauche.
Ich habe eine PHP-basierte web-crawler.
Es ist hier zugänglich:
http://rz7ocnxxu7ka6ncv.onion/
Nun, mein problem ist, dass meine Spinne, die eigentlich crawlt Seiten muss also auf einen SOCKS-port 9050. Die Sache ist die, ich habe einen tunnel die Verbindung über Tor, so dass Es aufgelöst werden kann .Zwiebel-domains, die ist, was ich bin Indizierung. (Nur die Endung .Zwiebel.)
Rufe ich dieses Skript von der Kommandozeile aus mit php crawl.php und ich füge die entsprechenden Parameter Crawlen der Seite.
Hier ist, was ich denke:
Gibt es eine Möglichkeit, es zu zwingen, Tor zu nutzen?
ODER kann ich die Kraft meiner GESAMTEN MASCHINE zu Tunneln Dinge über Tor, und wie?
(Wie Sie erzwingen, dass alle Datenverkehr über 127.0.0.1:9050)
vielleicht wenn ich die globalen proxy-Einstellungen, php respektieren würden?

Wenn alle meine Lösungen funktionieren, wie würde ich es tun? (Anweisungen Schritt für Schritt bitte, ich bin ein noob.)

Ich will einfach nur die Kiste meiner eigenen Tor Suchmaschine. (Nicht zu empfehlen, meine p2p Suchmaschinen - es ist nicht das, was ich will - ich weiß, Sie existieren, machte ich meine Hausaufgaben.)
Hier ist die crawler-Quelle, wenn Sie sind interessieren, nehmen Sie einen Blick auf:
Vielleicht jemand mit einer Art Herz kann es ändern, verwenden Sie 127.0.0.1:9050 für alle crawling-Anfragen?
http://pastebin.com/kscGJCc5

"vielleicht, wenn ich set up global proxy settings, php respektieren würden?" zweifelhaft. Nicht fopen($url). Verwenden Sie cURL mit CURLOPT_PROXY. Nicht sicher, wie Sie DNS-lookups funktionieren würde, aber.
Wie mache ich das? Ich bin ein total noob in diesem.

InformationsquelleAutor user1203301 | 2012-02-11

Schreibe einen Kommentar