Wie man alle Seiten auf einer domain

Ich bin eine einfache web spider und ich Frage mich, ob es eine Möglichkeit gibt, das ausgelöst wird, in meinem PHP-code, ich kann alle Webseiten auf eine domain...

e.g Können sagen, ich wollte alle Webseiten auf Stackoverflow.com . Das bedeutet, dass Sie es bekommen würde:
https://stackoverflow.com/questions/ask
ziehen Webseiten von einer adult-Seite-wie in der Vergangenheit in die Website-Vereinbarung?
https://stackoverflow.com/questions/1234214/
Beste Rails-HTML-Parser

Und alle links. Wie kann ich das bekomme. Oder gibt es eine API oder VERZEICHNIS, um mich zu Holen?

Außerdem ist es eine Möglichkeit, ich kann alle subdomains?

Btw wie Raupen kriechen websites, die nicht SiteMaps oder Syndication-feeds?

Cheers.

Was Sie fordern ist eine große Sicherheitslücke, tragbar zu allen web-domains. Möglicherweise existieren werden, aber ich hoffe, Sie finden es nicht!
Hahaha...ich hatte keine Ahnung. Wie kann dann Google Index Webseiten, wenn es gibt keine solche Sache?
Wie Sie vielleicht bemerkt haben, gibt es VIELE Seiten, die nicht im Google-index. Im Grunde, ob eine Seite im google-index gibt es einen link, um es. Kein link, keine Suchmaschine. In vielen Fällen wird dieser link stammt von der Website selbst und ist genau für die purpouse.

InformationsquelleAutor William The Dev | 2012-12-17

Schreibe einen Kommentar