Wie kann man Crawlern den Zugang zu index.php nur, mit robots.txt?
Wenn ich will, dass nur crawler-Zugriff index.php wird das funktionieren?
User-agent: *
Disallow: /
Allow: /index.php
Ich bin neugierig, warum würden Sie wollen, dies zu tun...würden Sie es nicht wollen-crawler zu indizieren viel mehr von Ihrer Website?
InformationsquelleAutor todd | 2009-10-28
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ja, es wird funktionieren. Hier ist das Testergebnis von der Google Webmaster-Tool.
Beachten Sie jedoch, dass mit dieser Konfiguration Ihre Website-homepage nicht durchsucht werden, es sei denn, die Seite aufgerufen wird mit dem voll qualifizierten Pfad.
In anderen Worten,
http://www.example.org/
ist verboten, währendhttp://www.example.org/index.php
erlaubt ist.Wenn Sie möchten, dass Ihre homepage erreichbar sein, hier ist eine bessere version Ihrer Datei.
Erklärung für
/$
gefunden werden kann hierInformationsquelleAutor Simone Carletti
InformationsquelleAutor bulava
Tauschen die Reihenfolge der Disallow /Allow:
Siehe diese info von wikipedia:
http://en.wikipedia.org/wiki/Robots.txt
Trotzdem würde ich nicht erwarten, es auf der Arbeit auch konsequent
InformationsquelleAutor UpTheCreek
Können Sie die Google-Roboter Werkzeug zur Kasse. Ich würde nie eine geheime Verzeichnisse in der Datei robots als würde ich vermuten, dass eine Zeile wie folgt Aussehen würde wie der Honig für bestimmte Spinnen.
InformationsquelleAutor Janco
InformationsquelleAutor mRGogo