wie beschränken Sie die Website indiziert
Ich weiß, diese Frage wurde viele Male gefragt, aber ich möchte, um genauer zu sein.
Ich eine Entwicklung domain-und zog die Seite auf einen Unterordner. Lassen Sie uns sagen, aus:
http://www.example.com/
Zu:
http://www.example.com/backup
So, ich möchte die Unterordner, die nicht indiziert werden von den Suchmaschinen überhaupt. Ich habe robots.txt mit folgendem Inhalt in den Unterordner (kann ich es in einen Unterordner oder es hat die Wurzel immer, weil ich möchte, dass der Inhalt an der Wurzel sichtbar auf Suche engines):
User-agent: *
Disallow: /
Vielleicht brauche ich, um es zu ersetzen und setzen in der root die folgenden:
User-agent: *
Disallow: /backup
Die andere Sache ist die, ich habe irgendwo gelesen, dass bestimmte Roboter nicht respektieren, die robots.txt die Datei würde also nur darum, eine .htaccess-Datei im /backup-Ordner die Arbeit machen?
Order deny,allow
Deny from all
Irgendwelche Ideen?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Dies würde verhindern, dass das Verzeichnis indiziert:
Darüber hinaus, Ihre robots.txt die Datei muss in den root deiner domain, also in diesem Fall würde die Datei dort platziert, wo Sie es in Ihrem browser, gehen Sie zu http://example.com/robots.txt
Als ein beiseite, möchten Sie vielleicht erwägen Sie, eine subdomain für Ihre Entwicklung vor Ort, so etwas wie http://dev.example.com. Dies würde ermöglichen es Ihnen, vollständig trennen die dev Sachen aus der Produktionsumgebung und würde auch sicherstellen, dass Ihre Umgebungen besser entsprechen.
Beispielsweise können absolute Pfade zu JavaScript-Dateien, CSS -, Bild-oder anderen Ressourcen kann nicht funktionieren, das gleiche vom Entwickler zu der Produktion, und dies kann dazu führen, dass einige Probleme die Straße hinunter.
Weitere Informationen zur Konfiguration dieser Datei finden Sie die robotstxt.org Website. Viel Glück!
Als eine Letzte Anmerkung Google Webmaster-Tools hat einen Abschnitt, wo Sie können sehen Sie, was blockiert ist, durch die robots.txt Datei:
Ich empfehle, dass Sie dieses tool verwenden, wie ein falsch konfiguriert robots.txt die Datei könnte erhebliche Auswirkungen auf die Leistung Ihrer website.
Disallow: *
und fügen SieAllow: /path
Ausnahmen. Die Risiken sind jedoch, dass man vergisst, eine allow-Anweisung. Mein Vorschlag ist, sicher sein, um viel der Forschung selbst, bevor Sie gehen auf diesem Weg. Ich würde es hassen zu hören, dass Sie etwas zu tun, hat negative Auswirkungen für Ihre Website 😉