Ist es möglich, mehrere user-agents in eine Zeile?
Ist es möglich, in robots.txt zum geben einer Anweisung auf mehrere bots ohne sich wiederholt haben, es zu erwähnen?
Beispiel:
User-agent: googlebot yahoobot microsoftbot
Disallow: /boringstuff/
Ich habe eine sehr ähnliche Frage an Webmaster.stackexchange, da dachte ich, es wäre besser geeignet, es. Dann sah ich diese Frage schon hier gestellt, also gerade dachte ich würde backlink, falls jemand anderes Lesen möchte, weitere Antworten aus: webmasters.stackexchange.com/questions/59560/...
InformationsquelleAutor elhombre | 2013-11-29
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ist es eigentlich ziemlich schwer zu geben, eine definitive Antwort auf diese Frage, denn es ist nicht ein sehr gut definierter standard für robots.txt und eine Menge die Dokumentation gibt es vage oder widersprüchlich.
Den Beschreibung des formats verstanden, die von den Google-bots ist sehr umfangreich und umfasst diese leicht verzerrt Satz:
Scheint zu tappen, auf etwas, was im folgenden Beispiel gezeigt:
Entsprechend der Erklärung unten, stellt dies eine einzige "Gruppe", die Nichtanerkennung der gleichen URL für zwei verschiedene User-Agents.
Also die korrekte syntax für das, was Sie wollen (mit Bezug auf bot funktioniert gleich wie die Google -) wäre dann:
Jedoch, als Jim Mischel mit ein Punkte heraus, es gibt keinen Punkt in eine robots.txt Datei, die einige bots richtig interpretiere, aber andere können ersticken, so kann es am besten zu gehen mit dem "kleinsten gemeinsamen Nenner", der Wiederholung der Blöcke, vielleicht, indem Sie dynamisch die Generierung der Datei mit einem einfachen "Rezept" und der update-Skript.
InformationsquelleAutor IMSoP
Ich denke, die original - robots.txt Spezifikation definiert es eindeutig: eine
User-agent
Linie kann nur eine Wert.Einen Datensatz (aka. ein block, eine Gruppe) besteht aus Linien. Jeder Linie hat die form
User-agent
ist ein Feld. Es ist Wert:Es ist singular ("name des Roboters"), nicht im plural ("die Namen der Roboter").
Wenn mehrere Werte erlaubt wäre, wie könnte Parser möglicherweise liberal? Je nachdem, was das Trennzeichen wäre (
,
,,
;
, ...), es könnte Teil der Roboter-name.Warum sollten Sie mit mehreren
User-agent
Zeilen, wenn Sie könnte mehrere Werte in eine Zeile?Zusätzlich:
Disallow
entwederAlso statt
sollten Sie verwenden
oder (wohl sicherer, als Sie können nicht sicher sein, ob alle relevanten Parser unterstützen, die nicht so Häufig Weg, dass mehrere
User-agent
Zeilen für einen Datensatz)(resp. natürlich
User-agent: *
)InformationsquelleAutor unor
Entsprechend der original robots.txt Ausschluss-Protokoll:
Habe ich noch nie gesehen mehrere bots aufgelistet, die in einer einzigen Zeile. Und es ist wahrscheinlich, dass meine web-crawler wäre nicht korrekt behandelt, so eine Sache. Aber nach der Skillung oben, es sollte legal sein.
Beachten Sie auch, dass selbst wenn Google waren, um Unterstützung für mehrere Benutzer-agents in einer einzigen Richtlinie, oder mehrere user-agents, wie beschrieben, in IMSoP Antwort (interessant finde, by the way ... ich wusste nicht, dass man) nicht alle anderen crawler wird. Sie müssen entscheiden, wenn Sie möchten, nutzen Sie die komfortable syntax, die sehr wahrscheinlich nur Google und Bing bots unterstützen, oder verwenden Sie die komplexen und einfacheren syntax ist es, dass alle höflich bots unterstützen.
Würde ich Zustimmen, dass der "kleinste gemeinsame Nenner" - Ansatz ist die sinnvolle hier, obwohl. Ich bin etwas überrascht, es ist immer noch keine bessere definition gibt; das "bessere Dokumentation" von Bing ist lächerlich.
InformationsquelleAutor Jim Mischel
Muss man jeden bot in einer anderen Zeile.
http://en.wikipedia.org/wiki/Robots_exclusion_standard
InformationsquelleAutor SamV