rvest Fehler in öffnen.Verbindung(x, "rb") : Timeout wurde erreicht
Ich versuche, mich zu kratzen, die Inhalte von http://google.com.
die Fehlermeldung kommen.
library(rvest)
html("http://google.com")
Fehler in öffnen.Verbindung(x, "rb") :
Zeitlimit wurde erreicht zusätzlich:
Warnmeldung: 'html' ist veraltet.
Verwenden Sie 'read_html" statt.
Finden Sie in der Hilfe("Deprecated")
da bin ich mit Ihr Unternehmens-Netzwerk ,das vielleicht verursacht durch firewall oder proxy. Ich versuche, set_config ,aber nicht arbeiten .
- haben Sie auch versucht die
read_html
Befehl, da die Fehlermeldung sagthtml
ist veraltet... Dies kann nicht lösen Ihr problem, aber vielleicht der Ausgang ist mehr hilfreich... - ja,die Meldung ist :Fehler beim öffnen.Verbindung(x, "rb") : Timeout wurde erreicht zusätzlich: Warnmeldung: schließen ungenutzte Verbindung 3 (google.com)
- tatsächlich , dieser code funktioniert einwandfrei in meinem Netzwerk zu Hause. aber wenn ich versuche, diesen code in das Unternehmens-Netzwerk ,der Fehler kommt.
- Scheint nicht reproduzierbar wie ein code-Problem, dies gibt ein Ergebnis für mich. Wenn Sie herausgefunden, was Los war mit dem Netz und wie das zu umgehen, könnten Sie schreiben, die Antwort.
- Gleiche Problem bei mir, offenbar aus dem Netzwerk bin ich über google fragt Beweis, nicht ein bot, und die Seite natürlich auch mal aus, wenn der scraper läuft.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich hatte das gleiche
Error in open.connection(x, “rb”) : Timeout was reached
Problem bei der Arbeit hinter einem proxy in das office-Netzwerk.Hier ist was für mich gearbeitet,
Credit : https://stackoverflow.com/a/38463559
Dies ist wahrscheinlich ein Problem mit Ihrem Aufruf read_html (oder html in deinem Fall) nicht richtig identifizieren sich server beim abrufen der Inhalte aus, die das Standardverhalten. Mit curl, fügen Sie einen Benutzer-agent, um den Griff argument read_html Ihre Schaber sich selbst identifizieren.
Ich lief in dieses Problem, weil mein VPN eingeschaltet wurde. Sofort nach dem ausschalten, habe ich wieder versucht, und es das Problem behoben hat.
Ich Stand vor einem ähnlichen problem und einem kleinen hack gelöst.
Es wurden 2 Charaktere in der hyperlink -, die waren, die ein problem für mich.
Daher ersetzte ich "è" mit "e" & "é" mit "e" und es hat funktioniert.
Aber nur sicherstellen, dass der hyperlink immer noch gültig bleibt.