Gewusst wie entschlüsseln "Content-Encoding: gzip, gzip" mit curl?

Ich versuche zu entschlüsseln Webseite www.dealstan.com Verwendung von CURL mit den folgenden code:

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url); //Define target site
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE); //Return page in string
curl_setopt($cr, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/533.2 (KHTML, like Gecko) Chrome/5.0.342.3 Safari/533.2');
curl_setopt($ch, CURLOPT_ENCODING , "gzip");     
curl_setopt($ch, CURLOPT_TIMEOUT,5); 
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, TRUE); //Follow redirects

$return = curl_exec($ch); 
$info = curl_getinfo($ch); 
curl_close($ch); 

$html = str_get_html("$return");
echo $html;

aber, es zeigt einige junk-charater

"��}{w�6����9� X�n���.........." für über 100 Zeilen.

Ich habe versucht, zu finden die Antwort in schleudern.es fand ein interessanter Punkt, es sieht aus wie die html-codiert ist zweimal(nur eine Vermutung, basierend auf der Antwort)

Finden Sie die Antwort unter:
HOLEN Sie sich http://www.dealstan.com/

200 OK 18.87 kB 490 ms
Anzeigen Anfrage Antwort Anzeigen
HEADER

Cache-Control: max-age=0, no-cache

Cf-Ray: 18be7f54f8d80f1b-IAD

Connection: keep-alive

Content-Encoding: gzip, gzip ==============>? Verdacht das jemand wissen darüber?

Content-Type: text/html; charset=UTF-8

Datum: Wed, 19 Nov 2014 18:33:39 GMT

Server: cloudflare-nginx

Set-Cookie: __cfduid=d1cff1e3134c5f32d2bddc10207bae0681416422019; expires=Thu, 19-Nov-15 18:33:39 GMT; path=/; domain=.dealstan.com; HttpOnly

Transfer-Encoding: chunked

Vary: Accept-Encoding

X-Page-Speed: 1.8.31.2-3973

X-Pingback: http://www.dealstan.com/xmlrpc.php

X-Powered-By: HHVM/3.2.0
KÖRPER anzeigen von raw -

H4sIAAAAAAAAA5V8Q5AoWrBk27Ztu/u2bdu2bdu2bdu2bds2583f/pjFVOQqozZnUxkVJ7PwoyAA/qeAb3y83LbYHs/3Hv79wKm/2N5cZyJVtCWu1xyteyzLNqYuWbdtHeELcyizrrp/1Fe7es3+wL3Vfb

jemand weiß, wie zu entschlüsseln die Antwort mit dem header "Content-Encoding: gzip, gzip",

Dass die Website richtig geladen in firefox, chrome etc. aber, ich bin nicht in der Lage zu entschlüsseln mithilfe von CURL.

Bitte helfen Sie mir zu decodieren dieses Problem?

  • In google gefunden, ein bug, der gemeldet wird, in mozilla für die ähnliche Frage, bugzilla.mozilla.org/show_bug.cgi?id=205156, aber ich konnte nicht finden, einen patch für diesen Fehler, da die Seite richtig geladen in firefox, die Sie haben sollten, hat dieses Problem gelöst
  • Seltsam. Die junk ist genau das, was zurück kommt—es zeigt, dass der Weg auch im Safari. So ist es im Grunde senden zurück die Seite Gzip -, obwohl er behauptet, dass der Content-Type ist text/html. (Sollte es so aussieht? Sieht für mich aus wie Ihre website ist einfach gebrochen. Es zeigt, wie ich erwarten würde, die textliche Darstellung der GZIP-Daten, wenn Suche ich es in Safari...) NB: Es scheint Gzip im transit, und sendet auch eine gezippte version der Seite, so musste ich entpacken Sie es zweimal, um die tatsächliche HTML.
  • Gerade überprüft ein paar anderen Browsern—Firefox und Google Chrome erfolgreich zeigen mir die Webseite, Opera und Safari zeigen mir raw gzip-Daten. Also, ich würde sagen, dass die website ist falsch konfiguriert und ist Gzip die Seite zweimal, aber, dass einige web-Browser erkennen diese Gebrochenheit und Decodierung doppelt für Sie. Ich bin mir nicht sicher, ob ich darauf verlassen, dass es immer kaputt, weil früher oder später werden Sie gehen, um zu realisieren, dass Ihre website ist gebrochen in einigen gängigen Browsern, und befestigen Sie die Konfiguration...
  • Als Sie sagte, Sie lösen das Problem, jetzt bin ich in der Lage zu analysieren, ohne Probleme. Jedenfalls, wenn wir kommen, um zu wissen, wie firefox, ist in der Lage, mit ihm umgehen, das wird helfen, uns für die Lösung des ähnlichen Problems in der Zukunft.
InformationsquelleAutor stackguy | 2014-11-19
Schreibe einen Kommentar