Wie man Wikipedia-API, um die Seite Statistiken von einer bestimmten Seite in wikipedia?
Den Statistiken.grok.se tool bietet die pageview-Statistiken zu einer bestimmten Seite in der wikipedia. Gibt es eine Methode, um die wikipedia-api, um die gleichen Informationen? Was bedeutet der Seitenaufrufe-Zähler die Eigenschaft eigentlich zu bedeuten?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Die Pageview-API veröffentlicht wurde vor ein paar Tagen:
https://wikimedia.org/api/rest_v1/metrics/pageviews/per-article/{project}/{access}/{agent}/{article}/{granularity}/{start}/{end}
Beispielsweise https://wikimedia.org/api/rest_v1/metrics/pageviews/per-article/en.wikipedia/all-access/all-agents/Foo/daily/20151010/20151012 geben Sie
Nein, es ist nicht.
Den
counter
- Eigenschaft zurückgegeben, die vonprop=info
würde Ihnen sagen, wie oft die Seite angesehen wurde, von dem server. Es ist deaktiviert, auf die die Wikipedia und andere Wikimedia-wikis, weil die aggressive squid/varnish caching bedeutet, dass nur ein winziger Bruchteil der Seitenaufrufe würde es dem aktuellen server, um zu beeinflussen, daß der Zähler, und selbst dann die erhöhte Datenbank-schreib-Last für die Aktualisierung der Zähler wäre wahrscheinlich unerschwinglich.Den Statistiken.grok.se-tool verwendet anonymisierte Protokolle von cache-Servern berechnen Seite Ansichten; die raw-log-Dateien sind verfügbar http://dammit.lt/wikistats. Wenn Sie eine API zum Zugriff auf die Daten von stats.grok.se, wenden Sie sich an die Betreiber von Statistiken.grok.se auf Anfrage erstellt werden.
Hinweis: dies wurde geschrieben 4 Jahren, und eine API hat da schon erstellt (siehe diese Antwort). Es gibt bisher noch keine Möglichkeit, den Zugriff, die über api.php obwohl.
Holen Sie sich die tägliche JSON für die letzten 30 Tage wie diese
http://stats.grok.se/json/en/latest30/Britney_Spears
Blickt man in die Statistiken hier.
Haben jemand Erfahrung einige API die Pageview-Statistiken?
Desweiteren habe ich auch geschaut in den zur Verfügung stehenden Raw-Daten konnte aber nicht finden, die Lösung zum extrahieren der Seitenaufruf Zählen.
Scheint es nicht zu sein, jede API; jedoch können Sie HTTP-Anfragen zu Statistiken.grok.se und Parsen der HTML-oder JSON-Ergebnis zu extrahieren, die Anzeige der Seite zählt.
Erstellte ich eine website http://wikipediaviews.org, die genau das erleichtern-Vergleich für mehrere Seiten über mehrere Monate und Jahre. Um die Dinge zu beschleunigen, und minimieren Sie die Anzahl von Anfragen zu Statistiken.grok.se, ich halte alle bisherigen Abfrage-Ergebnis lokal gespeichert.
Den code, den ich verwendet ist erhältlich bei http://github.com/vipulnaik/wikipediaviews.
Die Datei mit der eigentlichen retrieval-code ist in https://github.com/vipulnaik/wikipediaviews/blob/master/backend/pageviewqueries.inc
Den code für getpageviewsurl ist in https://github.com/vipulnaik/wikipediaviews/blob/master/backend/stringfunctions.inc:
PS: falls der link zu wikipediaviews.org funktioniert nicht, es ist, weil ich die domain registriert ist relativ neu. Versuchen http://wikipediaviews.subwiki.org stattdessen in der Zwischenzeit.
em.. diese Frage wurde vor 6 Jahren. Es gibt keine solche eine API in der offiziellen Website in der Vergangenheit.
Geändert.
Einem einfachen Beispiel:
https://en.wikipedia.org/w/api.php?action=query&format=json&prop=pageviews&titles=Buckingham+Palace%7CBank+of+England%7CBritish+Museum
Siehe Dokument:
prop=Seitenaufrufe
Zeigt pro Seite angezeigten Daten (die Anzahl der täglichen Seitenaufrufe für jede der letzten pvipdays Tage). Das Ergebnis-format-Seitentitel (mit Unterstrichen) => Datum (Ymd) => count.