Wie man Infobox von einem Wikipedia-Artikel durch Mediawiki API erhält?
Wikipedia-Artikel haben kann, Infobox-Vorlagen. Durch den folgenden Aufruf habe ich den ersten Abschnitt des Artikels umfasst der Infobox.
http://en.wikipedia.org/w/api.php?action=parse&pageid=568801§ion=0&prop=wikitext
Was ich will, ist eine Abfrage zurückgeben wird, nur die Infobox-Daten. Ist das möglich?
InformationsquelleAutor der Frage Erdem | 2011-10-03
Du musst angemeldet sein, um einen Kommentar abzugeben.
Können Sie es mit einem url-Aufruf an die Wikipedia-API wie diese:
Ersetzen Sie die
titles=
Abschnitt mit Ihrer Seite Titel, undformat=xmlfm
zuformat=json
wenn Sie wollen, dass der Artikel im json-format.InformationsquelleAutor der Antwort Gaʀʀʏ
Statt Analyse Infoboxen, sich selbst, das ist ziemlich kompliziert, werfen Sie einen Blick auf DBPediadie Wikipedia-Infoboxen extrahiert aus als Datenbank-Objekte.
InformationsquelleAutor der Antwort jpatokal
Gebäude auf @garry ' s Antwort, du kannst wikipedia analysieren die info-box in html, die Sie über die
rvparse
parameter, etwa so:Beachten Sie, dass weder Methode zurück nur das info-Feld. Aber aus dem html-Inhalte, die Sie extrahieren können (über, z.B., beautifulsoup) die
table
mit Klasseinfobox
.In
Python
Sie etwas wie die folgendeInformationsquelleAutor der Antwort reubano
Wenn die Seite einer rechten Seite der infobox, dann verwenden Sie diese URL, um es zu erhalten in txt-form.
Mein Beispiel ist mit dem element Wasserstoff. Alles, was Sie tun müssen, ist, ersetzen "Wasserstoff" mit Ihrem Titel.
https://en.wikipedia.org/w/index.php?action=raw&Titel=Vorlage:Infobox%20hydrogen
Wenn Sie auf der Suche für JSON-format verwenden Sie diese URL, aber nicht schön.
https://en.wikipedia.org/w/api.php?action=parse&Seite=Vorlage:Infobox%20hydrogen&format=json
InformationsquelleAutor der Antwort Michael DiCioccio