Das herunterladen von Bildern aus Wikimedia Commons
Ist jemand bekannt, der einen Weg, um programmgesteuert laden Sie Bilder von Wikimedia-Commons ohne Registrierung für ein Bot-account? Wie es scheint, der einzige Weg, um die Genehmigung für ein Bot-account ist, wenn es erweitert oder bearbeitet, Informationen, die bereits auf Wikimedia. Wenn Sie versuchen, laden Sie keine Bilder, ohne ein bot-account, mit einigen api-Bibliotheken gibt, erhalten Sie Fehlermeldungen, die statt der Bilder. Scheint, wie Sie verhindern, dass jemand nicht aus einem browser? Sonst noch jemand eine Erfahrung mit diesem? Bin ich hier etwas fehlt?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Versuchen Sie zu erklären, was Sie genau tun wollen?
Und was hast du versucht? Welche Fehlermeldung hast du bekommen?
Sie sind nicht sehr klar...
Welche Bibliotheken haben Sie versucht? Wenn Sie nicht aggressiv, es gibt keine Einschränkungen in der Download-WM-Inhalte. Ich habe noch nie gehört, keine Einschränkungen.
Einige User-Agents sind gebannt von der Bearbeitung zu vermeiden, blöd zu Spammen, aber wirklich, ich habe noch nie gehört von Download-Beschränkungen.
Wenn Sie versuchen zu kratzen, eine riesige Menge von Bildern, herunterladen Sie durch die Commons, dann machst du es falsch (tm). Wenn Sie versuchen, ein paar Bilder, überall von 10 bis 200, sollten Sie in der Lage zu schreiben, ein anständiges tool in ein paar Zeilen code, vorausgesetzt, Sie respektieren die Drosselung Anforderung: wenn Sie die API sagt, dass Sie verlangsamen, wenn Sie es nicht tun, werden Systemadministratoren dürften Sie rauswerfen.
Wenn du ein komplettes image dump, (wir reden hier von ein paar TBs) versuchen, Fragen auf wikitech-l. Wir hatten torrents verfügbar, wenn es weniger Bilder, jetzt ist es komplizierter, aber immer noch machbar.
Über bot-accounts. Wie tief haben Sie sich in das system? Sie brauchen einen bot-account für den schnellen, unbeaufsichtigten bearbeitet. Bot Privilegien auch ein paar Einrichtungen wie erhöhte Abfrage Größen. Aber denken Sie daran: bot-account? es ist einfach ein augmented-Benutzer-Konto. Haben Sie versucht, läuft alles mit einer klassischen Konto?
Haben genau dies getan, ich selbst das Gefühl, ich sollte teilen:
http://www.mediawiki.org/wiki/API:Allimages
Diese API-Dokument bedeutet, dass Sie können die Abfrage der Bilder:
http://en.wikipedia.org/w/api.php?action=query&list=allimages&aiprop=url&format=xml&ailimit=10&aifrom=Albert
mit der aiprop=url die url des Bildes, die Sie suchen.
Beachten Sie, dass es verwendet werden, um ein Problem mit der Verwendung von LWP: es ist keine ideologische, es ist praktisch, Agenten erstellen können massive Belastung auf den bereits ausgelasteten Servern. Gibt es sinnvolle Strategien, die agent-Benutzer Folgen können, um die Last zu senken - Fragen Sie an http://www.mediawiki.org oder de:Village Pumpe - Technische
Nicht wirklich die Antwort zu finden, ich bin auf der Suche nach .. aber diese Seite ist interessant:: http://www.makeuseof.com/tag/4-free-tools-for-taking-wikipedia-offline/
Besonders #4.. aber es scheint, die Seite ist down.. Projekt tot?
Wenn Sie müssen zwischen zehn und eine million Dateien mit Hilfe von Magnus Manske tools zur recurse-Kategorien ist eine gute Wahl. http://tools.wmflabs.org/magnustools/can_i_haz_files.html erzeugt eine Liste von UNIX-Befehlen, die Sie dann nur lokal ausführen.