Beispiel python-Skript, dass verwendet DBPedia?
Ich Schreibe ein python-Skript zum extrahieren von "Entity names" aus einer Sammlung von tausenden von news-Artikel von vor ein paar Länder und Sprachen.
Möchte ich Gebrauch machen von der erstaunlichen DBPedia strukturierte knwoledge, sagen wir zum Beispiel, um die Namen der "Künstler in ägypten" und die Namen der "Firmen, die in Kanada".
(Wenn diese Informationen in SQL-form, hätte ich kein problem.)
Ich würde es bevorzugen, laden Sie die DBPedia Inhalte und verwenden Sie es offline. irgendwelche Ideen, was nötig ist zu tun und wie die Abfrage es lokal von python ?
Du musst angemeldet sein, um einen Kommentar abzugeben.
DBpedia Inhalte in RDF-format. Die dumps kann download von hier
Dbpedia ist ein großer Datenbestand in RDF, die für die Handhabung, die Menge der Daten, die Sie verwenden müssen, Triple-Store Technologie. Für Dbpedia müssen Sie eine native triple-stores, empfehle ich Ihnen, entweder Virtuose oder 4store. Ich persönlich bevorzuge 4store.
Sobald Sie Ihre triple-store einrichten mit Dbpedia in es. Sie können SPARQL Abfrage von Dbpedia RDF-Tripel. Es gibt Python-Bibliotheken, die helfen können, dass Sie mit. 4store und Virtuosen können Ihnen die Ergebnisse zurück in JSON so können Sie leicht erhalten, ohne irgendwelche Bibliotheken.
Einige einfach das urllib-Skript wie ...
kann Ihnen helfen, zu laufen, SPARQL ... zum Beispiel
Ich hoffe, das gibt Ihnen eine Idee, wie ich anfangen soll.
In Python ist3 die Antwort wie folgt Aussehen wird mit den Anforderungen der Bibliothek: