MongoDB ETL (php/java...)
Gibt es eine ETL für MongoDB ?...
- Können Sie das konkretisieren? Was ist das format der Daten, die Sie möchten, zu extrahieren, transformieren und laden in mongodb in MongoDb?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Pentaho Data Integration unterstützt MongoDB (Siehe die Dokumentation http://wiki.pentaho.com/display/EAI/Pentaho+Daten+Integration+Schritte).
Ähnlich Talend unterstützt MongoDB: https://github.com/adrien-mogenet/tMongoDBConnection
Für einfache Einsätze von CSV-Dokumente, die ich würde vorschlagen, Blick auf die Mongo wiki Seite Import-Export-Tools.
Für etwas komplizierter ich würde vorschlagen, das schreiben einer ad-hoc-Skript in der Sprache, die Sie am bequemsten mit.
Scheint es, dass Pentaho Data Integration und Talend unterstützt nur das Lesen von MongoDB, aber nicht schreiben.
Ein weiteres tool, gerade angekündigt, die Unterstützung für MongoDB ist DataCleaner, und es unterstützt sowohl lese-als auch Schreibvorgänge. Es stellt sich nicht ganz wie ein ETL-tool, sondern eher wie eine Daten-Qualität-Analyse-tool, aber es funktioniert ETL-ähnliche Funktionen auch.
http://datacleaner.eobjects.org
Ich meine eigene ETL-Lösung mit python-Skripten, um Daten aus MySQL zu MongoDB. Es ist toll, in meinem Kopf.
Grundsätzlich habe ich folgende zwei python-Module für den Zugriff auf mysql und mongodb:
Beide sind installierbar aus dem offiziellen Ubuntu repository.
Habe ich erstellt MongoDB-Treiber für Scriptella ETL tool. Es ist erhältlich unter https://github.com/scriptella/scriptella-mongodb.
Beispiel die Migration von Daten aus der relationalen Tabelle:
Diesem PHP-Programm überträgt automatisch MongoDB-Datenbank in MySQL,
Es führt eine Introspektion der Mogno Sammlungen, erstellt MySQL-schema und die Daten überträgt.
Es tut es nur 1 Ebene tiefer (Ebene 0 und 1), tiefere Schachtelung ist nicht migriert:
http://my.sociopal.com/sociopaltech/post?id=simple_utility_for_copying_data_from_mongodb_to_mysql_this_is_a_simple_php_program_im_using_in_o_61755
Pentaho DI unterstützt MongoDB liest. Ich bin nicht sicher über die schreibt. Ich würde denken, dass unter Berücksichtigung der zugrunde liegenden Struktur von MongoDB im Gegensatz zu herkömmlichen RDBMS könnten Sie besser dran, sich für eine eigene ETL-Prozess/scripting mit python/java vielleicht eher als off-the-shelf-tools, die vielleicht nicht das tun, was Sie behaupten. Schließlich einer dieser Spieler, die in der BI-ETL-Markt wäre dies auch in Ihrem tool, wenn der Prozess ist ausgereift und getestet mehrere Male für mongoDb