DAG(gerichtete azyklische graph) dynamische job-scheduler

Ich brauche die Verwaltung einer großen workflow von ETL-Aufgaben, die Ausführung von der Zeit abhängt, der Verfügbarkeit von Daten oder ein externes Ereignis. Einige jobs können fehlschlagen, während der workflow-Ausführung und das system soll die Fähigkeit haben, starten Sie einen fehlgeschlagenen workflow-Zweig ohne zu warten, für die gesamte workflow-Ausführung beendet.

Gibt es irgendwelche frameworks in python, der kann damit umgehen?

Sehe ich verschiedene Kern-Funktionen:

  • DAG-Gebäude
  • Ausführung von Knoten (ausführen-cmd-shell mit warten,Protokollierung etc).
  • Fähigkeit zum Wiederaufbau sub-Graphen übergeordneten DAG während der Ausführung
  • Möglichkeit zum manuellen ausführen von Knoten oder sub-Graphen, während die übergeordneten Graphen ausgeführt wird
  • Auszusetzen graph Ausführung beim warten auf externes Ereignis
  • Liste job-queue und job-details

Etwas wie Oozieaber mehr Allgemeine Zwecke und in python.

InformationsquelleAutor der Frage Alexandr Mazanov | 2013-01-12

Schreibe einen Kommentar