Wer führt die callback-bei Verwendung apply_async Methode einer multiprocessing-pool?

Ich versuche zu verstehen, ein wenig von dem, was passiert hinter den kulissen bei der Verwendung der apply_sync Methode einer multiprocessing-pool.

Wer führt die callback-Methode? Es ist der wichtigste Prozess, genannt apply_async?

Sagen wir mal ich schicke eine ganze Reihe von apply_async Befehle mit callbacks und dann weiter mit meinem Programm. Mein Programm ist immer noch, Dinge zu tun, wenn die apply_async ist von Anfang bis Ende. Wie funktioniert die callback laufen zu bekommen mein "main-Prozess", während sich der Haupt-Prozess ist noch immer damit beschäftigt, das Skript?

Hier ist ein Beispiel.

import multiprocessing
import time

def callback(x):
    print '{} running callback with arg {}'.format(multiprocessing.current_process().name, x)

def func(x):
    print '{} running func with arg {}'.format(multiprocessing.current_process().name, x)
    return x

pool = multiprocessing.Pool()

args = range(20)

for a in args:
    pool.apply_async(func, (a,), callback=callback)

print '{} going to sleep for a minute'.format(multiprocessing.current_process().name)

t0 = time.time()
while time.time() - t0 < 60:
    pass

print 'Finished with the script'

Die Ausgabe ist so etwas wie

PoolWorker-1 läuft func arg-0

PoolWorker-2 mit func arg-1

PoolWorker-3 ausgeführt func arg-2

MainProcess dem schlafen gehen für eine minute <-- main-Prozess beschäftigt ist

PoolWorker-4 mit func arg-3

PoolWorker-1 läuft func arg-4

PoolWorker-2 mit func arg-5

PoolWorker-3 ausgeführt func arg-6

PoolWorker-4 mit func arg-7

MainProcess ausführen von callback-arg-0 <-- main-Prozess ausgeführt wird, der Rückruf, während es immer noch in der while-Schleife!!

MainProcess ausführen von callback mit arg-1

MainProcess ausführen von callback-arg-2

MainProcess ausführen von callback-arg-3

MainProcess ausführen von callback-arg-4

PoolWorker-1 läuft func arg-8

...

Fertig mit Skript

Wie ist MainProcess ausführen der callback-während es in der Mitte der while-Schleife??

Gibt es da die Aussage über den Rückruf in der Dokumentation für multiprocessing.Pool, das scheint wie ein Tipp, aber ich verstehe es nicht.

apply_async(func[, args[, kwds[, callback]]])

Einer Variante der apply () - Methode liefert ein Ergebnis-Objekt.

Wenn callback angegeben ist, dann sollte es ein callable, das akzeptiert ein einzelnes argument. Wenn das Ergebnis wird bereit callback angewendet wird (es sei denn der Anruf fehlgeschlagen). Rückruf sollte sofort abgeschlossen werden, da sonst der thread behandelt die Ergebnisse werden blockiert.

InformationsquelleAutor Alex | 2014-07-16

Es ist in der Tat ein Hinweis in der Dokumentation:

Rückruf sollte sofort vollständig da sonst der thread
verarbeitet die Ergebnisse wird blockiert.

Rückrufe behandelt werden die wichtigsten Verfahren, aber Sie laufen in einer eigenen thread. Beim erstellen einer Pool es tatsächlich schafft ein paar Thread Objekte intern:

class Pool(object):
    Process = Process

    def __init__(self, processes=None, initializer=None, initargs=(),
                 maxtasksperchild=None):
        self._setup_queues()
        self._taskqueue = Queue.Queue()
        self._cache = {}
        ... # stuff we don't care about
        self._worker_handler = threading.Thread(
            target=Pool._handle_workers,
            args=(self, )
            )
        self._worker_handler.daemon = True
        self._worker_handler._state = RUN 
        self._worker_handler.start()

        self._task_handler = threading.Thread(
            target=Pool._handle_tasks,
            args=(self._taskqueue, self._quick_put, self._outqueue,
                  self._pool, self._cache)
            )
        self._task_handler.daemon = True
        self._task_handler._state = RUN 
        self._task_handler.start()

        self._result_handler = threading.Thread(
            target=Pool._handle_results,
            args=(self._outqueue, self._quick_get, self._cache)
            )
        self._result_handler.daemon = True
        self._result_handler._state = RUN
        self._result_handler.start()

Den interessanten thread für uns ist _result_handler; wir kommen zu kurz, warum.

Umschaltgetriebe für einen zweiten, wenn Sie Sie ausführen apply_async wird, wird ein ApplyResult Objekt intern verwalten immer das Ergebnis vom Kind:

def apply_async(self, func, args=(), kwds={}, callback=None):
    assert self._state == RUN
    result = ApplyResult(self._cache, callback)
    self._taskqueue.put(([(result._job, None, func, args, kwds)], None))
    return result

class ApplyResult(object):

    def __init__(self, cache, callback):
        self._cond = threading.Condition(threading.Lock())
        self._job = job_counter.next()
        self._cache = cache
        self._ready = False
        self._callback = callback
        cache[self._job] = self


    def _set(self, i, obj):
        self._success, self._value = obj
        if self._callback and self._success:
            self._callback(self._value)
        self._cond.acquire()
        try:
            self._ready = True
            self._cond.notify()
        finally:
            self._cond.release()
        del self._cache[self._job]

Wie Sie sehen können, die _set Methode ist die eine, die endet eigentlich die Ausführung der callback übergeben, vorausgesetzt, die Aufgabe erfolgreich war. Beachten Sie auch, dass es fügt sich zu einem globalen cache dict am Ende __init__.

Nun, zurück zu den _result_handler thread-Objekt. Das Objekt ruft die _handle_results Funktion, die wie folgt aussieht:

    while 1:
        try:
            task = get()
        except (IOError, EOFError):
            debug('result handler got EOFError/IOError -- exiting')
            return

        if thread._state:
            assert thread._state == TERMINATE
            debug('result handler found thread._state=TERMINATE')
            break

        if task is None:
            debug('result handler got sentinel')
            break

        job, i, obj = task
        try:
            cache[job]._set(i, obj)  # Here is _set (and therefore our callback) being called!
        except KeyError:
            pass

        # More stuff

Es ist eine Schleife, die zieht nur die Ergebnisse von Kindern aus der Warteschlange, findet den Eintrag in cache, und fordert _set führt unser callback. Es ist in der Lage zu laufen, obwohl Sie in einer Schleife, weil es nicht läuft im Haupt-thread.

Danke Dano für die Zeit nehmen, zu schreiben, wie eine ausführliche Antwort! Wenn ich das richtig verstehe, wird der pool erstellt einen einzige neuer thread (der result_handler), deren Aufgabe es ist, zu warten, nur um für apply_async ist abgeschlossen, und ruft dann die callback in der result_handler-thread (was ist Teil der MainProcess). Wird der Rückrufe (für einen einzelnen pool-Objekt) aufgerufen werden nacheinander? I. e. Eine Reihe von apply_async können fertig zusammen, aber die Rückrufe ausgeführt werden eins nach dem anderen in serieller durch die result_handler?
Noch eine weitere Frage. Was ist, wenn die callback-Funktion und das Haupt-Skript Durcheinander mit den gleichen Objekten (in der MainProcess)? Könnte es unvorhersehbares Verhalten? I. e. wenn der Rückruf und etwas später in der main-Skript versuchen zu schreiben in die gleiche Datei oder ändern Sie den gleichen array. Wenn der Rückruf kommt tatsächlich ausgeführt wer weiß, was das main-script wird in dieser Zeit gemacht.
Ja, die Rückrufe werden ausgeführt squentially. Die _result_handler thread zieht eine abgeschlossene Aufgabe aus der Warteschlange, ruft _set(läuft der callback), dann bewegt sich auf die nächste. Dies ist der Grund, warum die Dokumentation sagt, machen Sie sicher, dass der callback sofort abgeschlossen; die Ausführung der callback-Blöcke weitere Ergebnisse verarbeitet.
Sie müssen auf jeden Fall sorgen um die thread-Sicherheit von jedem Objekt, das Sie ändern in den Rückruf. Im Allgemeinen würde ich empfehlen, so wenig wie möglich in den Rückruf, aber wenn du unbedingt touch gemeinsamen Staat, Sie zu schützen haben es mit einem mutex in irgendeiner Form.

InformationsquelleAutor dano

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.