Einfache Möglichkeit zur Verwendung von parallel-Optionen von scikit-learn-Funktionen auf HPC

In vielen Funktionen von scikit-learn implementiert benutzerfreundliche Parallelisierung. Zum Beispiel in
sklearn.cross_validation.cross_val_score Sie übergeben Sie einfach die gewünschte Anzahl der computational jobs in n_jobs argument. Und für den PC mit multi-core-Prozessor, es wird funktionieren, sehr nett. Aber wenn ich verwenden möchten, die entsprechende option im high-performance-cluster (mit installiertem OpenMPI-Paket und mit SLURM für die Ressource-management) ? Ich weiß sklearn verwendet joblib für die Parallelisierung, die verwendet multiprocessing. Und, wie ich weiß, (aus dieser, zum Beispiel, Python multiprocessing innerhalb mpi) Python-Programme parallelisiert mit multiprocessing einfach zu skalieren oh gesamten MPI-Architektur mit mpirun - Dienstprogramm. Kann ich verbreiten Berechnung der sklearn Funktionen auf mehrere computational nodes nur mit mpirun und n_jobs argument?

  • Möchten Sie vielleicht zu prüfen, dask-sklearn mit dem dezentralen scheduler, können in einem cluster ausgeführt: jcrist.github.io/dask-sklearn-part-1.html
  • können Sie ein Beispiel für die Verwendung der distributed scheduler? Die verteilte dask Beispiele, die ich gesehen habe beinhalten manuelles erstellen von Arbeitern auf jede Maschine und deren Zuordnung zu den scheduler. Ich bin mir nicht sicher, ich sehe, wie diese Bindungen in der dask-sklearn Funktionen. Würde ich nur erstellen die Planer und Arbeiter wie hier: dask.pydata.org/en/doc-test-build/distributed.html dann legen Sie die Standard-scheduler so wie in deinem link (wobei 10.0.0.3:8786 ist die Adresse der Planer erstellt habe ich wie im ersten link)?
  • Ja. Der setup-Prozess ist genau so, wie Sie beschreiben. Siehe distributed.readthedocs.io/en/latest/setup.html
  • das scheint nicht für mich arbeiten. Es scheint, dass nichts ausgeführt wird, auf die Arbeiter, obwohl Sie erfolgreich erstellt wurde. Können Sie die Antwort Lesen unten und meine Kommentare zu es und sehen, wenn Sie irgendwelche Ideen, bitte?
InformationsquelleAutor user3271237 | 2016-07-26
Schreibe einen Kommentar