OpenCL: CPU - /GPU-mehrere Geräte

Ich möchte die Ausführung paralleler tasks auf die GPU und CPU mit OpenCL mehrere Geräte. Die standard-Beispiele aus der AMD-SDK sind nicht sehr klar zu diesem Thema. Können Sie beraten, zusätzliche Anleitungen oder Beispiele zu diesem Thema? Jede Beratung wird tun.

Danke.

Mein Papier Eine Umfrage von CPU und GPU Heterogenen Computing-Techniken werden viele runtime-Systeme und Programmiersprachen für die Berechnung über CPU und GPU.

InformationsquelleAutor Inso Reiges | 2011-04-13

opencl

1

Für tutorial und details über die Verwendung von mehreren Geräten, können Sie wollen, siehe Abschnitt 4.12 der AMD-APP-SDK Programming guide

InformationsquelleAutor Divij
5

Parallel ausgeführt werden Aufgaben auf mehreren Geräten erfordert dynamische Planung für guten Wirkungsgrad, weil Sie nie wissen, die genaue Leistung von jedem Gerät - es hängt von der aktuellen Belastung (nicht nur durch Ihr Programm, aber alle anderen auch), aktuelle Uhr (es kann sich ändern, deutlich auf den meisten CPUs und GPUs je nach den aktuellen Energiespar-Profil oder laden). Auch real-world performance hängt von Ihrer input-Daten.

Natürlich, Sie können schreiben, alle nötigen code selbst wie alle anderen Antworten vorschlagen, aber meiner Meinung nach ist es Verschwendung von Zeit und es ist viel bessere Idee zur Verwendung der vorhandenen Lösung. Ich empfehle die Verwendung StarPU. Ich habe verwendet, StarPU in meinem OpenCL-Projekt, und es funktionierte ziemlich gut. StarPU kommt mit Beispielen auf, wie code zu schreiben in der Lage mit mehreren GPUs und CPUs effizient.

StarPU:

Traditionellen Prozessoren erreicht haben, architektonische Grenzen, die heterogene multicore-designs und hardware-Spezialisierung (z.B. Coprozessoren, Beschleuniger, ...) ansprechen möchten. Allerdings, für die Nutzung dieser Maschinen führt zahlreiche herausfordernde Fragen auf allen Ebenen, angefangen von der Programmierung über die Modelle und Compiler, um das design von skalierbaren hardware-Lösungen. Das design von effizienten runtime-Systeme für diese Architekturen ist ein Kritischer Punkt. StarPU in der Regel macht es viel einfacher für high-performance-Bibliotheken oder compiler-Umgebungen zu nutzen heterogenen multicore-Maschinen, möglicherweise ausgestattet mit GPGPU-oder Cell-Prozessoren: anstatt Umgang mit low-level-Probleme, Programmierer konzentrieren sich auf die Algorithmische betrifft.

Dort ist auch ein weiteres Projekt, SkePU, aber ich wollte nicht versuchen, es selbst:

SkePU:

SkePU ist wie ein Skelett Programmierumgebung für multicore-CPUs und multi-GPU-Systeme. Es ist eine C++ template Bibliothek mit sechs Daten-parallel-und eine Aufgabe-parallele Skelette, zwei container-Typen und Unterstützung für die Ausführung auf multi-GPU-Systeme sowohl mit CUDA und OpenCL. Vor kurzem, Unterstützung für die hybrid-Ausführung, performance-aware dynamic scheduling und load-balancing entwickelt, in SkePU durch die Implementierung eines Backends für die StarPU-runtime-system.

Wenn Sie bei Google nach "dynamische scheduling-gpu-cpu-opencl" finden Sie noch weitere möglicherweise nützliche Kostenlose oder kommerzielle Projekte und Dokumentation.

InformationsquelleAutor Lissanro Rayen
1

Es gibt nichts hält Sie zurück, dies zu tun. Sie müssen liefern alle Geräte, die Sie verwenden möchten, um Ihren Anruf zu clCreateContext() und dann erstellen Sie mindestens eine command queue für jeden von Ihnen. Je nachdem, was Sie versuchen zu tun, müssen Sie möglicherweise betrachten die erweiterte task-scheduling-Verfahren, z.B. die Verwendung der out-of-order-Kommando-queues und Veranstaltungen, planen von tasks auf allen Geräten.

InformationsquelleAutor pmdj
1

Mit clGetPlatforms finden Sie heraus, ob Sie mehr als eine Plattform oder nicht. Wenn Sie eine nVidia-GPU board und eine AMD CPU finden Sie auf Plattformen. Eine Plattform für die AMD-SDK und eine für die nVidia-CUDA-OpenCL-Implementierung. Mit clGetDevices finden Sie für jede Plattform, die die Geräte zur Verfügung. Es könnte ein pro-Plattform wie 1xGPU und 1xCPU.

Für jedes Gerät einen Kontext schaffen, mit clCreateContext und dann können Sie laufen beide parallel.
- Leider, Sie finden nicht, dass gpu und cpu in dieser situation. Zum ausführen von OpenCL auf Nvidia-hardware, die Sie benötigen, Nvidia runtime Bibliothek. Es werden nur Nvidia-Geräte. Wenn Sie AMD-gpu können Sie sehen, cpu und gpu auf einmal, weil Sie eine Laufzeit-Bibliothek. AMD hat mehr wahre heterogene Plattform.
- Sie können zum Beispiel die AMD OpenCL und registrieren Sie die Implementierung für NVIDIA-als auch. Ich habe es einmal gemacht und soweit ich weiß, hat es funktioniert. Geben Sie die Kreditoren in /etc/OpenCL/vendors für Linux. Für Windows, ich weiß nicht, die Lage, aber es sollte etwas ähnliches.
- Änderten sich die Dinge ein bisschen aus der letzten Zeit. Khronos eingeführt Installable Client Driver, D. H. shim OpenCL-Bibliothek, sieht für die eigentlichen Implementierungen und stellt Ihren APIs. (khronos.org/registry/cl/sdk/2.0/docs/man/xhtml/cl_khr_icd.html).
InformationsquelleAutor Rick-Rainer Ludwig
0

OpenCL Programming Guide von Aftab Munshi & andere geben Ihnen mehr details.

InformationsquelleAutor Chanakya.sun

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.