wie für die Synchronisierung zwischen cuda-kernel-Funktion?

Habe ich zwei cuda-kernel solche Funktionen

a<<<BLK_SIZE,THR_SIZE>>>(params,...);
b<<<BLK_SIZE,THR_SIZE>>>(params,...);

Nachdem die Funktion gestartet hat, will ich warten, bis a beendet ist und starten Sie dann die Funktion b.
also ich eingefügt cudaThreadSynchronize() zwischen a und b, wie diese,

a<<<BLK_SIZE,THR_SIZE>>>(params,...);
err=cudaThreadSynchronize();
if( err != cudaSuccess)
    printf("cudaThreadSynchronize error: %s\n", cudaGetErrorString(err));
b<<<BLK_SIZE,THR_SIZE>>>(params,...);

aber cudaThreadSynchronize() zurückgegeben Fehler-code: the launch timed out and was terminated cuda error

wie kann ich es beheben?

Einen einfachen code Erklärung:

mmap(sequence file);
mmap(reference file);

cudaMemcpy(seq_cuda, sequence);
cudaMemcpy(ref_cuda,reference);

kernel<<<>>>(params); //find short sequence in reference
cudaThreadSynchronize();
kernel<<<>>>(params);

cudaMemcpy(result, result_cuda);
report result

und in der kernel-Funktion, es ist ein großer for-Schleife mit if-else für die pattern-matching-Algorithmus zur Verringerung der Anzahl der Vergleiche.

In der Nvidia-CUDA-forum (eg, cuda die Einführung Zeitlimit überschritten und wurde abgebrochen ), die Menschen zeigen, um Kerne, die zu lange laufen auf der GPU, die auch für Ihre video-display. Die Lösung ist die Verkürzung der kernel oder andere GPU (z.B. integrierte Grafik), fahren Sie Ihr display.
Welches Betriebssystem verwenden Sie?
ich bin mit ubuntu 10.04

InformationsquelleAutor enc | 2012-03-28

cuda synchronize

1

Dieser Start-Fehler bedeutet, dass etwas schief ging, wenn Sie Ihre ersten kernel gestartet wurde oder vielleicht sogar etwas davor. Arbeiten Sie Ihren Weg aus dieser, versuchen Sie die Ausgabe von allen CUDA-runtime-Aufrufe für Fehler. Auch ein cudaThreadSync gefolgt von Fehler-check, nachdem alle kernel-Aufrufe. Dies sollte Ihnen helfen, den ersten Ort, wo der Fehler Auftritt.

Wenn es ist in der Tat ein Fehler beim starten, müssen Sie untersuchen, die Ausführung der Konfiguration und der code des Kernels zu finden, die Ursache des Fehlers.

Schließlich ist zu beachten, dass es sehr unwahrscheinlich ist, dass Ihre Aktion hinzufügen in einem cudaThreadSynchronize diesen Fehler verursacht hat. Ich sage dies, weil, so, wie Sie formuliert verweist die Abfrage an den cudaThreadSynchronize als Täter. Alle diesen Aufruf gemacht hat, war, fangen Ihre vorhandene Fehler früher.
- ich überprüfte alle kernel-Aufrufe, bevor Sie eine, aber es gab keine Fehler. dann "der Start Zeitlimit überschritten und wurde abgebrochen cuda-Fehler" sein könnte, ist aufgetreten während der Funktion ein??
- Enc: ja, es muss etwas falsch mit dem kernel ein. Entweder seine Ausführung Konfiguration oder was Sie tun in Ihrem kernel.
- Dank Ashwin. gibt es eine Vermutung über diese situation?? ich habe keine Ahnung, welches dieses problem verursacht. Eine Sache, die ich erkenne, ist, dass, wenn ich kleine Dateien(~10 MB), es funktioniert gut, aber ich größere Daten(einige hundert MB, aber die passen in den Speicher auf der Grafikkarte) funktioniert es nicht.
- Enc: Es wäre hilfreich, wenn du uns ein bisschen von den kernel-code in Frage.
- mein code ist im Grunde pattern-matching, die berichtet, wie viele Male "short sequence" erscheint in langen "Referenz".
- und ich editierte Frage oben, zur Erklärung meines codes.
- Enc: Dies ist nicht hilfreich, es sei denn, Sie teilen die Ausführung Konfiguration beim starten des Kernels und der code der kernel selbst.
InformationsquelleAutor Ashwin Nanjappa

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.