Tag: loop-unrolling

Loop unrolling ist eine Schleife die Optimierung Strategie.

Gibt es eine Möglichkeit zu entrollen von Schleifen in einem AMD-OpenCL-kernel mit dem compiler?

Anzahl der Antworten 1 Antworten
Ich versuche zu bewerten, die performance-Unterschiede zwischen OpenCL für AMD-und Nvidia-Grafikkarten. Ich habe einen kernel, der führt eine matrix-Vektor-Multiplikation. Bei mir läuft der kernel auf zwei verschiedenen Systemen in den Momenten, mein laptop hat eine NVidia GT525m

Self-unrolling makro-Schleife in C/C++

Anzahl der Antworten 5 Antworten
Ich arbeite derzeit an einem Projekt, wo jeder Zyklus zählt. Während des profilings meine Anwendung, die ich entdeckt, dass der Aufwand von einigen inneren Schleife ist ziemlich hoch, denn Sie bestehen nur aus ein paar Computer-Anweisung. Zusätzlich

Was bewirkt #pragma entrollen genau? Hat es Auswirkungen auf die Anzahl der threads?

Anzahl der Antworten 1 Antworten
Ich bin neu in CUDA, und ich kann nicht verstehen, loop unrolling. Ich schrieb ein Stück code, um die Technik zu verstehen __global__ void kernel(float *b, int size) { int tid = blockDim.x * blockIdx.x + threadIdx.x;

Alternative zu if, else if

Anzahl der Antworten 8 Antworten
Ich habe eine Menge von if -, else if-Anweisungen, und ich weiß, es muss einen besseren Weg, dies zu tun, aber auch nach der Suche stackoverflow ich bin mir nicht sicher, wie dies zu tun in meinem