Tag: loop-unrolling

Loop unrolling ist eine Schleife die Optimierung Strategie.

Gibt es eine Möglichkeit zu entrollen von Schleifen in einem AMD-OpenCL-kernel mit dem compiler?

1 Antworten

Ich versuche zu bewerten, die performance-Unterschiede zwischen OpenCL für AMD-und Nvidia-Grafikkarten. Ich habe einen kernel, der führt eine matrix-Vektor-Multiplikation. Bei mir läuft der kernel auf zwei verschiedenen Systemen in den Momenten, mein laptop hat eine NVidia GT525m

Self-unrolling makro-Schleife in C/C++

5 Antworten

Ich arbeite derzeit an einem Projekt, wo jeder Zyklus zählt. Während des profilings meine Anwendung, die ich entdeckt, dass der Aufwand von einigen inneren Schleife ist ziemlich hoch, denn Sie bestehen nur aus ein paar Computer-Anweisung. Zusätzlich

boost c c++loop-unrolling macros

Was bewirkt #pragma entrollen genau? Hat es Auswirkungen auf die Anzahl der threads?

1 Antworten

Ich bin neu in CUDA, und ich kann nicht verstehen, loop unrolling. Ich schrieb ein Stück code, um die Technik zu verstehen __global__ void kernel(float *b, int size) { int tid = blockDim.x * blockIdx.x + threadIdx.x;

cuda loop-unrolling nvidia pragma

Alternative zu if, else if

8 Antworten

Ich habe eine Menge von if -, else if-Anweisungen, und ich weiß, es muss einen besseren Weg, dies zu tun, aber auch nach der Suche stackoverflow ich bin mir nicht sicher, wie dies zu tun in meinem

c#dictionary if-statement loop-unrolling performance