Tag: vector-processing

Wie findet man die maximale horizontale in eine 256-bit-AVX-Vektor

3 Antworten

Ich habe ein __m256d Vektor verpackt mit vier 64-bit-floating-point-Werte. Ich muss die horizontale maximale von der vector-Elemente und speichert das Ergebnis in einer double-precision-skalaren Wert; Meine versuche wurden alle mit einer Menge von schlurfenden der vector-Elemente, so

Am schnellsten horizontale Vektor-Summe mit AVX-Instruktionen

3 Antworten

Habe ich eine gepackte Vektor von vier 64-bit-floating-point-Werte. Ich möchte die Summe der Vektor-Elemente. Mit SSE (und mit 32-bit floats) konnte ich nur Folgendes tun: v_sum = _mm_hadd_ps(v_sum, v_sum); v_sum = _mm_hadd_ps(v_sum, v_sum); Leider, obwohl AVX verfügt

avx simd sse vector-processing x86

Wie Vektorisieren mit gcc?

2 Antworten

V4-Serie der gcc compiler automatisch Vektorisieren Schleifen mit der SIMD Prozessor auf einige moderne CPUs wie der AMD Athlon-oder Intel Pentium - /Core-chips. Wie wird das gemacht? InformationsquelleAutor der Frage casualcoder | 2009-01-03

gcc loops simd vector-processing