3
Antworten
Ich habe ein __m256d Vektor verpackt mit vier 64-bit-floating-point-Werte. Ich muss die horizontale maximale von der vector-Elemente und speichert das Ergebnis in einer double-precision-skalaren Wert; Meine versuche wurden alle mit einer Menge von schlurfenden der vector-Elemente, so
3
Antworten
Habe ich eine gepackte Vektor von vier 64-bit-floating-point-Werte. Ich möchte die Summe der Vektor-Elemente. Mit SSE (und mit 32-bit floats) konnte ich nur Folgendes tun: v_sum = _mm_hadd_ps(v_sum, v_sum); v_sum = _mm_hadd_ps(v_sum, v_sum); Leider, obwohl AVX verfügt
2
Antworten
V4-Serie der gcc compiler automatisch Vektorisieren Schleifen mit der SIMD Prozessor auf einige moderne CPUs wie der AMD Athlon-oder Intel Pentium - /Core-chips. Wie wird das gemacht? InformationsquelleAutor der Frage casualcoder | 2009-01-03