Tag: fma

Fused Multiply Add oder Multiply-Accumulate

FMA3 in GCC: wie aktivieren

Anzahl der Antworten 2 Antworten
Ich habe einen i5-4250U, die hat AVX2 und FMA3. Ich Teste einige Dichte-matrix-Multiplikation-code in GCC 4.8.1 unter Linux, die ich schrieb. Unten ist eine Liste von drei verschiedenen Möglichkeiten, die ich kompilieren. SSE2: gcc matrix.cpp -o matrix_gcc

Verwendung von Fused Multiply-Add (FMA) -Anweisungen mit SSE / AVX

Anzahl der Antworten 2 Antworten
Habe ich gelernt, dass einige Intel/AMD CPUs tun können simultanen multiplizieren und addieren mit SSE/AVX: FLOPS pro Zyklus für sandy-bridge und haswell SSE2/AVX/AVX2. Ich gerne wissen, wie man dies am besten im code und ich will auch