Tag: avx

Advanced Vector Extensions (AVX) ist eine Erweiterung des x86-Befehlssatz-Architektur für Mikroprozessoren von Intel und AMD.

Wie dreht man eine SSE - /AVX-Vektor

2 Antworten

Ich ausführen muss, um ein drehen der Betrieb mit möglichst wenig Taktzyklen wie möglich. Im ersten Fall nehmen wir an __m128i als source-und dest-Typ: Quelle: || A0 || A1 || A2 || A3 || dest: || A1

Wie kann ich den Austausch der low-128-bits und eine hohe 128-bit-in eine 256-bit AVX (YMM) registrieren

2 Antworten

Ich bin Portierung SSE SIMD-code für die Verwendung der 256-bit-AVX-Erweiterungen und kann nicht scheinen zu finden, eine Anweisung, die Mischung wird/shuffle/bewegen Sie die hohe 128-bit-und die low-128 bits. Backing-Geschichte: Was ich wirklich will, ist VHADDPS/_mm256_hadd_ps zu handeln,

avx simd x86

Wie findet man die maximale horizontale in eine 256-bit-AVX-Vektor

3 Antworten

Ich habe ein __m256d Vektor verpackt mit vier 64-bit-floating-point-Werte. Ich muss die horizontale maximale von der vector-Elemente und speichert das Ergebnis in einer double-precision-skalaren Wert; Meine versuche wurden alle mit einer Menge von schlurfenden der vector-Elemente, so

avx avx2 simd vector-processing x86

SIMD math-Bibliotheken für die SSE-und AVX

2 Antworten

Ich bin auf der Suche nach SIMD math-Bibliotheken (vorzugsweise open source) für die SSE-und AVX. Ich meine zum Beispiel wenn ich eine AVX-register v mit 8 float-Werte will ich sin(v), um die Sünde aller acht Werte auf

avx math.h simd sse

Unterschied zwischen Intel E7 und E5 Xeon Modellen?

1 Antworten

Ich bin die Erforschung der Möglichkeit, um einen cluster zu erstellen von leistungsstarken Maschinen, ausgerichtet in Richtung HPC (FLOP) Berechnung und deshalb habe ich die Durchsicht der top - Intel Xeon Modelle und war überrascht zu entdecken,

avx cpu intel

Intel AVX: 256-bit-version von dot-Produkt für double-precision-floating-point-Variablen

3 Antworten

Intel Advanced Vector Extensions (AVX) bietet keine Skalarprodukt in der 256-bit version (YMM-register) für die double-precision-floating-point-Variablen. Das "Warum?" - Frage wurden nur sehr kurz behandelt, in einem anderen forum (hier) und auf Stack Overflow (hier). Aber die Frage

avx c++performance simd

FMA3 in GCC: wie aktivieren

2 Antworten

Ich habe einen i5-4250U, die hat AVX2 und FMA3. Ich Teste einige Dichte-matrix-Multiplikation-code in GCC 4.8.1 unter Linux, die ich schrieb. Unten ist eine Liste von drei verschiedenen Möglichkeiten, die ich kompilieren. SSE2: gcc matrix.cpp -o matrix_gcc

avx c++fma gcc intel

Mit AVX mit GCC - avxintrin.h fehlt

3 Antworten

Ich bin mit meinem Laptop(coreI5) auf Ubuntu-64bit 12.04 LTS. Ich bin versucht, in zu erhalten AVX für einige random number generation. In Eclipse-CDT-ich habe eine neue C++ "Hallo Welt" - Projekt mit Linux-GCC. Ich immintrin.h und versuchte

avx c++gcc

FLOPS pro Zyklus für sandy-bridge und haswell SSE2/AVX/AVX2

2 Antworten

Ich bin verwirrt, wie viele flops pro Takt pro Kern kann getan werden, mit Sandy-Bridge und Haswell. Wie ich es verstehe, mit SSE-es sollte 4 flops pro Takt pro Kern für SSE und 8 flops pro Takt

avx cpu cpu-architecture flops intel

Wie Sie sagen, wenn ein Rechner unter Linux unterstützt AVX/AVX2-Instruktionen?

4 Antworten

Bin ich auf SUSE Linux Enterprise 10/11 Maschinen. Ich starte meine Regressionen auf eine farm aus Rechnern mit Intel-Prozessoren. Einige meiner tests fehlschlagen, weil meine Instrumente gebaut werden, mit einer Bibliothek, die erfordert, AVX/AVX2 Unterricht unterstützen. Ich

avx avx2 linux suse unix

Am schnellsten horizontale Vektor-Summe mit AVX-Instruktionen

3 Antworten

Habe ich eine gepackte Vektor von vier 64-bit-floating-point-Werte. Ich möchte die Summe der Vektor-Elemente. Mit SSE (und mit 32-bit floats) konnte ich nur Folgendes tun: v_sum = _mm_hadd_ps(v_sum, v_sum); v_sum = _mm_hadd_ps(v_sum, v_sum); Leider, obwohl AVX verfügt

avx simd sse vector-processing x86

Wie erkennt man die Verfügbarkeit von SSE / SSE2 / AVX / AVX2 / AVX-512 / AVX-128-FMA / KCVI zur Kompilierzeit?

1 Antworten

Ich versuche zu optimieren, einige matrix-Berechnungen und ich Frage mich, ob es möglich war, zu erkennen, die zur compile-Zeit, wenn die SSE/SSE2/AVX/AVX2/AVX-512/AVX-128-FMA/KCVI[1] wird aktiviert, indem der compiler ? Ideal für GCC und Clang, aber ich kann zu

avx avx512 clang gcc sse

FLOPS pro Zyklus für sandy-bridge und haswell SSE2 / AVX / AVX2

2 Antworten

Ich bin verwirrt, wie viele flops pro Takt pro Kern kann getan werden, mit Sandy-Bridge und Haswell. Wie ich es verstehe, mit SSE-es sollte 4 flops pro Takt pro Kern für SSE und 8 flops pro Takt

avx cpu cpu-architecture flops intel

Verwendung von Fused Multiply-Add (FMA) -Anweisungen mit SSE / AVX

2 Antworten

Habe ich gelernt, dass einige Intel/AMD CPUs tun können simultanen multiplizieren und addieren mit SSE/AVX: FLOPS pro Zyklus für sandy-bridge und haswell SSE2/AVX/AVX2. Ich gerne wissen, wie man dies am besten im code und ich will auch

avx c cpu-architecture fma sse

Ihre CPU unterstützt Anweisungen, für die diese TensorFlow-Binärdatei nicht kompiliert wurde: AVX AVX2

3 Antworten

Ich bin neu tensorflow. Ich habe vor kurzem installiert (Windows CPU-version) und bekam folgende Nachricht: Erfolgreich installiert tensorflow-1.4.0 tensorflow-tensorboard-0.4.0rc2 Dann, wenn ich versuchte zu laufen import tensorflow as tf hello = tf.constant('Hello, TensorFlow!') sess = tf.Session() sess.run(hello)

avx cpu tensorflow

Verwenden der AVX-CPU-Anweisungen: Schlechte Leistung ohne "/ arch: AVX"

2 Antworten

Mein C++ code verwendet SSE und jetzt will ich es zu verbessern, zu unterstützen AVX, wenn es verfügbar ist. Damit ich erkennen, wenn AVX verfügbar ist, und rufen Sie eine Funktion, die verwendet AVX-Befehle. Ich benutze Win7

avx c++performance sse visual-studio-2010

Intel SSE und AVX Beispiele und Tutorials

4 Antworten

Gibt es eine gute C/C++ - tutorials oder Beispiele für das lernen der Intel SSE-und AVX-Anweisungen? Fand ich wenige auf der Microsoft MSDN-und Intel-sites, aber es wäre toll, es zu verstehen von den Grundlagen.. InformationsquelleAutor der Frage

avx intel sse vectorization

Wie prüfe ich, ob eine CPU den SSE3-Befehlssatz unterstützt?

5 Antworten

Ist der folgende code gültig, zu prüfen, ob eine CPU unterstützt den SSE3-Befehlssatz? Mithilfe der IsProcessorFeaturePresent() - Funktion scheinbar nicht funktioniert, auf Windows XP (siehe http://msdn.microsoft.com/en-us/library/ms724482(v=vs. 85).aspx). bool CheckSSE3() { int CPUInfo[4] = { -1}; //-- Get

avx c++cpuid instruction-set sse

Die Verwendung von AVX-Intrinsics anstelle von SSE verbessert die Geschwindigkeit nicht - warum?

4 Antworten

Habe ich mit der Intel SSE-Interna seit geraumer Zeit mit einer guten Leistung gewinnt. Daher habe ich erwartet, dass die AVX-Interna zu weiteren speed-up-meine Programme. Dies war leider nicht der Fall bis jetzt. Wahrscheinlich mache ich einen

avx c++gcc performance sse