Tag: intrinsics

Systeminterne Funktionen in Programmiersprachen, die kompiliert werden zur Nutzung bestimmter CPU-Instruktionen außerhalb des Bereichs der Sprache.

Wie dreht man eine SSE - /AVX-Vektor

Anzahl der Antworten 2 Antworten
Ich ausführen muss, um ein drehen der Betrieb mit möglichst wenig Taktzyklen wie möglich. Im ersten Fall nehmen wir an __m128i als source-und dest-Typ: Quelle: || A0 || A1 || A2 || A3 || dest: || A1

x86 min/max-asm-Anweisungen?

Anzahl der Antworten 6 Antworten
Gibt es irgendwelche asm-Anweisungen, können speed-up-Berechnung von min/max eines Vektor von Double/Integer für die Core-i7-Architektur? Update: Ich hatte nicht erwartet, wie Reich Antworten, danke. So sehe ich, dass max/min ist möglich ohne Verzweigung. Ich habe die sub-Frage:

Wie um zu überprüfen, mit Intel-Interna wenn AVX-Erweiterungen unterstützt wird die CPU?

Anzahl der Antworten 3 Antworten
Ich Schreibe ein Programm mit der Intel-Interna. Ich will _mm_permute_pd intrinsische, die nur auf CPUs mit AVX. Für CPUs ohne AVX, die ich verwenden kann _mm_shuffle_pd aber nach den Spezifikationen, ist es viel langsamer als _mm_permute_pd. Tun

Trichter-shift - was ist das?

Anzahl der Antworten 1 Antworten
Beim Lesen durch CUDA 5.0 Programming Guide stieß ich auf eine Funktion namens "Trichter shift", die in 3.5 compute-fähigen Gerät, aber nicht 3.0. Es enthält eine annotation "siehe Referenz-Handbuch", aber wenn ich Suche nach dem "Trichter-shift" -

Rekonstruktion von 3D-Koordinaten im Kamera-Koordinatensystem aus 2D - Pixel mit seitlichem Zustand

Anzahl der Antworten 2 Antworten
Ich versuche zu rekonstruieren, die 3D-Koordinaten aus 2D-Pixel-Koordinaten in ein Bild der Kamera mit einer Seite der Bedingung (in MatLab). Ich habe extrinsische und intrinsische Parameter der Kamera. Verwendung von homogenen transformation, kann ich die Transformation von

Wie zu verwenden MSVC-Interna, um das äquivalent von diesem GCC-code?

Anzahl der Antworten 4 Antworten
Der folgende code ruft die builtin Funktionen für clz/ctz in GCC und, auf anderen Systemen, hat die C-Versionen. Natürlich, die C-Versionen sind ein wenig suboptimal, wenn das system verfügt über einen eingebauten clz/ctz Anleitung, wie x86 und

SSE-Befehlssatz nicht aktiviert

Anzahl der Antworten 3 Antworten
Ich bin immer ärger mit diesem Fehler: "SSE instruction set "nicht aktiviert". Wie kann ich das herausfinden? Ich habe ACER i7, Ubuntu 11.10, bitte kann mir einer helfen? Jede Hilfe wird dankbar sein! Läuft auch: sudo cat

Wie die Multiplikation und addition-Interna in ARM-Cortex-a8?

Anzahl der Antworten 3 Antworten
wie die Verwendung der Multiplikations-akkumulations-Interna von GCC? float32x4_t vmlaq_f32 (float32x4_t , float32x4_t , float32x4_t); Kann mir jemand erklären, was die drei Parameter ich übergeben muss dieser Funktion. Ich meine die Quell-und Ziel-Registern und was die Funktion zurückgibt?

c++ SSE SIMD framework

Anzahl der Antworten 8 Antworten
Kennt jemand ein open-source-C++ x86-SIMD-Interna-Bibliothek? Intel liefert genau das, was ich in den integrated performance primitives-Bibliothek, aber kann ich nicht benutzen, weil die Urheber-und alle über dem Platz. BEARBEITEN Ich weiß schon, die systeminterne Funktionen, sofern vom

Ist es eine gute Referenz für ARM-Neon-Interna?

Anzahl der Antworten 4 Antworten
Den ARM reference manual nicht zu sehr ins detail gehen, die in den einzelnen Anweisungen ( http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0348b/BABIIBBG.html ). Gibt es etwas, das ein wenig Ausführlicher? InformationsquelleAutor der Frage Vineeth | 2010-05-17

drucken __m128i variable

Anzahl der Antworten 4 Antworten
Ich versuche zu lernen, um code mit Interna und unten ist ein code der nicht neben compiler used: icc #include<stdio.h> #include<emmintrin.h> int main() { __m128i a = _mm_set_epi32(1,2,3,4); __m128i b = _mm_set_epi32(1,2,3,4); __m128i c; c = _mm_add_epi32(a,b);

SSE, intrinsics und Ausrichtung

Anzahl der Antworten 3 Antworten
Ich geschrieben habe, einen 3D-Vektor-Klasse mit einer Menge von SSE compiler-Interna. Alles funktionierte gut, bis ich anfing zu instatiate Klassen mit den 3D-Vektor als Mitglied mit neuen. Erlebte ich seltsame Abstürze im release-Modus aber nicht im debug-Modus

Was sind intrinsic?

Anzahl der Antworten 4 Antworten
Kann mir jemand erklären, was Sie sind und warum ich Sie brauche? Welche Art von Anwendungen bin ich bauen, wenn ich Interna? InformationsquelleAutor der Frage Scott J | 2010-02-15

Header-Dateien für x86-SIMD-Intrinsics

Anzahl der Antworten 5 Antworten
Welche header-Dateien bieten die systeminterne Funktionen für die verschiedenen x86-SIMD-Befehlssatz-Erweiterungen (MMX, SSE, AVX, ...)? Es scheint unmöglich zu finden, so eine Liste online. Korrigieren Sie mich, wenn ich falsch bin. InformationsquelleAutor der Frage fredoverflow | 2012-06-27

Äquivalent von InterlockedIncrement in Linux / gcc

Anzahl der Antworten 1 Antworten
Wäre es eine sehr einfache Frage (könnte dupliziert werden), aber ich war nicht in der Lage, es zu finden. Win32-API bietet ein sehr handliches set von atomic-Operationen (wie systeminterne Funktionen) wie InterlockedIncrement strahlt lock add x86-code. Auch

Wie Verwenden von VC ++ -Internen Funktionen ohne Laufzeitbibliothek

Anzahl der Antworten 6 Antworten
Ich bin in einer dieser Herausforderungen, in denen Sie versuchen, zu produzieren, die kleinste mögliche binäre, also ich Baue mein Programm ohne C-oder C++-Laufzeitbibliotheken (RTL). Ich glaube nicht, link zu den DLL-version oder der statischen version. Ich

Mitglieder von __m128 per Index erhalten?

Anzahl der Antworten 4 Antworten
Habe ich einige code, ursprünglich hat mir jemand die Arbeit mit MSVC, und ich bin versucht, es zu erhalten zu arbeiten auf Clang. Hier ist die Funktion, dass ich Probleme habe mit: float vectorGetByIndex( __m128 V, unsigned