Effiziente (Zyklen wise) Algorithmus zum berechnen modulo 25?

Ich habe einen code, in dem ich bin-computing-x % 25. x nimmt immer einen positiven Wert, sondern seine dynamische Bandbreite ist groß.

Fand ich heraus, dass dieser bestimmte code-Stück-computing-x % 25 ist die Einnahme von großen Zyklen. Ich brauche, es zu optimieren.

Vorberechnete lookup-Tabelle ist ausgeschlossen wegen der möglichen großen Arbeitsspeicher Größe der Tabelle.

Als zweite Ansatz, den ich codiert, ein fragment(C-code) -

mod(a, b)
{   
    int r = a;  
    while(r >= b)
    {      
        r = r - b;
    }   
    return r;
}

1.) Wie kann ich diese optimieren, code für weitere Zyklen(squeeze es auf max)?

2.) Gibt es eine ganz andere optimierte Art und Weise zu erreichen x % 25( ich weiß, Ihr nicht einen gemeinsamen Betrieb, aber immer noch auf der Suche für clevere Eingänge die Menschen möglicherweise verwendet haben, in Ihren Erfahrungen, die vielleicht nelp mich.).

Danke.

-AD

EDIT:

Ich denke, mit einer nativen modulo-operator % in C , intern eine division ( /), die ist teuer, auf dem Prozessor bin ich mit.(Keine div-Anweisung). daher versuchen um zu sehen, ob benutzerdefinierte implemetation schlagen können, die inhärenten Berechnung mittels % - operator.

-AD

Glauben Sie, dass können Sie zur Optimierung der % - operator durch schreiben von C-code? Vielleicht gibt es einige shortcuts in der Montage aber ich bezweifle paar Zeilen C besser können als integrierte in-operator.
Compiler Kompromisse machen. Sie müssen nicht immer versuchen, für die Schnellste Geschwindigkeit. Es ist in der Regel ziemlich leicht zu schlagen, ein compiler für einen bestimmten Fall, denn der compiler ist der Umgang mit den Allgemeinen Fall.
"Ich fand heraus, dass diese ... ist die Einnahme von großen Zyklen. Ich brauche, es zu optimieren." Dies ist ein gute Sache zu hören! Eine Optimierung Frage, wo es war tatsächlich lief durch einen profiler.
Wenn Sie identifiziert die Prozessor - eine, die nicht eine Abteilung Betrieb - dann würden Sie besser Antworten schneller.
Down-gestimmt -, weil all die großen-großen Eingang, die Menschen haben in dieser Frage, ohne auch nur einen Hauch von Pflege von der original-poster, geschweige denn ein V-Zeichen für die gesuchte Lösung (stackoverflow.com/a/980973/451461).

InformationsquelleAutor goldenmean | 2009-06-11

c modulo optimization

30

Schlage ich die Lektüre Hacker ' s Delight. Es beschreibt sehr schnelle Rest-algorithmen für Konstante Teiler. Sie würde mit ziemlicher Sicherheit schlagen einen generellen Algorithmus.

Update: Hier finden Sie einige Beispiel-code... kann Es wahrscheinlich überarbeitet werden, um zu vermeiden das temporäre long long.
```
unsigned mod25(unsigned n)
{
    unsigned reciprocal = 1374389535; //2^35 /25
    unsigned div25 = ((unsigned long long)n * reciprocal) >> 35;
    return n - div25 * 25;
}
```
Ja es gibt eine schnelle division durch 5 gibt. Tut das zweimal, und Sie sind gesetzt, wenn Sie eine schnell multiplizieren. Alles hängt davon ab, auf Einzelheiten seiner Prozessor (word-Format, Anleitungen) und den gewünschten Bereich der Eingänge. Es gibt auch eine Coole modulo 5, das würde wahrscheinlich helfen.
GCC auf x86 wird dieser Algorithmus für die Berechnung % 25 - überprüfen Sie die Demontage, finden Sie die Magische Zahl, eine mull und ein shrl Anleitung (die Verschiebung wird nur durch 3 und nicht 35, weil der Wert Platzierung in den Registern)
Dies ist die richtige Antwort.
GCC sollte die Optimierung der E-Modul durch eine Konstante wie in diesem Fall auf alle Plattform, die es unterstützt

InformationsquelleAutor Johan Kotlinski

Hier ist eine andere Lösung, die ich kam mit:

int mod25(int x){
  /* 25 * (all powers of 2 <= INT_MAX), descending */
  if (x >= 1677721600) x -= 1677721600;
  if (x >=  838860800) x -=  838860800;
  if (x >=  419430400) x -=  419430400;
  if (x >=  209715200) x -=  209715200;
  if (x >=  104857600) x -=  104857600;
  if (x >=   52428800) x -=   52428800;
  if (x >=   26214400) x -=   26214400;
  if (x >=   13107200) x -=   13107200;
  if (x >=    6553600) x -=    6553600;
  if (x >=    3276800) x -=    3276800;
  if (x >=    1638400) x -=    1638400;
  if (x >=     819200) x -=     819200;
  if (x >=     409600) x -=     409600;
  if (x >=     204800) x -=     204800;
  if (x >=     102400) x -=     102400;
  if (x >=      51200) x -=      51200;
  if (x >=      25600) x -=      25600;
  if (x >=      12800) x -=      12800;
  if (x >=       6400) x -=       6400;
  if (x >=       3200) x -=       3200;
  if (x >=       1600) x -=       1600;
  if (x >=        800) x -=        800;
  if (x >=        400) x -=        400;
  if (x >=        200) x -=        200;
  if (x >=        100) x -=        100;
  if (x >=         50) x -=         50;
  if (x >=         25) x -=         25;
  return x;
}

Diese nicht teilt oder multiplys, nur 27 Vergleiche und maximal 27 Subtraktionen.

Es ist ein wenig schwer, sich davon zu überzeugen, dass das funktioniert, aber es funktioniert (zumindest für nicht-negative Werte von x).

Dem obigen code ist wirklich eine ent-version:

int mod25(int x){
  int divisor;
  for(int divisor = 1677721600; divisor >= 25; divisor >>= 1) {
    if (x >= divisor) x -= divisor;
  }
  return x;
}

Durch abrollen es wir vermeiden, das loop-Vergleich und auch die Verschiebungen auf Kosten der größeren code. Man könnte sogar teilweise Rollen Sie ihn mit Duff ' s device, wenn Sie das Gefühl so geneigt, aber mit nur 27 Iterationen insgesamt, und wie ein winziges Stück code, pro iteration, würde ich geneigt sein, nur Rollen Sie den ganzen Weg.

Hier ist, wie es funktioniert: Jede nicht-negative ganze Zahl x ausgedrückt werden kann als (n * 25) + k, wobei n eine nicht-negative ganze Zahl ist und k eine ganze Zahl von 0 bis 24. k ist übrigens auch das Ergebnis, das wir wollen, so könnten wir berechnen x - (n * 25) würden wir bekommen unsere Antwort. Wir wollen in der Lage sein, dies zu tun, ohne zu wissen, n-up-front, aber.

Denke über n binäre. Wenn wir wiederum konnten aus jeder der 1-bits würden wir bekommen 0. Ein Weg dies zu tun ist zu beginnen, bei großen Potenzen von 2 und arbeiten uns nach unten, subtrahieren jede Potenz von 2 nur wenn der aktuelle Wert von n größer als oder gleich, dass die macht der 2.

Da beschäftigen wir uns mit (n * 25) wir brauchen eigentlich absteigenden Potenzen von 2 mal 25. Da k streng weniger als 25, und der kleinste divisor, die wir jemals in Betracht ziehen, ist 25, dies funktioniert sogar, wenn wir ' re Umgang mit (n * 25) + k.

Also jeder Vergleich + Subtraktion ist das unwiderrufliche löschen ein bit von n, und wir am Ende sind Links mit k, der Rest.

InformationsquelleAutor Laurence Gonsalves

7

Da Sie möchten, dass der E-Modul eine Konstante, Sie kann wahrscheinlich schlagen es mit gegenseitigen Multiplikation. Dieses Papier zeigt, wie man eine Division durch eine Konstante in einer solchen Art und Weise, und gegen Ende, wie man den Rest von ihm.

Vor der Optimierung nichts, überprüfen Sie immer die Demontage. Vor kurzem habe ich entdeckt das gegenseitige trick mit code wie : int a = x % 3; int b = x / 3; Dieser code endete als eine einzelne Multiplikation und eine Verschiebung.

InformationsquelleAutor Nietzche-jou
7

Hier ist das beste, das ich kommen konnte mit:
```
int mod25(int x)
{
    while((x = (x & 31) + 7 * (x >> 5)) >= 25)
        x -= 25;

    return x;
}
```
Es kommt x % 25 mit x % 32 + 7 * (x/32). Der Wert überschwingen durch ein Vielfaches von 25, die es ermöglicht Rekursion.

Leistung scheint ausreichend zu sein: Ein Wert von x = 2147483647 (aka INT_MAX) muss 11 Iterationen.

InformationsquelleAutor Christoph
7

Inspiriert wurde ich dazu von Pax Antwort und machte ein mehr allgemeiner Algorithmus.
```
int mod(int a, int b) {
    int s = b;
    while (s <= a) {
        s <<= 1;
    }
    int r = a;
    while (r >= b) {
        s >>= 1;
        if (s <= r) {    
            r -= s;
        }
    }
    return r;
}
```
Subtrahiert Leistung von zwei vielfachen von b aus a bis das Ergebnis gefunden.

EDIT: Hinzugefügt den if Bedingung, damit es richtig funktioniert.

Wenn, als Beispiel, das ist zu tun 100 % 7, es zuerst klappt das 7 * 2 * 2 * 2 * 2 = 112. Dann teilt es 112 (s) durch 2 und subtrahieren, dass von 100 (r) (wenn s <= r) und ständig tut Sie dies, bis die modulo-ist gefunden. Daher
```
s = 112 / 2 = 56, r = 100 - 56 = 44
s = 56 / 2 = 28, r = 44 - 28 = 16
s = 28 / 2 = 14, r = 16 - 14 = 2
```
daher 100 % 7 = 2

Ich verlasse diesen Kommentar als ein Lesezeichen, damit ich mich erinnern kann, wieder zu überprüfen, und versuchen Sie, formal zu beweisen, dazu später 😉

InformationsquelleAutor David Johnstone
6

Oh mein <Gottheit der Wahl>. Ich kann nicht glauben, dass einige dieser Antworten.

Erste Sache, wiederholte Subtraktion, auch Pax-version, wird nie, nie, niemals optimal sein. Betrachten Sie die folgenden:
```
20 % 25
```
einfach und schnell durch wiederholte Subtraktion, aber:
```
65535 % 25
```
wird schrecklich langsam, 600+ Iterationen. Das ist ein Durchschnitt von 300 Iterationen für 16-bit-zahlen. Für 32-bit-Nummer, nun, nur, gar nicht dorthin gehen.

Der Schnellste Weg, dies zu tun ist, um lange Teilung. Siehe Niki ' s Antwort.

Aber, dies ist, was der compiler erzeugen, jedenfalls, mindestens, würde man hoffen, dass es das ist, was der compiler generiert wird. Es ist immer am besten, wenn Sie mit einem compiler für eine Nische Prozessor.

Der beste Weg, um diese Fahrt ist nicht das Modul in den ersten Platz. Warum brauchen Sie, um das Modul und kann man wieder den Faktor der code /Algorithmus zu vermeiden, der E-Modul, oder zumindest, machen das E-Modul trivial.

InformationsquelleAutor Skizz
5

Sich das problem mit dem loop ist, dass es ist O(n) - es werden sehr langsam für große Werte von r ist. Ich würde vorschlagen, so etwas wie dieses:
```
for (int s = MAX_SHIFT; s>=0; s--)
  if (r > (b<<s)) r -= (b<<s);
```
Aber ich bezweifle, dass dein compiler etwas zu tun, viel teurer als die.

Ich nehme an, Sie müssen MAX_SHIFT dynamisch, um sicherzustellen, dass (b<<s) nicht überläuft, ja?

InformationsquelleAutor Niki
3

Auf viele Prozessoren, integer-Multiplikation ist schneller als division. In diesem blog-post zeigt, wie zu ersetzen, die eine Konstante Ganzzahl-division mit einer Konstanten integer-Multiplikation. Durch eine Neuanordnung der Mathematik ein bisschen können Sie den Rest statt des Quotienten. Beachten Sie jedoch, dass, wenn Sie mit einem mäßig anspruchsvollen compiler, dann ist dies bereits für Sie getan. Sie schreiben einfach x % 25 und der compiler funktioniert der rest. Sollten Sie den erzeugten Assembler-code für deinen code, überprüfen, ob der compiler hat das nicht getan bereits, bevor Sie diese Optimierung in C. Auch sollte man Messen (Profil) die Leistung vor und nach, um sicherzustellen, dass Sie wirklich sind, die Dinge zu beschleunigen.

Looping wird weit langsamer als die division mit dem native-Anleitung für die relativ großen Operanden.

Edit: siehe auch dieses Papier.

InformationsquelleAutor Doug
3

Wenn Ihr C-compiler ausgerichtet ist, eine CPU mit keine Kluft Unterricht, Sie können ändern Sie Ihren code wie folgt:
```
mod(a, b) {
    int s = b + b + b + b;
    int r = a;
    while(r >= s) {
        r -= s;
    }
    while(r >= b) {
        r -= b;
    }
    return r;
}
```
Dies funktioniert, indem die Werte in Blöcken von vier, anstatt eine, bis in die Letzte schaltet dann zu subtrahieren Brocken.

Diese sollten Ihren code ausführen, etwa vier mal so schnell (vorausgesetzt 4*b ist nicht außerhalb der Reichweite Ihres ganzen zahlen). Sie könnten auch legen Sie mehr Schleifen (sagen wir ein 8*b) vor der 4*b man für noch mehr Geschwindigkeit.

Anderes, als dass, hand-coding, assembler helfen kann, aber ich glaube, Sie finden durchaus einen Schub von den oben genannten code, ohne dass es.

Wenn du mehr Details wissen, auf dem Weg werden Sie mit dem mod rufen, Sie optimieren es für Ihren Einzelfall. Zum Beispiel, wenn Sie nur wissen wollen modulo-25 von 16-bit-Ganzzahl, die den folgenden code viel schneller als eine simple Schleife mit variable Nenner.
```
int mod25 (int a) {                //a has maximum value of 2^15-1 = 32767
    while (a >= 15625) a-= 15625;  //at most 2 times.
    while (a >= 625) a-= 625;      //at most 24 times.
    while (a >= 25) a-= 25;        //at most 24 times.
    return a;
}
```
Läuft ein test, ich finde, dass Sie zu tun haben, 10 Millionen Iterationen, bevor ein merklicher Unterschied Auftritt zwischen dem, modulo-code und die Nutzung der % - operator (2 Sekunden vs. 0 Sekunden). Bis zu diesem Zeitpunkt waren Sie beide 0 Sekunden, obwohl, dass wurde auf einem schnellen Rechner (besser für mod25) und mit eine div Unterricht (besser für % operator), so müssten Sie es zum benchmark auf Ihrer eigenen hardware.

Dies ist in etwa so schnell, wie Sie wahrscheinlich zu bekommen, ohne dass Ihr code nicht lesbar ist (obwohl selbst das sollte nicht aufhören, wenn Sie bereit sind, fügen viele Kommentare, die erklären, wie es funktioniert).

Einer Allgemeinen Lösung für alle Nenner ist, um den ersten doppelten Nenner (mit bit-Verschiebungen für die Geschwindigkeit) so weit wie möglich, sodass die daraus resultierenden Abzüge minimiert werden. Dann, als der Zähler reduziert, die unterhalb der erhöhten Nenner, halbieren den Nenner und in Gang halten (bis der Nenner ist wieder am start).
```
int mod (int n, int d) {
    /* dx is the adjusted denom, don't let it overflow though. */
    int dx = d;
    while (((dx << 1) >>1) == dx)
        dx <<= 1;

    /* This loop processes the dx values until they get too small. */
    while (dx >= d) {
        /* This loop subtracts the large dx value. */
        while (n >= dx)
            n -= dx;
        dx >>= 1;
    }
    return n;
}
```
Diese tatsächlich ausführt, auf eine Stufe mit der optimierten version des mod25 oben, während die mehr Allgemeinen Lösung.

In Anbetracht Ihrer großen zahlen, die Sie vielleicht haben wollen, s = b*16 anstatt 4. Sie können tun, dass mit einem 4-bit-shift Links-shift-Anweisung.

InformationsquelleAutor paxdiablo
2

bitte engagieren Sie einige der gesunde Menschenverstand.

Wenn Sie schreiben könnten, C-code, berechnet x % 25-schneller als der compiler, dann würde der compiler verwenden, die schnellere Methode.

Den original-poster dieses fantastische Annahme, dass der compiler die Verwendung einer division. Keine compiler, die ich verwendet habe in den letzten zehn Jahren tun würde. Es ist die Multiplikation durch eine Konstante in der Nähe (2^32 /25) plus einige bit-twiddling, dass Sie nicht in der Lage sein zur Verbesserung von hand.

Gibt es eine Möglichkeit, dass Sie Sie produzieren können schnelleren code als der compiler, um herauszufinden, ob x % 25 == 0, da Sie nicht wirklich benötigen-code berechnet x % 25 richtig, nur code, berechnet x % 25 richtig, wenn es 0 ist, und nicht produzieren eine 0, wenn x % 25 != 0. Einsparungen werden wahrscheinlich im sub-Nanosekunden.

"Wie berechne ich x % c optimal für verschiedene Konstanten c" ist ein nettes puzzle. Compiler-Autoren wie schön Rätseln. Und Sie sind besser auf die Lösung von schönen Rätseln, wie diese, als Sie sind. Vor allem, da Sie nur brauchen eine Lösung, die funktioniert für eine Maschine, wo Sie haben, um zu produzieren, eine Allgemeine Lösung.

InformationsquelleAutor gnasher729
1

Wenn Sie nicht wie % Betreiber:
```
int mod(int a, int b) {
    int integral = a / b;
    return a - (b*integral);
}
```
Warum downvote? Was ist falsch an dem code?
Ich denke, da der OP versucht zu vermeiden, mit Teilung, einen Algorithmus mit einer division, die in es wird nicht viel helfen (ich habe nicht downvote). OP nur diese geklärt nachdem Ihre Antwort obwohl
Genau. OP hat nicht erwähnt zunächst, dass die division sollte auch vermieden werden.
Gut, er sagte, sagen, dass die CPU nicht mit einem div-operator. Sicherlich hätte eine Ahnung? 🙂
Er hat nicht gesagt, dass es zunächst - es erschien erst nach Bearbeiten.

InformationsquelleAutor qrdl
1

Wenn Sie wissen, dass b wird eine Potenz von 2 ist, könnten Sie bitweise AND anstelle der modulo-operator. Jedoch, die wikipedia-Seite für modulo scheint zu zeigen, dass C-compiler würde dies feststellen und optimieren aus der modulo jedenfalls.

25 ist nicht eine Potenz von zwei, hth.
Meh, war gerade mit die einzige Optimierung, die ich denken konnte; vielleicht wird es jemand anderes helfen.

InformationsquelleAutor wkf
1

Vielleicht nicht die schnellsten, aber einigermaßen effizient. Ich habe keine Zeit zu testen, aber verwenden Sie ein look-up-Tabelle von (Potenzen von 2) * 25 bis auf die maximale Reichweite/2. Dann machen Sie eine Schleife. E. g. Reichweite bis zu 3199 braucht 7 Iterationen.
```
static int pow[] = {25, 50, 100, 200, 400, 800, 1600};

int mod25(int x)
{    
    int i = sizeof pow /sizeof pow[0];

    while (i--)
    {
        if (x >= pow[i])
            x -= pow[i];    
    }    
    return x;
}
```
Wenn Sie eine sehr große Auswahl, aber niedrige Werte häufiger sind, dann könnte es sich lohnen, usng eine binäre hacken zu finden, der Ausgangspunkt.

InformationsquelleAutor Dipstick
1
```
int mod25(int x) {
  static int divisors[] = {2147483625, 244140625, 9765625, 390625, 15625, 625, 25};
  int i;
  for (i = 0; i < sizeof(divisors)/sizeof(int); i++) {
    int divisor = divisors[i];
    while (x >= divisor) {
      x -= divisor;
    }
  }
  return x;
}
```
Wie es funktioniert: Wir wollen, zu verringern x durch große Vielfache von 25 zu reduzieren, den Wert so schnell wie möglich. Wenn der divisor ist zu groß, wechseln wir auf ein kleineres Vielfaches von 25. Wenn der divisor ist schon runter auf 25, dann sind wir fertig.

Könnten Sie versuchen, das Experimentieren mit verschiedenen Teiler. Sie wollen einfach nur, um sicherzustellen, dass:
- Sie sind absteigend
- Sie sind alle Vielfache von 25
- der Letzte Wert ist 25
Im obigen code verwendete ich die größte signed-32-bit-Vielfaches von 25 plus die Befugnisse von 25, das scheint vernünftig, aber ich muss zugeben, dass ich nicht sicher bin, dass es optimal.

(BTW: wenn dein compiler nicht tun constant folding-was sehr überraschend-dann möchten Sie vielleicht zu ersetzen, die Obere Grenze i mit einem hart codierte Konstante.)

Das ist sehr ähnlich zu meiner ersten Antwort, aber nach ein bisschen nachdenken habe ich beschlossen, dass Sie könnten am Ende looping bis zu 24-mal in die innere Schleife wird für jede äußere Schleife.
Ja, das ist wahr. Ich gepostet, andere Antwort, die genau das macht 27 Iterationen und ausgerollt hat 27 vergleichen und bis zu 27-Abzüge, und funktioniert für alle nicht-negative (signed 32-bit) - Eingänge.

InformationsquelleAutor Laurence Gonsalves
0

Warum können Sie nicht einfach mit dem operator %? Wenn das ist C-code, und die zahlen sind ganz normale "native" int:s, dann sollte der Schnellste Weg, mit Abstand.

das zweite argument ist festgelegt, wie ein bestimmter Algorithmus an Leistung übertreffen können ein generisches, hand-optimierten code könnte besser als der compiler

InformationsquelleAutor unwind
0

Gibt es einen Grund, warum Sie nicht verwenden C die eingebaute modulo-operator?
```
int a = x % 25;
```
Folgenden edit;

Wenn Ihr rpocessor nicht eingebaute modulo-Unterstützung, dann würde ich immer noch den % - operator aus dem einfachen Grund, dass dein compiler wissen, dass der Prozessor in Frage, der nicht über eine native % - Funktion, und wird wahrscheinlich produzieren asm-code optimal zu emulieren.

Sagen wir es so - ich wäre fasziniert, wenn Sie mit oben kommen kann eine algemeine Algorithmus, der übertrifft whatevr der compiler erzeugt aus den eingebauten operator, notwithsatanding bestimmten Fällen (z.B. nur die 2 niedrigsten Ziffern modulo 100 etc)

"wird wahrscheinlich zu produzieren asm-code optimal nachahmen" - ich bezweifle, dass der compiler optimiert code für jeden Konstanten Wert. Ich vermute, dass es nur eine standard-teilen/Modul-Algorithmus (außer Potenzen von zwei) - ich bezweifle, dass das optimal wäre für bekannte Konstanten.
Tatsächlich ... hat es 🙂

InformationsquelleAutor PaulJWilliams
0

Wie etwa:
```
int y = 0, x = (x & 0x7f); 
while (x > 25) { x -= 25; y++; }
```
Update: es ist ziemlich falsch 🙂 Aber die Idee ist da.

InformationsquelleAutor leppie
0

Ich finde es ziemlich merkwürdig, dass der Betrieb x % 25 dauert eine lange Zeit (wenn Sie den built-in % Betreiber ist). Die meisten modernen Prozessoren sollte diese in einer einzigen Instruktion. Ich würde nach anderen Gründen, dass dieser code so lange dauert.

BEARBEITEN:
Hier ist ein Algorithmus, der könnte zumindest geben einige Ideen:

256 = 6 (mod 25)

Dies bedeutet, dass, wenn wir eine Zahl schreiben x als bytes x3 x2 x1 x0 haben wir, dass x = 6^3*x3 + 6^2*x2 + 6*x1 + x0 (mod 25)

Dieser gibt einen Algorithmus für die Reduzierung der Größe der x:
```
int x0 = x & 0xFF, x1 = (x>>8) & 0xFF, x2 = (x>>16) & 0xFF, x3 = (x>>24) & 0xFF;

int y = x4;
y = (y << 2) + (y << 1) + x3;
y = (y << 2) + (y << 1) + x2;
y = (y << 2) + (y << 1) + x1;
y = (y << 2) + (y << 1) + x0;
```
(hier (y << 2) + (y << 1) = 4*y + 2*y = 6*y)

Nach dieser y haben den gleichen Rest wie x mod 25.
Durchlaufen diese 1, 2 oder 3 mal machen y 17, 11, oder 9-bit-Zahl, beziehungsweise. Eine dieser Größen ist zwar klein genug, um eine lookup-Tabelle.

Ich bezweifle ERNSTHAFT, dass dies schneller sein als die eingebaute % Betreiber, obwohl.

Auf viele kleinere Plattformen, die division (und durch Erweiterung, modulo) ist sehr langsam im Vergleich zu anderen Operationen. Denken Sie daran, Ihr Ziel-Plattform könnte ein toaster! Dies galt für eine lange Zeit, auch für desktop - Plattformen, IIRC 26 Zyklen für ein DIV-486-oder frühen Pentiums, im Vergleich zum 1 Zyklus für addition und ein paar für die Multiplikation.
Ja, aber es war nicht klar von der ursprünglichen Frage, ob das problem war wirklich ein Mangel der DIV-Anweisung oder nicht. Und ich denke immer noch, dass wenn der code zu langsam ist, der erste Gedanke sollte nicht sein, ersetzen Sie den C-Compiler eingebauten arithmetischen Operatoren.
div-Anweisung ist oft (auch auf x86) umgesetzt in Mikrocode, und so langsam.

InformationsquelleAutor CAdaker
0

Wenn Sie gehalten, Ihre zahlen in BCD oder ein byte-array von Ziffern, das wäre ziemlich einfach. Leider habe ich keine Idee, was Sie tun, in Ihr Programm mit diesen zahlen. Manchmal lohnt sich es zu sehen, wie Sie repräsentieren Ihre Daten nicht als nur bang entfernt auf algorithmen.

InformationsquelleAutor Nosredna

Heres eine Idee

static int table0[256];
static int table1[256];
static int table2[256];
static int table3[256];

//ran just once to initialize the tables
void initialMod25Tables() {
    for (int i = 0; i < 256; ++i) {
        table0[i] = i % 25;
    }
    for (int i = 0; i < 256; ++i) {
        table1[i] = (i << 8) % 25;
    }
    for (int i = 0; i < 256; ++i) {
        table2[i] = (i << 16) % 25;
    }
    for (int i = 0; i < 256; ++i) {
        table3[i] = (i << 24) % 25;
    }
}

int mod25(int x) {
    int y = table0[x & 0xFF];
    x >>= 8;
    y += table1[x & 0xFF];
    x >>= 8;
    y += table2[x & 0xFF];
    x >>= 8;
    y += table3[x & 0xFF];
    y = table0[y];
    return y;
}

InformationsquelleAutor clinux

-1

Wenn Sie nur unter Berücksichtigung der Zahl 25, die Sie verwenden können, die Tatsache, dass 25 divies eine Ganzzahl, wenn, und nur wenn die beiden letzten Ziffern des ganzzahligen sind 00, 25, 50 oder 75. So bekommen die modulo-Sie betrachten die letzten beiden Ziffern und subtrahieren Sie dann die nächstgelegene 00, 25, 50 oder 75.

Und Sie würde die letzten beiden Ziffern wie? Modulo-100? 🙂
Zahlen in binärer form, so ist es nicht leicht, die Arbeit mit dezimal-Ziffern. Und wie finden Sie Ihre nächsten richtigen Teiler? Es ist offensichtlich für Menschen aber es gibt keine solche CPU-Instruktion.
Vielleicht wird sein Prozessor hat eine BCD-Modus. 🙂
Es spielt natürlich vom Kontext abhängen. Zum Beispiel können die Daten zunächst aus einer text-Datei. Obwohl es nun klar von seinem Bearbeiten, das ist wahrscheinlich nicht das, was er suchte, es ist ein Weg, nichtsdestotrotz.

InformationsquelleAutor Bessi

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.