Sortieren array von ganzen zahlen lexikographisch C++

Ich möchte sozusagen ein großes Integer-array (sagen wir 1 Mio Elemente) lexikographisch.

Beispiel:

input [] = { 100, 21 , 22 , 99 , 1  , 927 }
sorted[] = { 1  , 100, 21 , 22 , 927, 99  }

Ich habe es mit der einfachsten Methode:

wandeln Sie alle zahlen in strings (sehr teuer, weil es dauern wird, riesige Speicher)
verwenden std:sort mit strcmp als Vergleich-Funktion
zurück konvertieren der strings in Ganzzahlen

Gibt es eine bessere Methode als das?

Wie machst du deine Umbauten?
Wie groß können die zahlen sein?

InformationsquelleAutor Aseem Goyal | 2013-10-25

arrays c++lexicographic sorting

16

Verwenden std::sort() mit einem passenden Vergleich-Funktion. Dies reduziert die Anforderungen an den Arbeitsspeicher.

Die Vergleich-Funktion verwenden können n % 10, n /10 % 10, n /100 % 10 etc. um auf die einzelnen Ziffern (für positive zahlen; negative Ganzzahlen arbeiten ein bisschen anders).
- du meinst anstelle der Umwandlung zu strings n%10 etc.. Methode ?
- Ja. Und statt, die der Vorbereitung der array vorher (z.B. Konvertierung nach string), dabei wird die Berechnung auf die Nachfrage in der Vergleich-Funktion.
InformationsquelleAutor Oswald

Zu leisten, die benutzerdefinierte Sortierreihenfolge, die Sie bieten kann, einen Komparator zu std::sort. In diesem Fall, es wird etwas komplexer, mit Logarithmen zu inspizieren einzelnen Ziffern der Zahl in der Basis 10.

Hier ist ein Beispiel — Kommentare inline beschreiben, was Los ist.

#include <iostream>
#include <algorithm>
#include <cmath>
#include <cassert>

int main() {
    int input[] { 100, 21, 22, 99, 1, 927, -50, -24, -160 };

    /**
     * Sorts the array lexicographically.
     * 
     * The trick is that we have to compare digits left-to-right
     * (considering typical Latin decimal notation) and that each of
     * two numbers to compare may have a different number of digits.
     * 
     * This is very efficient in storage space, but inefficient in
     * execution time; an approach that pre-visits each element and
     * stores a translated representation will at least double your
     * storage requirements (possibly a problem with large inputs)
     * but require only a single translation of each element.
     */
    std::sort(
        std::begin(input),
        std::end(input),
        [](int lhs, int rhs) -> bool {
            //Returns true if lhs < rhs
            //Returns false otherwise
            const auto BASE      = 10;
            const bool LHS_FIRST = true;
            const bool RHS_FIRST = false;
            const bool EQUAL     = false;


            //There's no point in doing anything at all
            //if both inputs are the same; strict-weak
            //ordering requires that we return `false`
            //in this case.
            if (lhs == rhs) {
                return EQUAL;
            }

            //Compensate for sign
            if (lhs < 0 && rhs < 0) {
                //When both are negative, sign on its own yields
                //no clear ordering between the two arguments.
                //
                //Remove the sign and continue as for positive
                //numbers.
                lhs *= -1;
                rhs *= -1;
            }
            else if (lhs < 0) {
                //When the LHS is negative but the RHS is not,
                //consider the LHS "first" always as we wish to
                //prioritise the leading '-'.
                return LHS_FIRST;
            }
            else if (rhs < 0) {
                //When the RHS is negative but the LHS is not,
                //consider the RHS "first" always as we wish to
                //prioritise the leading '-'.
                return RHS_FIRST;
            }

            //Counting the number of digits in both the LHS and RHS
            //arguments is *almost* trivial.
            const auto lhs_digits = (
                lhs == 0
                ? 1
                : std::ceil(std::log(lhs+1)/std::log(BASE))
            );

            const auto rhs_digits = (
                rhs == 0
                ? 1
                : std::ceil(std::log(rhs+1)/std::log(BASE))
            );

            //Now we loop through the positions, left-to-right,
            //calculating the digit at these positions for each
            //input, and comparing them numerically. The
            //lexicographic nature of the sorting comes from the
            //fact that we are doing this per-digit comparison
            //rather than considering the input value as a whole.
            const auto max_pos = std::max(lhs_digits, rhs_digits);
            for (auto pos = 0; pos < max_pos; pos++) {
                if (lhs_digits - pos == 0) {
                    //Ran out of digits on the LHS;
                    //prioritise the shorter input
                    return LHS_FIRST;
                }
                else if (rhs_digits - pos == 0) {
                    //Ran out of digits on the RHS;
                    //prioritise the shorter input
                    return RHS_FIRST;
                }
                else {
                    const auto lhs_x = (lhs / static_cast<decltype(BASE)>(std::pow(BASE, lhs_digits - 1 - pos))) % BASE;
                    const auto rhs_x = (rhs / static_cast<decltype(BASE)>(std::pow(BASE, rhs_digits - 1 - pos))) % BASE;

                    if (lhs_x < rhs_x)
                        return LHS_FIRST;
                    else if (rhs_x < lhs_x)
                        return RHS_FIRST;
                }
            }

            //If we reached the end and everything still
            //matches up, then something probably went wrong
            //as I'd have expected to catch this in the tests
            //for equality.
            assert("Unknown case encountered");
        }
    );

    std::cout << '{';
    for (auto x : input)
        std::cout << x << ", ";
    std::cout << '}';

    //Output: { -160, -24, -50, 1, 100, 21, 22, 927, 99, }
}

Demo

Es gibt schnellere Wege, um berechnen Sie die Anzahl der Ziffern in einer Zahl, aber der oben wird Ihnen den Einstieg.

Es sollte nicht erforderlich sein, berechnen die Ziffern. Für positive ganze zahlen, wenn man den Logarithmus der gewünschten base, die mit dem unteren Mantisse (die Nachkommastellen des Logarithmus) ist früher in lexikographischer Reihenfolge. Wenn die mantissas gleich, der mit der unteren integer-Teil ist, früher. Das problem ist immer der Logarithmus; Sie müssen erkennen, wenn der wahre mantissas gleich, obwohl die floating-point-Mantisse ist leicht ausschalten. Dies kann geändert werden, um einen test, ob der Unterschied liegt innerhalb des Fehlers von der Bibliothek Logarithmus routine, bis zu dem Punkt, wo die ganzen zahlen...
...so groß, dass der Unterschied in der mantissas von zwei aufeinander folgenden ganzen zahlen ist so groß wie der Fehler in der library-routine. (Wer wuchs mit Logarithmus-Tabellen oder dia Regeln würde dies wissen.) Beachten Sie, dass der mögliche Fehler in der Mantisse hat, zu ermöglichen, Fehler gezwungen durch die Größe des Logarithmus, nicht nur die inhärente Fehler in der library-routine.
Danke. Ja, für diese eher künstlich demonstration, wählte ich eine zusätzliche Integrale DIV, POW und MOD über die Einführung von floating-point-nastinesses.
Aber du hast floating-point-Probleme vermeidet. std::ceil(std::log(lhs+1)/std::log(BASE)) können aus der durch eine.

InformationsquelleAutor Lightness Races with Monica

6

Hier ist ein weiterer Algorithmus, der einige der Berechnung vor der Sortierung. Es scheint zu sein, ziemlich schnell, trotz der zusätzlichen kopieren (siehe Vergleiche).

Hinweis:
- es unterstützt nur positive ganze zahlen
- in unterstützt nur die ganzen zahlen <= std::numeric_limits<int>::max()/10
_{N. B. optimieren Sie count_digits und my_pow10; für Beispiel, siehe Drei Tipps zur Optimierung für C++ von Andrei Alexandrescu und Irgendeiner Weise schneller ist als pow() zur Berechnung einer ganzzahligen Potenz von 10 in C++?}

Helfer:
```
#include <random>
#include <vector>
#include <utility>
#include <cmath>
#include <iostream>
#include <algorithm>
#include <limits>
#include <iterator>

//non-optimized version
int count_digits(int p) //returns `0` for `p == 0`
{
    int res = 0;
    for(; p != 0; ++res)
    {
        p /= 10;
    }
    return res;
}

//non-optimized version
int my_pow10(unsigned exp)
{
    int res = 1;
    for(; exp != 0; --exp)
    {
        res *= 10;
    }
    return res;
}
```
Algorithmus (Hinweis - nicht in-place):
```
//helper to provide integers with the same number of digits
template<class T, class U>
std::pair<T, T> lexicographic_pair_helper(T const p, U const maxDigits)
{
    auto const digits = count_digits(p);
    //append zeros so that `l` has `maxDigits` digits
    auto const l = static_cast<T>( p  * my_pow10(maxDigits-digits) );
    return {l, p};
}

template<class RaIt>
using pair_vec
    = std::vector<std::pair<typename std::iterator_traits<RaIt>::value_type,
                            typename std::iterator_traits<RaIt>::value_type>>;

template<class RaIt>
pair_vec<RaIt> lexicographic_sort(RaIt p_beg, RaIt p_end)
{
    if(p_beg == p_end) return {};

    auto max = *std::max_element(p_beg, p_end);
    auto maxDigits = count_digits(max);

    pair_vec<RaIt> result;
    result.reserve( std::distance(p_beg, p_end) );

    for(auto i = p_beg; i != p_end; ++i)
        result.push_back( lexicographic_pair_helper(*i, maxDigits) );

    using value_type = typename pair_vec<RaIt>::value_type;

    std::sort(begin(result), end(result),
              [](value_type const& l, value_type const& r)
              {
                  if(l.first < r.first) return true;
                  if(l.first > r.first) return false;
                  return l.second < r.second; }
             );

    return result;
}
```
Beispiel:
```
int main()
{
    std::vector<int> input = { 100, 21 , 22 , 99 , 1  , 927 };
    //generate some numbers
    /*{
        constexpr int number_of_elements = 1E6;
        std::random_device rd;
        std::mt19937 gen( rd() );
        std::uniform_int_distribution<>
            dist(0, std::numeric_limits<int>::max()/10);
        for(int i = 0; i < number_of_elements; ++i)
            input.push_back( dist(gen) );
    }*/

    std::cout << "unsorted: ";
    for(auto const& e : input) std::cout << e << ", ";
    std::cout << "\n\n";


    auto sorted = lexicographic_sort(begin(input), end(input));

    std::cout << "sorted: ";
    for(auto const& e : sorted) std::cout << e.second << ", ";
    std::cout << "\n\n";
}
```
- #ifdef LIGHTNESS 😀 ich mag Ihr Ansatz, caching, solange Sie sind sich bewusst, Ihre storage-Anforderungen. OP sagte, gab es reichlich input. Warum vermeiden Sie const im lexicographic_pair_helper?
- Ja, ich versuchte mit 1 million Elementen zu -O2, aber in meiner VM.. besser es selbst zu versuchen. (Ehrlich gesagt, ich bin mir auch nicht sicher, ob ich Das Richtige mit meinem einfachen Vergleich.)
- Ich bin immer noch versuchen zu verstehen, Ihre Lösung wegen der fehlenden Kommentare (du bist gefeuert); tun Sie im wesentlichen null-pad jeden Eingang?
- Ich multipliziere jede ganze Zahl durch 10, bis Sie alle die gleiche Anzahl von Ziffern, dann verwenden Sie das Ergebnis für den Vergleich. (Ja, null-pad.)
- Dir ist viel schneller, offensichtlich Vorrang Geschwindigkeit über den Raum (insbesondere die Umwandlung jedes element nur einmal), während mir tut das Gegenteil. Hinweis: ich hatte zu entfernen, Ausgabe und drop die Anzahl der Iterationen zu 1e5 es zu laufen, bevor Coliru timed-out 😉 Beide laufen in unter einer Sekunde über 1e4 Eingänge, aber meine Köpfe bis zu 2,6 s für 1e5 Eingänge in der Erwägung, dass deins ist immer noch in 0,04 s; dies ist, natürlich, Ihre Arbeit-loop-lineare Komplexität in Erscheinung. +1 von mir für counter-Lösung!
- Dieser hat ein problem, wenn eine der Nummern in der Nähe die maximale integer-Wert. Zum Beispiel, wenn man 1.000.000.000 3 mit 32-bit -int, 3 multipliziert werden durch 1.000.000.000, und dass überläufe. Auch sollte berücksichtigt werden, dass ein log10 zurückkehren könnte eine etwas ungenaue Ergebnis.
- Ja, es kann auch nicht umgehen mit negativen zahlen. Hätte man das in die Antwort, jetzt tun soll.
- Sind Sie sicher, dass das funktioniert? Haben Sie im Vergleich die sortierten Vektoren? Ich überprüfte den Ausgang Ihrer Art gegen LRO ist und Sie scheinen nicht zu passen...
- Ich habe die OP ' s test-Fall, aber wie gesagt, ich bin mir nicht ganz sicher. Können Sie uns einen Testfall, wo unterscheiden Sie sich? Ich werde zu ersetzen, die log10 und pow mittlerweile.
- Ich weiß nicht der Fall, aber wenn man den code so ändern, und anstatt ifdefing aus LRO-code vs yours, verwenden Sie zwei blocks und eine Kopie der input-Daten für jeden, und vergleichen Sie anschließend die sortierten Vektoren sehe ich immer zu, dass Sie nicht übereinstimmen.
- Bitte versuchen Sie es mit festen code, den ich ersetzt log10 und pow wie ich sagte und fest ein copy-und-paste-Fehler (die Anpassung der Verteilung fehlte im Vergleich Beispiel). Nun bekomme ich genaue übereinstimmungen zwischen Leichtigkeit' version und mir.
InformationsquelleAutor dyp
4

Ich glaube, die folgenden Werke als eine Art Vergleich-Funktion für positive ganze zahlen sind, sofern der integer-Typ verwendet wird, ist wesentlich schmaler als die double Typ (z.B. 32-bit - int - und 64-bit -double) und die log10 routine verwendet, gibt genau die richtigen Ergebnisse für die genauen Potenzen von 10 (was eine gute Implementierung hat):
```
static const double limit = .5 * (log(INT_MAX) - log(INT_MAX-1));

double lx = log10(x);
double ly = log10(y);
double fx = lx - floor(lx);  //Get the mantissa of lx.
double fy = ly - floor(ly);  //Get the mantissa of ly.
return fabs(fx - fy) < limit ? lx < ly : fx < fy;
```
Es funktioniert durch den Vergleich der mantissas der Logarithmen. Die mantissas die Nachkommastellen des Logarithmus, und Sie zeigen den Wert der signifikanten stellen einer Zahl ohne den Umfang (z.B. die Logarithmen von 31, 3.1 und 310 haben genau die gleiche Mantisse).

Zweck der fabs(fx - fy) < limit ist es, für Fehler bei der Einnahme der Logarithmus, die auftreten, weil beide Implementierungen log10 sind unvollkommen, und da die floating-point-format Kräfte einige Fehler. (Der integer-Teile von den Logarithmen von 31 und 310 verwenden eine unterschiedliche Anzahl von bits, so gibt es eine unterschiedliche Anzahl von bits für die Mantisse, so dass Sie am Ende abgerundet, um leicht unterschiedliche Werte.) Solange der integer-Typ ist wesentlich schmaler als die double Typ, der berechnet limit wird viel größer sein, als die Fehler in log10. So, der test fabs(fx - fy) < limit im wesentlichen sagt uns, ob zwei berechnete mantissas wäre gleich, wenn exakt berechnet.

Wenn die mantissas unterscheiden, zeigen Sie die lexikographische Ordnung, also kehren wir fx < fy. Wenn Sie gleich sind, dann der ganzzahlige Anteil des Logarithmus sagt uns das Bestellformular ein, damit wir zurück lx < ly.

Es ist einfach um zu testen, ob log10 korrekte Ergebnisse zurückgegeben, für jede Leistung von zehn, da es so wenige von Ihnen gibt. Wenn nicht, Anpassungen können leicht vorgenommen werden: Einfügen if (1-fx < limit) fx = 0; if (1-fu < limit) fy = 0;. Dies ermöglicht, wenn log10 gibt so etwas wie 4.99999... wenn es sollte zurückgegeben haben, 5.

Diese Methode hat den Vorteil, nicht mit Schleifen oder division (die ist zeitaufwendig, die auf vielen Prozessoren).
- +1: 0,4 s für 1e5-Eingänge; nicht schlecht! Und ich bin nicht besessen über Geschwindigkeit, nur darauf hingewiesen. Wenn man alles berücksichtigt, sieht, wie das Antwort an mich.
InformationsquelleAutor Eric Postpischil
3

Die Aufgabe klingt wie eine Natürliche Passform für ein MSD-Variante von Radix-Sort mit Polsterung ( http://en.wikipedia.org/wiki/Radix_sort ).

Hängt davon ab, wie viel code, den Sie wollen, um sich werfen. Die einfachen Codes wie die anderen zu zeigen ist O(log n) Komplexität, während eine vollständig optimierte radix-sort wäre O(kn).

InformationsquelleAutor Tino Didriksen

Eine kompakte Lösung, wenn alle Ihre zahlen sind von nicht negativer und Sie sind klein genug, so dass die Multiplikation um 10 nicht zu einem überlauf führen:

template<class T> bool lex_less(T a, T b) {
  unsigned la = 1, lb = 1;
  for (T t = a; t > 9; t /= 10) ++la;
  for (T t = b; t > 9; t /= 10) ++lb;
  const bool ll = la < lb;
  while (la > lb) { b *= 10; ++lb; }
  while (lb > la) { a *= 10; ++la; }
  return a == b ? ll : a < b;
}

Führen Sie es wie folgt:

#include <iostream>
#include <algorithm>
int main(int, char **) {
  unsigned short input[] = { 100, 21 , 22 , 99 , 1  , 927 };
  unsigned input_size = sizeof(input) / sizeof(input[0]);
  std::sort(input, input + input_size, lex_less<unsigned short>);
  for (unsigned i = 0; i < input_size; ++i) {
    std::cout << ' ' << input[i];
  }
  std::cout << std::endl;
  return 0;
}

InformationsquelleAutor pts

1

Könnten Sie versuchen, mit dem % - operator, um Ihnen den Zugang zu jeder einzelnen Ziffer eg 121 % 100 geben Sie die erste Ziffer und überprüfen Sie, dass Weg, aber du musst einen Weg finden, wie etwa die Tatsache, dass Sie verschiedene Größen haben.

So finden Sie den maximalen Wert in der Reihe. Ich weiß nicht, ob es eine Funktion dafür eingebaut, die Sie könnten versuchen.
```
int Max (int* pdata,int size)
 {
int temp_max =0 ;

for (int i =0 ; i < size ; i++)
 {
    if (*(pdata+i) > temp_max)
    {
        temp_max = *(pdata+i);

    }
 }
 return temp_max;
 }
```
Diese Funktion gibt die Anzahl der Ziffern in der Zahl
```
 int Digit_checker(int n)
{
 int num_digits = 1;

while (true)
{
    if ((n % 10) == n)
        return num_digits;
    num_digits++;
    n = n/10;
}
return num_digits;
}
```
Lassen Sie Anzahl der Ziffern im max gleich n ist.
Sobald Sie diese öffnen einer for-Schleife im format
for (int i = 1; i < n ; i++)

dann können Sie gehen Sie durch Ihre und mit "data[i] % (10^(n-i))", um Zugang zu der ersten Ziffer, dann
Sortieren, und dann auf die nächste iteration erhalten Sie Zugriff auf die zweite Stelle. Ich weiß nicht, wie Sie Sie zu Sortieren, obwohl.

Es wird nicht funktionieren, für negative zahlen, und Sie haben zu umgehen, Daten[i] % (10^(n-i)) und kehrt sich für zahlen mit weniger stellen als max
- 121 / 100 und 121 - 121 % 100 wird den Zugang zu der ersten Ziffer.
- sorry mein Fehler.
- nur für positive ganze zahlen
- Verdammt, ich fiel für diese Falle, wie eine million mal. Ich habe eigentlich gehofft, ich wäre immun mittlerweile.
InformationsquelleAutor Conor Linehan
1

Überlastung der < operator zum vergleichen von zwei ganzen zahlen lexikographisch. Für jede ganze Zahl, finden die kleinste 10^k, die nicht weniger als die angegebene Ganzzahl. Vergleichen Sie die Ziffern nacheinander.
```
class CmpIntLex {
int up_10pow(int n) {
  int ans = 1;
  while (ans < n) ans *= 10;
  return ans;
}
public: 
bool operator ()(int v1, int v2) {
   int ceil1 = up_10pow(v1), ceil2 = up_10pow(v2);
   while ( ceil1 != 0 && ceil2 != 0) {
      if (v1 / ceil1  < v2 / ceil2) return true;
      else if (v1 / ceil1 > v2 / ceil2) return false;
      ceil1 /= 10; 
      ceil2 /= 10;
   }
   if (v1 < v2) return true;
   return false;
}
int main() {
vector<int> vi = {12,45,12134,85};
sort(vi.begin(), vi.end(), CmpIntLex());
}
```
- Wenn Sie Vorhaben, eine Funktion einzuführen bool(int, int) Durchführung lexikographischen Vergleich in global-oder Datei-Bereich, würde ich vorschlagen, eine genauere Angabe als less. 😛
- Dies ist eine gute, knappe Lösung, obwohl ich das Gefühl es könnte einige Kommentare und einige const; nicht zu erwähnen, einige bessere Variablennamen.
- Ich kann nicht Ihnen zu arbeiten auf dem gleichen Datensatz, der LRO-Lösung arbeitet... (im Grunde habe ich kopiert den code von der DyP-Lösung und eher als ifdefing aus, jede Lösung erhält eine Kopie des gleichen random-input-Vektor), und Ihre Lösung nur scheint nicht zu funktionieren (wie in, es scheint zu Spinnen...)
- einen bug zu beheben und aktualisiert. Auch er behandelt nur den Fall, dass alle ganzen zahlen sind positiv.
- ja tut mir Leid:)
- Okay, klappt jetzt auch (mit richtigen Ergebnissen); - Lösung aktiviert, die in meinem Messung.
InformationsquelleAutor Zhiwen Fang

Während einige andere Antworten hier (Leichtigkeit ist, notbad s) zeigen sich schon Recht guten code, ich glaube, ich kann hinzufügen, eine Lösung, die möglicherweise noch performant (da es erfordert weder die division noch die macht in jeder Schleife; Sie erfordert aber die floating-point-Arithmetik, die wiederum vielleicht machen Sie es langsam, und möglicherweise ungenau für große zahlen):

#include <algorithm>
#include <iostream>
#include <assert.h>

//method taken from http://stackoverflow.com/a/1489873/671366
template <class T>
int numDigits(T number)
{
    int digits = 0;
    if (number < 0) digits = 1; //remove this line if '-' counts as a digit
    while (number) {
        number /= 10;
        digits++;
    }
    return digits;
}

bool lexiSmaller(int i1, int i2)
{
    int digits1 = numDigits(i1);
    int digits2 = numDigits(i2);

    double val1 = i1/pow(10.0, digits1-1);
    double val2 = i2/pow(10.0, digits2-1);

    while (digits1 > 0 && digits2 > 0 && (int)val1 == (int)val2)
    {
        digits1--;
        digits2--;
        val1 = (val1 - (int)val1)*10;
        val2 = (val2 - (int)val2)*10;
    }
    if (digits1 > 0 && digits2 > 0)
    {
        return (int)val1 < (int)val2;
    }
    return (digits2 > 0);
}


int main(int argc, char* argv[])
{
    //just testing whether the comparison function works as expected:
    assert (lexiSmaller(1, 100));
    assert (!lexiSmaller(100, 1));
    assert (lexiSmaller(100, 22));
    assert (!lexiSmaller(22, 100));
    assert (lexiSmaller(927, 99));
    assert (!lexiSmaller(99, 927));
    assert (lexiSmaller(1, 927));
    assert (!lexiSmaller(927, 1));
    assert (lexiSmaller(21, 22));
    assert (!lexiSmaller(22, 21));
    assert (lexiSmaller(22, 99));
    assert (!lexiSmaller(99, 22));

    //use the comparison function for the actual sorting:
    int input[] = { 100 , 21 , 22 , 99 , 1 ,927 };
    std::sort(&input[0], &input[5], lexiSmaller);
    std::cout << "sorted: ";
    for (int i=0; i<6; ++i)
    {
        std::cout << input[i];
        if (i<5)
        {
            std::cout << ", ";
        }
    }
    std::cout << std::endl;
    return 0;
}

Obwohl ich muss zugeben, dass ich noch nicht getestet, die Leistung noch nicht.

Ja, ich möchte vermeiden, die floating-point. Gute Arbeit auf den inline-testcases, obwohl.

InformationsquelleAutor codeling

Ist hier der dumme Lösung, die keine floating-point-tricks. Es ist so ziemlich das gleiche wie der string-Vergleich, aber nicht ein string pro sagen, nicht auch mit negativen zahlen, das zu tun, fügen Sie eine Sektion an der Spitze...

bool comp(int l, int r)
{
  int lv[10] = {}; //probably possible to get this from numeric_limits
  int rv[10] = {};

  int lc = 10; //ditto
  int rc = 10;
  while (l || r)
  {
    if (l)
    {
      auto t = l / 10;
      lv[--lc] = l - (t * 10);
      l = t;
    }
    if (r)
    {
      auto t = r / 10;
      rv[--rc] = r - (t * 10);
      r = t;
    }
  }
  while (lc < 10 && rc < 10)
  {
    if (lv[lc] == rv[rc])
    {
      lc++;
      rc++;
    }
    else
      return lv[lc] < rv[rc];
  }
  return lc > rc;
}

Es ist schnell, und ich bin sicher, es ist möglich es schneller zu machen, immer noch, aber es funktioniert und es ist dumm genug, um zu verstehen...

EDIT: ich aß dump viel code, aber hier ist ein Vergleich aller Lösungen so weit..

#include <iostream>
#include <vector>
#include <algorithm>
#include <iterator>
#include <random>
#include <vector>
#include <utility>
#include <cmath>
#include <cassert>
#include <chrono>

std::pair<int, int> lexicographic_pair_helper(int p, int maxDigits)
{
  int digits = std::log10(p);
  int l = p*std::pow(10, maxDigits-digits);
  return {l, p};
}

bool l_comp(int l, int r)
{
  int lv[10] = {}; //probably possible to get this from numeric_limits
  int rv[10] = {};

  int lc = 10; //ditto
  int rc = 10;
  while (l || r)
  {
    if (l)
    {
      auto t = l / 10;
      lv[--lc] = l - (t * 10);
      l = t;
    }
    if (r)
    {
      auto t = r / 10;
      rv[--rc] = r - (t * 10);
      r = t;
    }
  }
  while (lc < 10 && rc < 10)
  {
    if (lv[lc] == rv[rc])
    {
      lc++;
      rc++;
    }
    else
      return lv[lc] < rv[rc];
  }
  return lc > rc;
}

int up_10pow(int n) {
  int ans = 1;
  while (ans < n) ans *= 10;
  return ans;
}
bool l_comp2(int v1, int v2) {
  int n1 = up_10pow(v1), n2 = up_10pow(v2);
  while ( v1 != 0 && v2 != 0) {
    if (v1 / n1  < v2 / n2) return true;
    else if (v1 / n1 > v2 / n2) return false;
    v1 /= 10;
    v2 /= 10;
    n1 /= 10;
    n2 /= 10;
  }
  if (v1 == 0 && v2 != 0) return true;
  return false;
}

int main()
{
  std::vector<int> numbers;
  {
    constexpr int number_of_elements = 1E6;
    std::random_device rd;
    std::mt19937 gen( rd() );
    std::uniform_int_distribution<> dist;
    for(int i = 0; i < number_of_elements; ++i) numbers.push_back( dist(gen) );
  }

  std::vector<int> lo(numbers);
  std::vector<int> dyp(numbers);
  std::vector<int> nim(numbers);
  std::vector<int> nb(numbers);

  std::cout << "starting..." << std::endl;

  {

    auto start = std::chrono::high_resolution_clock::now();
    /**
    * Sorts the array lexicographically.
    *
    * The trick is that we have to compare digits left-to-right
    * (considering typical Latin decimal notation) and that each of
    * two numbers to compare may have a different number of digits.
    *
    * This probably isn't very efficient, so I wouldn't do it on
    * "millions" of numbers. But, it works...
    */
    std::sort(
    std::begin(lo),
              std::end(lo),
              [](int lhs, int rhs) -> bool {
                //Returns true if lhs < rhs
                //Returns false otherwise
                const auto BASE      = 10;
                const bool LHS_FIRST = true;
                const bool RHS_FIRST = false;
                const bool EQUAL     = false;


                //There's no point in doing anything at all
                //if both inputs are the same; strict-weak
                //ordering requires that we return `false`
                //in this case.
                if (lhs == rhs) {
                  return EQUAL;
                }

                //Compensate for sign
                if (lhs < 0 && rhs < 0) {
                  //When both are negative, sign on its own yields
                  //no clear ordering between the two arguments.
                  //
                  //Remove the sign and continue as for positive
                  //numbers.
                  lhs *= -1;
                  rhs *= -1;
                }
                else if (lhs < 0) {
                  //When the LHS is negative but the RHS is not,
              //consider the LHS "first" always as we wish to
              //prioritise the leading '-'.
              return LHS_FIRST;
                }
                else if (rhs < 0) {
                  //When the RHS is negative but the LHS is not,
              //consider the RHS "first" always as we wish to
              //prioritise the leading '-'.
              return RHS_FIRST;
                }

                //Counting the number of digits in both the LHS and RHS
                //arguments is *almost* trivial.
                const auto lhs_digits = (
                lhs == 0
                ? 1
                : std::ceil(std::log(lhs+1)/std::log(BASE))
                );

                const auto rhs_digits = (
                rhs == 0
                ? 1
                : std::ceil(std::log(rhs+1)/std::log(BASE))
                );

                //Now we loop through the positions, left-to-right,
              //calculating the digit at these positions for each
              //input, and comparing them numerically. The
              //lexicographic nature of the sorting comes from the
              //fact that we are doing this per-digit comparison
              //rather than considering the input value as a whole.
              const auto max_pos = std::max(lhs_digits, rhs_digits);
              for (auto pos = 0; pos < max_pos; pos++) {
                if (lhs_digits - pos == 0) {
                  //Ran out of digits on the LHS;
                  //prioritise the shorter input
                  return LHS_FIRST;
                }
                else if (rhs_digits - pos == 0) {
                  //Ran out of digits on the RHS;
                  //prioritise the shorter input
                  return RHS_FIRST;
                }
                else {
                  const auto lhs_x = (lhs / static_cast<decltype(BASE)>(std::pow(BASE, lhs_digits - 1 - pos))) % BASE;
                  const auto rhs_x = (rhs / static_cast<decltype(BASE)>(std::pow(BASE, rhs_digits - 1 - pos))) % BASE;

                  if (lhs_x < rhs_x)
                    return LHS_FIRST;
                  else if (rhs_x < lhs_x)
                    return RHS_FIRST;
                }
              }

              //If we reached the end and everything still
              //matches up, then something probably went wrong
              //as I'd have expected to catch this in the tests
              //for equality.
              assert("Unknown case encountered");
              }
              );

    auto end = std::chrono::high_resolution_clock::now();
    auto elapsed = end - start;
    std::cout << "Lightness: " << elapsed.count() << '\n';
  }

  {
    auto start = std::chrono::high_resolution_clock::now();

    auto max = *std::max_element(begin(dyp), end(dyp));
    int maxDigits = std::log10(max);

    std::vector<std::pair<int,int>> temp;
    temp.reserve(dyp.size());
    for(auto const& e : dyp) temp.push_back( lexicographic_pair_helper(e, maxDigits) );

    std::sort(begin(temp), end(temp), [](std::pair<int, int> const& l, std::pair<int, int> const& r)
    { if(l.first < r.first) return true; if(l.first > r.first) return false; return l.second < r.second; });

    auto end = std::chrono::high_resolution_clock::now();
    auto elapsed = end - start;
    std::cout << "Dyp: " << elapsed.count() << '\n';
  }

  {
    auto start = std::chrono::high_resolution_clock::now();
    std::sort (nim.begin(), nim.end(), l_comp);
    auto end = std::chrono::high_resolution_clock::now();
    auto elapsed = end - start;
    std::cout << "Nim: " << elapsed.count() << '\n';
  }

//  {
//    auto start = std::chrono::high_resolution_clock::now();
//    std::sort (nb.begin(), nb.end(), l_comp2);
//    auto end = std::chrono::high_resolution_clock::now();
//    auto elapsed = end - start;
//    std::cout << "notbad: " << elapsed.count() << '\n';
//  }

  std::cout << (nim == lo) << std::endl;
  std::cout << (nim == dyp) << std::endl;
  std::cout << (lo == dyp) << std::endl;
//  std::cout << (lo == nb) << std::endl;
}

"wohl möglich, bekommen diese von numeric_limits" std::numeric_limits<int>::digits10 😉

InformationsquelleAutor Nim

Basierend auf @Oswald ' s Antwort, unten ist etwas code, der das gleiche tut.

#include <iostream>
#include <vector>
#include <algorithm> 
using namespace std;

bool compare(string a, string b){
    //Check each digit
    int i = 0, j = 0;
    while(i < a.size() && j < b.size()){
        //If different digits
        if(a[i] - '0' != b[j] - '0')
            return (a[i] - '0' < b[j] - '0');
        i++, j++;
    }
    //Different sizes
    return (a.size() < b.size());
}

int main(){
    vector<string> array = {"1","2","3","4","5","6","7","8","9","10","11","12"};
    sort(array.begin(), array.end(), compare);

    for(auto value : array)
        cout << value << " ";
    return 0;
}

Eingang: 1 2 3 4 5 6 7 8 9 10 11 12

Ausgabe: 1 10 11 12 2 3 4 5 6 7 8 9

InformationsquelleAutor Testing123

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.