Generierung einer Eindeutigen ID in c++

Was ist der beste Weg zur Erzeugung einer Eindeutigen ID, die aus zwei (oder mehr) short ints in C++? Ich versuche, eindeutig zu identifizieren vertices in einem Diagramm. Die Eckpunkte enthalten zwei bis vier short ints als Daten, und im Idealfall die ID wäre so eine Art hash von Ihnen. Lieber Portabilität und Einzigartigkeit über Geschwindigkeit oder Leichtigkeit.

Gibt es eine Menge gute Antworten hier, ich werde versuchen Sie alle heute Abend zu sehen, was passt mein problem am besten. Ein paar mehr Worte zu dem, was ich Tue.

Der graph ist eine Sammlung von Proben aus einer audio-Datei. Ich verwende den Graphen einer Markov-Kette erzeugen Sie einen neuen audio-Datei aus der alten Datei. Da jeder Knoten speichert ein paar Muster und verweist auf ein anderes Beispiel, und die samples sind alle short ints, schien es natürlich, zu generieren Sie eine ID aus den Daten. Die Kombination von Ihnen in einem langen, langen klingt gut, aber vielleicht etwas so einfaches wie nur ein 0 1 2 3 generateID ist alles, was ich brauche. nicht sicher, wie viel Raum ist notwendig, um zu garantieren Einzigartigkeit, wenn jeder Knoten speichert 2 16 bit samples, gibt es 2^32 mögliche Kombinationen, richtig? und so, wenn jeder Knoten speichert 4 Proben, es sind 2^64 mögliche Kombinationen?

Bibliothek und Plattform-spezifische Lösungen, die nicht wirklich relevant für diese Frage. Ich möchte nicht, dass jemand, der vielleicht kompiliere mein Programm zum herunterladen zusätzlicher Bibliotheken oder ändern Sie den code entsprechend Ihrer OS.

InformationsquelleAutor Deathbob | 2008-09-15

c++hash

Eine einfache Lösung ist die Verwendung eines 64-bit-Ganzzahl, wo die unteren 16 bits der ersten vertex-Koordinate, die nächsten 16 bits ist die zweite, und so weiter. Diese werden einmalig für alle Ihre Scheitelpunkte, wenn auch nicht sehr kompakt.

So, hier ist etwas halbherzig-code, dies zu tun. Ich hoffe, ich habe die Modelle rechts.

uint64_t generateId( uint16_t v1, uint16_t v2, uint16_t v3, uint16_t v4)
{ 
   uint64_t id;
   id = v1 | (((uint64_t)v2) << 16) | (((uint64_t)v3) << 32) | (((uint64_t)v4) << 48);
   return id;
}

Optional umgesetzt werden könnte dies mit einer union (tolle Idee von Leon Timmermans, siehe Kommentar). Sehr sauber so:

struct vertex
{
    uint16_t v1;
    uint16_t v2;
    uint16_t v3;
    uint16_t v4;
};

union vertexWithId
{
    vertex v;
    uint64_t id;
};

int main()
{
    vertexWithId vWithId;
    //Setup your vertices
    vWithId.v.v1 = 2;
    vWithId.v.v2 = 5;

    //Your id is automatically setup for you!
    std::cout << "Id is " << vWithId.id << std::endl;
    return 0;
}

Ich wirklich die Sache, dass eine Gewerkschaft wäre ein sauberer Weg, um genau das zu tun, aber das ist Geschmackssache.
fyi, Typ-Zweideutigkeiten wie das mit union ist Undefiniertes Verhalten.

InformationsquelleAutor Doug T.

8

Manchmal sind die einfachsten Dinge am besten funktioniert.

Können Sie fügen Sie einfach ein id-Feld, um das Vertex-Objekt und weisen Sie ihm eine Nummer in der Reihenfolge der Konstruktion?
```
static int sNextId = 0;
int getNextId() { return ++sNextId; }
```
InformationsquelleAutor Jeroen Dirks
0

verwenden Sie eine lange, lange, so dass Sie können speichern Sie alle 4 Möglichkeiten, dann bitshift jeder kurz:

((long long)shortNumberX) << 0, 4, 8, oder 12

achten Sie darauf werfen bevor Sie sich, oder Ihre Daten könnten in die drop-off am Ende.

Edit: vergaß hinzuzufügen, sollten Sie ODER Sie zusammen.

InformationsquelleAutor
0

Wenn Sie bevorzugen die Portabilität, dann boost::tuple ist schön:

Möchten Sie, dass ein Tupel aus 4 Elementen:
```
typedef boost::tuple<uint16,uint16,uint16,uint16> VertexID;
```
Können Sie zuordnen, wie diese:
```
VertexID id = boost::make_tuple(1,2,3,4);
```
Den boost-tuple hat bereits Unterstützung für den Vergleich, Gleichheit, etc., so ist es einfach zu bedienen, die in Containern und algorithmen.

InformationsquelleAutor David Dolson
0

Die definition von "ID" in der Frage ist nicht wirklich klar: Sie brauchen, um verwenden Sie es als Schlüssel für den schnellen Vertex-lookup? Definieren Sie einen Komparator für die std::map (siehe unten für ein Beispiel)

Müssen Sie in der Lage sein, zu unterscheiden zwischen zwei Vertex-Objekte mit den gleichen Koordinaten (unterscheiden sich aber in einem anderen Bereich)? Definieren Sie hier einige id 'Fabrik' (cfr. das singleton-pattern) erzeugt z.B. eine Sequenz von Ganzzahlen, die sich nicht auf die Werte der Vertex-Objekte. - Viel in der Art Feuer Lancer schlägt (aber Vorsicht, der thread-Sicherheitsprobleme!)

Meiner Meinung nach, zwei Knoten mit identischen Koordinaten identisch sind. Also, warum würde Sie noch brauchen, eine extra ID?

Sobald Sie definieren einen 'strenge schwache bestellen' auf diese Art, Sie können verwenden Sie es als Schlüssel, z.B. eine std::map,
```
struct Vertex {
  typedef short int Value;
  Value v1, v2;

  bool operator<( const Vertex& other ) const {
    return v1 < other.v1 || ( v1 == other.v1 && v2 < other.v2 ) ;
};

Vertex x1 = { 1, 2 };
Vertex x2 = { 1, 3 };
Vertex y1 = { 1, 2 }; //too!

typedef std::set<Vertex> t_vertices;

t_vertices vertices;
vertices.insert( x1 );
vertices.insert( x2 );
vertices.insert( y1 ); //won't do a thing since { 1, 2 } is already in the set.

typedef std::map<Vertex, int> t_vertex_to_counter;
t_vertex_to_counter count;
count[ x1 ]++;
assert( count[x1] == 1 );
assert( count[y1] == 1 );
count[ x2 ]++;
count[ y1 ]++; 
assert( count[x1] == 2 );
assert( count[y1] == 2 );
```
InformationsquelleAutor xtofl
0

Wenn Sie Windows benutzen, könnten SieCoCreateGUID API, unter Linux können Sie /proc/sys/kernel/random/uuid haben, können Sie auch einen Blick auf 'libuuid'.

InformationsquelleAutor
0

Wenn Sie eine hash-Tabelle zum speichern der vertices, an die ich denken kann ein paar Möglichkeiten, um Kollisionen zu vermeiden:
1. Generieren IDs direkt aus der input-Daten, ohne dass alle bits Weg, und verwenden Sie eine hash-Tabelle, die groß genug ist, um alle möglichen IDs. Mit 64-bit-IDs, die letzteren werden als äußerst problematisch: Sie haben eine Tabelle verwenden, die kleiner ist als Ihre Palette von IDs, deshalb werden Sie haben, um mit Kollisionen. Auch mit 32-bit-IDs, müssen Sie auch über 4GB RAM zu ziehen diese aus, ohne Kollisionen.
2. Generieren-IDs sequenziell Lesen Sie in den Eckpunkten. Leider, das macht es sehr teuer, um die Suche für vorher Lesen, Eckpunkte, um zu aktualisieren Sie Ihre Wahrscheinlichkeiten, da ein sequenzielle ID-generator ist keine hash-Funktion. Wenn die Menge der Daten verwendet, die zur Konstruktion der Markov-Kette ist deutlich kleiner als die Menge der Daten, dass die Markov-Kette generiert wird (oder wenn Sie sind beide klein), kann dies nicht ein Problem sein.
Alternativ könnten Sie verwenden eine hash-Tabelle Implementierung, die Griffe Kollisionen für Sie (wie unordered_map/hash_map), und konzentrieren sich auf den rest der Anwendung.

InformationsquelleAutor bk1e
0

Nun, die einzige Weise, zu garantieren, die ID eindeutig ist, ist zu machen Sie haben mehr-id-Kombinationen, als das, was Ihre gettings-ids aus

z.B. für 2 shorts (vorausgesetzt, 16-bit) verwenden, sollten Sie eine 32bit int
```
int ID = ((int)short1 << 16) | short2;
```
und für 4 shorts benötigen Sie ein 64bit int, etc...

Mit im Grunde nichts anderes Kollisionen (mehrere Dinge bekommen kann die gleichen id) sind so ziemlich garantiert.

Jedoch einen anderen Ansatz (was ich denke, wäre besser)zu bekommen-ids wäre, um Sie aus der hand als Eckpunkte eingefügt werden:
```
unsigned LastId = 0;//global

unsigned GetNewId(){return ++LastId;}
```
Dies hat auch den Effekt, so dass Sie hinzufügen, mehr/andere Daten an jedem vertex. Allerdings, wenn Sie erwarten, zu erstellen, die mehr als 2^32 vertices, ohne ihn, das ist wahrscheinlich nicht die beste Methode.
- Mit und es wird immer nur die unteren 8 bits nicht alle 0. Es sollte verschoben werden, 16 und ored statt.
InformationsquelleAutor Fire Lancer
-1

aus dem Stegreif würde ich sagen, verwendet Primzahlen,
```
id = 3 * value1 + 5 * value2 + .... + somePrime * valueN
```
Stellen Sie sicher, dass Sie nicht überlaufen Ihre id-Raum (lange? lange, lange?). Da hast du eine Feste Anzahl von Werten nur Mist einige zufällige Primzahlen. Kümmern Sie sich nicht erzeugen, gibt es genug verfügbar in den Listen, um Sie gehen für eine Weile.

Bin ich ein wenig skizzenhaft auf den Beweis, obwohl, vielleicht hat jemand mehr mathematischen kann mir Haken. Hat wahrscheinlich etwas zu tun mit der einmaligen Primzahl-ZERLEGUNG von einer Zahl.

InformationsquelleAutor basszero

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.