Array entfernen Sie doppelte Elemente

Ich habe eine unsortierte array, was ist die beste Methode, um entfernen Sie alle Duplikate eines Elements, wenn vorhanden?

e.g:

a[1,5,2,6,8,9,1,1,10,3,2,4,1,3,11,3]

so, nachdem Sie, dass der Betrieb das array Aussehen sollte

 a[1,5,2,6,8,9,10,3,4,11]

Ist dieses Hausaufgaben? Wenn nicht, viele Sprachen (scripting-Sprachen mindestens) sind diese eingebaut. Ruby: [1, 2, 3, 2, 3, 1].uniq
Ein temporäres Wörterbuch, in dem Sie Elemente einfügen, wie Sie gelesen werden, um Sie zu entfernen, wenn Sie bereits in das Wörterbuch.
Es ist nicht eine Arbeit zu Hause.. ich wollte wissen, die entsprechenden algoritm im Grunde. @pascal Verwendung temporärer Wörterbuch bedeutet, mit extra Speicher(storage)?
Ja, siehe zum Beispiel Matthäus die Antwort.
Auch Wenn Sie ein C++ - Benutzer..dann verwenden Sie eindeutige() in C++ STL <Algorithmus> cplusplus.com/reference/algorithm/unique

InformationsquelleAutor mohit | 2010-07-28

73

Überprüfen Sie jedes element gegen jedes andere element

Die naive Lösung ist es zu prüfen jedes element gegen jedes andere element. Dies ist verschwenderisch und gibt einen O(n²) Lösung, auch wenn Sie nur "vorwärts".

Art dann entfernen Sie Duplikate

Eine bessere Lösung ist die Sortierung des Arrays und überprüfen Sie dann jedes element mit der nächsten zu, um Duplikate zu finden. Wählen Sie eine effiziente Art und das ist O(n log n).

Den Nachteil, mit der Art-basierten Lösung ist, um nicht beibehalten werden. Ein zusätzlicher Schritt, der aufpassen kann, dies jedoch. Setzen Sie alle Einträge (in die einzigartige sortierten array) in eine Hashtabelle, die O(1) zugreifen. Dann Durchlaufen Sie das original-array. Für jedes element prüfen, ob es in der hash-Tabelle. Wenn es ist, fügen Sie es in das Ergebnis und Sie löschen es aus der hash-Tabelle. Sie werden am Ende mit einem resultierenden array mit der Reihenfolge der ursprünglichen mit jedem element in der gleichen position wie das erste vorkommen.

Lineare Arten von Ganzzahlen

Wenn man sich mit Ganzzahlen, die von einigen festen Bereich, die Sie tun können noch besser durch die Verwendung einer radix-sort. Wenn Sie davon ausgehen, die zahlen sind alle im Bereich von 0 bis 1.000.000 zum Beispiel, können Sie zuweisen, ein bit-Vektor, der einige 1,000,001. Für jedes element im ursprünglichen array ausgeführt wurde, setzen Sie das entsprechende bit basierend auf seinen Wert (z.B. den Wert 13 Ergebnisse in Einstellung 14 bit). Dann durchqueren Sie das original-array, wenn es in der bit-Vektor. Wenn es ist, fügen Sie es in das Ergebnis-array und klar, dass der bit aus dem bit-Vektor. Das ist O(n) und trades Raum für Zeit.

Hash-Tabelle-Lösung

Das führt uns zu der besten Lösung von allen: die Art ist eigentlich eine Ablenkung, aber nützlich. Erstellen Sie eine Hashtabelle mit O(1) zugreifen. Durchqueren Sie den ursprünglichen Liste. Wenn es nicht in der hashtable schon, fügen Sie es in das Ergebnis-array und fügen Sie es in die hash-Tabelle. Wenn es in der hash-Tabelle, ignorieren Sie es.

Dies ist mit Abstand die beste Lösung. Also warum den rest? Denn Probleme wie diese sind über das anpassen von wissen, das Sie haben (oder sollten haben) zu Problemen und verfeinert, basierend auf den Annahmen, die Sie machen in einer Lösung. Das entwickeln einer Lösung und das Verständnis der Hintergründe ist es weit mehr nützlich, als das wiederkäuen einer Lösung.

Auch, hash-Tabellen sind nicht immer verfügbar. Nehmen Sie ein embedded-system oder etwas, wo der Raum SEHR begrenzt ist. Realisieren Sie eine schnelle Sortierung in einer Handvoll Maschinenbefehle, weit weniger als jede hash-Tabelle sein könnte.

In der Frage, hat das resultierende array wird angezeigt, beibehalten der Reihenfolge der Eingabe-array.
Vollständige und übersichtliche Zusammenfassung
Man sollte sich klar machen, dass hashtables nur geben Sie erwartet Konstante Zeit, nicht garantiert Konstante Zeit.
Während der hashtable lässt Sie nicht hinzufügen Objekte duplizieren, wenn Sie fügen Sie alle zahlen in der Hashtabelle, und dann einfach ausdrucken , können Sie erreichen das gleiche Ergebnis. was ist der Punkt über, um einige if-Bedingungen und macht die Logik komplizierter?
Die meisten Gründe ersichtlich, die angesprochen worden sind: Bedeutung von bestellen, fehlen der hash-Tabelle, die Verfügbarkeit, die starke Raum-Einschränkungen.

InformationsquelleAutor cletus

Diese kann getan werden, in amortisiert O(n) unter Verwendung einer hashtable-basierte set.

Psuedo-code:

s := new HashSet
c := 0
for each el in a
  Add el to s.
    If el was not already in s, move (copy) el c positions left.
    If it was in s, increment c.

InformationsquelleAutor Matthew Flaschen

2

Wenn Sie nicht brauchen, um die original-Objekts können Sie mit einer Schleife und erstelle ein neues array mit eindeutigen Werten. In C# eine Liste verwenden, erhalten Sie Zugriff auf die benötigte Funktionalität. Es ist nicht das attraktivste oder intelligente Lösung, aber es funktioniert.
```
int[] numbers = new int[] {1,2,3,4,5,1,2,2,2,3,4,5,5,5,5,4,3,2,3,4,5};
List<int> unique = new List<int>();

foreach (int i in numbers)
     if (!unique.Contains(i))
          unique.Add(i);

unique.Sort();
numbers = unique.ToArray();
```
InformationsquelleAutor WDuffy

Behandlung von zahlen als Schlüssel.

for each elem in array:
if hash(elem) == 1 //duplicate
  ignore it
  next
else
  hash(elem) = 1
  add this to resulting array 
end

Wenn Sie über die Daten wissen, wie die Reihe von zahlen, und wenn es endlich ist, dann können Sie initialisieren, großen array mit NULL ist.

array flag[N] //N is the max number in the array
for each elem in input array:
  if flag[elem - 1] == 0
    flag[elem - 1] = 1
    add it to resulatant array
  else
    discard it //duplicate
  end

InformationsquelleAutor bhups

    indexOutput = 1;
    outputArray[0] = arrayInt[0];
    int j;
    for (int i = 1; i < arrayInt.length; i++) {            
        j = 0;
        while ((outputArray[j] != arrayInt[i]) && j < indexOutput) {
            j++;
        }
        if(j == indexOutput){
           outputArray[indexOutput] = arrayInt[i];
           indexOutput++;
        }         
    }

InformationsquelleAutor dhayyati

0

Verwenden Sie eine Set-Implementierung.

HashSet,TreeSet oder LinkedHashSet wenn Ihre Java.

InformationsquelleAutor Zaki
0

Ich Stimme mit Cletus. Verwenden Sie eine QuickSort dann entfernen dups

InformationsquelleAutor Laramie

Dies ist ein code-segment, die ich erstellt in C++, Probieren Sie es

#include <iostream>

using namespace std;

int main()
{
   cout << " Delete the duplicate" << endl; 

   int numberOfLoop = 10;
   int loopCount =0;
   int indexOfLargeNumber = 0;
   int largeValue = 0;
   int indexOutput = 1;

   //Array to hold the numbers
   int arrayInt[10] = {};
   int outputArray [10] = {};

   //Loop for reading the numbers from the user input
   while(loopCount < numberOfLoop){       
       cout << "Please enter one Integer number" << endl;
       cin  >> arrayInt[loopCount];
       loopCount = loopCount + 1;
   }



    outputArray[0] = arrayInt[0];
    int j;
    for (int i = 1; i < numberOfLoop; i++) {            
        j = 0;
        while ((outputArray[j] != arrayInt[i]) && j < indexOutput) {
            j++;
        }
        if(j == indexOutput){
           outputArray[indexOutput] = arrayInt[i];
           indexOutput++;
        }         
    }

   cout << "Printing the Non duplicate array"<< endl;

   //Reset the loop count
   loopCount =0;

   while(loopCount < numberOfLoop){ 
       if(outputArray[loopCount] != 0){
        cout <<  outputArray[loopCount] << endl;
    }     

       loopCount = loopCount + 1;
   }   
   return 0;
}

InformationsquelleAutor Vanji

Meine Lösung(O(N)) nicht nutzen, zusätzliche Speicher, aber das array muss sortiert wurden(meine Klasse, die mit insertion-sort-Algorithmus, aber es spielt keine Rolle.):

  public class MyArray
        {
            //data arr
            private int[] _arr;
            //field length of my arr
            private int _leght;
            //counter of duplicate
            private int countOfDup = 0;
            //property length of my arr
            public int Length
            {
                get
                {
                    return _leght;
                }
            }

            //constructor
            public MyArray(int n)
            {
                _arr = new int[n];
                _leght = 0;
            }

            //put element into array
            public void Insert(int value)
            {
                _arr[_leght] = value;
                _leght++;
            }

            //Display array
            public void Display()
            {
                for (int i = 0; i < _leght; i++) Console.Out.Write(_arr[i] + " ");
            }

            //Insertion sort for sorting array
            public void InsertSort()
            {
                int t, j;
                for (int i = 1; i < _leght; i++)
                {
                    t = _arr[i];
                    for (j = i; j > 0; )
                    {
                        if (_arr[j - 1] >= t)
                        {
                            _arr[j] = _arr[j - 1];
                            j--;
                        }
                        else break;
                    }
                    _arr[j] = t;
                }
            }

            private void _markDuplicate()
            {
                //mark duplicate Int32.MinValue
                for (int i = 0; i < _leght - 1; i++)
                {
                    if (_arr[i] == _arr[i + 1])
                    {
                        countOfDup++;
                        _arr[i] = Int32.MinValue;
                    }
                }
            }

            //remove duplicates O(N) ~ O(2N) ~ O(N + N)
            public void RemoveDups()
            {
                _markDuplicate();
                if (countOfDup == 0) return; //no duplicate
                int temp = 0;

                for (int i = 0; i < _leght; i++)
                {
                    //if duplicate remember and continue
                    if (_arr[i] == Int32.MinValue) continue;
                    else //else need move 
                    {
                        if (temp != i) _arr[temp] = _arr[i];
                        temp++;
                    }
                }
                _leght -= countOfDup;
            }
        }

Haupt-Und

static void Main(string[] args)
{
     Random r = new Random(DateTime.Now.Millisecond);
     int i = 11;
     MyArray a = new MyArray(i);
     for (int j = 0; j < i; j++)
     {
        a.Insert(r.Next(i - 1));
     }

     a.Display();
     Console.Out.WriteLine();
     a.InsertSort();
     a.Display();
     Console.Out.WriteLine();
     a.RemoveDups();
     a.Display();

    Console.ReadKey();
}

InformationsquelleAutor isxaker

import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collection;
import java.util.HashMap;
import java.util.HashSet;
import java.util.List;
import java.util.Set;

public class testing {
    public static void main(String[] args) {
        EligibleOffer efg = new EligibleOffer();
        efg.setCode("1234");
        efg.setName("hey");
        EligibleOffer efg1 = new EligibleOffer();
        efg1.setCode("1234");
        efg1.setName("hey1");
        EligibleOffer efg2 = new EligibleOffer();
        efg2.setCode("1235");
        efg2.setName("hey");
        EligibleOffer efg3 = new EligibleOffer();
        efg3.setCode("1235");
        efg3.setName("hey");
        EligibleOffer[] eligibleOffer = { efg, efg1,efg2 ,efg3};
        removeDupliacte(eligibleOffer);
    }

    public static EligibleOffer[] removeDupliacte(EligibleOffer[] array) {
        List list = Arrays.asList(array);
        List list1 = new ArrayList();
        int len = list.size();
        for (int i = 0; i <= len-1; i++) {
            boolean isDupliacte = false;
            EligibleOffer eOfr = (EligibleOffer) list.get(i);
            String value = eOfr.getCode().concat(eOfr.getName());
            if (list1.isEmpty()) {
                list1.add(list.get(i));
                continue;
            }
            int len1 = list1.size();
            for (int j = 0; j <= len1-1; j++) {
                EligibleOffer eOfr1 = (EligibleOffer) list1.get(j);
                String value1 = eOfr1.getCode().concat(eOfr1.getName());
                if (value.equals(value1)) {
                    isDupliacte = true;
                    break;
                }
                System.out.println(value+"\t"+value1);
            }
            if (!isDupliacte) {
                list1.add(eOfr);
            }
        }
        System.out.println(list1);
        EligibleOffer[] eligibleOffer = new EligibleOffer[list1.size()];
        list1.toArray(eligibleOffer);
        return eligibleOffer;
    }
}

InformationsquelleAutor Nivi

Time O(n) space O(n) 

#include <iostream>
    #include<limits.h>
    using namespace std;
    void fun(int arr[],int size){

        int count=0;
        int has[100]={0};
        for(int i=0;i<size;i++){
            if(!has[arr[i]]){
               arr[count++]=arr[i];
               has[arr[i]]=1;
            }
        }
     for(int i=0;i<count;i++)
       cout<<arr[i]<<" ";
    }

    int main()
    {
        //cout << "Hello World!" << endl;
        int arr[]={4, 8, 4, 1, 1, 2, 9};
        int size=sizeof(arr)/sizeof(arr[0]);
        fun(arr,size);

        return 0;
    }

InformationsquelleAutor rjnitt

public class RemoveDuplicateArray {
    public static void main(String[] args) {
        int arr[] = new int[] { 1, 2, 3, 4, 5, 6, 7, 2, 3, 4, 9 };
        int size = arr.length;
        for (int i = 0; i < size; i++) {
            for (int j = i+1; j < size; j++) {
                if (arr[i] == arr[j]) {
                    while (j < (size) - 1) {
                        arr[j] = arr[j + 1];
                        j++;
                    }
                    size--;
                }
            }
        }
        for (int i = 0; i < size; i++) {
            System.out.print(arr[i] + "  ");
        }
    }

}

Ausgabe - 1 2 3 4 5 6 7 9

InformationsquelleAutor Ved Prakash

0

Können Sie die "in" und "nicht" - syntax in python, das macht es ziemlich straight forward.

Die Komplexität ist höher als die hashing-Ansatz, obwohl da ein "nicht" ist äquivalent zu einer linearen traversal, um herauszufinden, ob dieser Eintrag vorhanden ist oder nicht.
```
li = map(int, raw_input().split(","))
a = []
for i in li:
    if i not in a:
        a.append(i)
print a
```
InformationsquelleAutor Deepak Pathania

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.

Überprüfen Sie jedes element gegen jedes andere element

Art dann entfernen Sie Duplikate

Lineare Arten von Ganzzahlen

Hash-Tabelle-Lösung