Längste subarray, deren Elemente bilden eine kontinuierliche Abfolge

Gegeben ein unsortierter array von positiven ganzen zahlen, die Länge der längsten subarray, deren Elemente, wenn Sie sortiert sind kontinuierlich. Können Sie sich vorstellen wie ein O(n) Lösung?

Beispiel:

{10, 5, 3, 1, 4, 2, 8, 7}, Antwort ist 5.

{4, 5, 1, 5, 7, 6, 8, 4, 1}, Antwort ist 5.

Für das erste Beispiel, das subarray {5, 3, 1, 4, 2} wenn sortiert werden kann, bilden eine kontinuierliche Folge 1,2,3,4,5, die die längste.

Für das zweite Beispiel, das subarray {5, 7, 6, 8, 4} ist das Ergebnis subarray.

Ich denken kann, eine Methode, die für jedes subarray, überprüfen Sie, ob (maximum - minimum + 1) ist gleich der Länge des subarray, wenn das stimmt, dann ist es eine kontinuierliche subarray. Nehmen Sie die längste von allen. Aber es ist O(n^2) und nicht umgehen können mit Duplikaten.

Kann jemand gibt eine bessere Methode?

Dürfen Sie zum ändern der array? Wie viel zusätzlicher Speicherplatz zur Verfügung steht?
Sie haben keine Gründe zu glauben, es gibt eine O(n) Lösung? (+1)
Eigentlich ist es eine interview-Frage.
Keinen Platz begrenzen.
Was sind die Einschränkungen für die Werte der ganzen zahlen im array? Wenn es keine, ich würde Wetten auf: es ist unmöglich zu tun, dass die Komplexität in weniger als O(n*log(n))
Ich denke, wir sollten einige Umsetzung-stapeln oder/und in Warteschlangen zu speichern, die max-min-Elemente von subarray. Dies ist ein gängiger Ansatz für O(n) algorithmen mit arrays und subarrays
Positiv, keine weiteren Einschränkungen.
Welche Annahmen sind zulässig in Bezug auf Duplikate? Ist es sicher, anzunehmen, dass jede ganze Zahl tritt höchstens einmal?
Es kann ganze zahlen mehr als einmal vorkommen. Ich habe den Beitrag editieren zu geben noch ein Beispiel für Dubletten.
Können Sie bitte definieren Sie "subarray"? Muss es zusammenhängend in das original-array?
Ich denke, es muss zusammenhängend sein, wie vorgeschlagen, durch das Beispiel mit den Duplikaten
Ist ein subarray, das Duplikate enthält, erlaubt? E. g. für die Eingabe 3 1 1 2 5 können wir ein subarray von der Länge 4 1 1 2 3?
Nein, die Antwort für dein Beispiel wäre 2 für die subarray {1, 2}

InformationsquelleAutor shilk | 2013-04-12

algorithm

2

Algorithmus zum lösen ursprüngliche problem in O(n) ohne Duplikate. Vielleicht hilft es jemandem, der Entwicklung in O(n) Lösung, die sich mit Duplikaten.

Eingabe: [a1, a2, a3, ...]

Karte original-array als paar, wo 1. element ist ein Wert, und 2. ist der index des array.

Array: [[a1, i1], [a2, i2], [a3, i3], ...]

Sortieren das array von Paaren mit einigen O(n) Algorithmus (e.g Zählen, Sortieren) für integer-Sortierung von Wert.
Wir haben hier einige ein anderes array:

Array: [[a3, i3], [a2, i2], [a1, i1], ...]

wo a3, a2, a1, ... sind in sortierter Reihenfolge.

Ausführen Schleife über sortierte array von Paaren

In der linearen Zeit, die wir erkennen können aufeinander folgende Gruppen von zahlen, a3, a2, a1. Aufeinanderfolgende Gruppe definition ist der nächste Wert = prev-Wert + 1.
Beim Scannen halten Sie die aktuelle Größe der Gruppe (n), mindestens ein Wert von index (min), und die aktuelle Summe der Indizes (actualSum).

Auf jedem Schritt in aufeinander folgenden Gruppe können wir schätzen die Summe der Indizes, denn Sie schaffen arithmetische progression mit dem ersten element min, Schritt 1, und die Größe der Gruppe bisher gesehen n.
Diese Summe schätzen kann durchgeführt werden in O(1) Zeit mit Hilfe der Formel für die arithmetische progression:

Schätzung Summe = (a1 + an) * n /2;

Schätzung Summe = (min + min + (n - 1)) * n /2;

Schätzung Summe = min * n + n * (n - 1) /2;

Wenn auf einigen Schleife in Schritt aufeinander folgenden Gruppe Schätzung Summe entspricht der tatsächlichen Summe, dann bisher gesehen aufeinanderfolgende Gruppe, die diese Bedingungen erfüllen. Speichern n als aktuelle maximale Ergebnis, oder wählen Sie maximal zwischen aktuellen, maximalen und n.

Wenn auf der Wert-Elemente wir aufhören, aufeinander folgenden Gruppe, dann setzen Sie alle Werte und das gleiche tun.

Code Beispiel: https://gist.github.com/mishadoff/5371821
- Sie brauchen nicht die Summe, die Sie nutzen könnten, max - min + 1 == n statt. Der code verwendet O(n*log(n)) Sortieren. Es ist nicht klar, wie Sortieren von ganzen zahlen in O(n) wenn es keine Obere Grenze für Integer z.B., wenn es sqrt(n) von n**sqrt(n) Ganzzahlen, dann ist die input-Größe ist noch O(n) aber Counting Sort ist O(n + maxdiff) = O(n + n**sqrt(n)) = O(n**sqrt(n)) oder Radix-Sort ist O(n*ndigits) = O(n * sqrt(n)). Ich benutze Computer-Modell, dass hier davon ausgegangen, dass n können gespeichert werden, in O(1) Maschine Worten.
- Da wir daran interessiert sind nur in den "kontinuierlichen Sequenzen", Es könnte möglich sein, teilen Sie die Eingabe in Behälter in O(n) so dass min(bin[j]) - max(bin[i]) > n und max(bin[i]) - min(bin[i]) ist O(n). Und Suche für "kontinuierliche Abfolgen" innerhalb der einzelnen bins. Es führen könnte, zu O(n) Algorithmus für die Eingabe ohne Duplikate.
- Dies funktioniert nicht für 100,80,17,12,10,15,14,16,19,30,13,70 . Der Algorithmus sortiert das array und starten mit 12 und geht bis 19 ohne ab 14, die die Antwort gibt. Richtige Antwort für dieses Beispiel ist 14,15,16
InformationsquelleAutor mishadoff
1

Sehen, wird das Feld S in seiner mathematischen definition :

S = U_j=0^k (I_j)

Wo die I_j disjunkt sind integer-Segmente. Sie können ein bestimmtes Intervall-Baum (basierend auf einem Rot-Schwarz-Baum oder ein self-balancing tree, die Sie mögen 🙂 ) zu speichern, das array im mathematischen Definitionen. Die Knoten und Baum-Strukturen, die Aussehen sollte wie diese :
```
struct node {
    int d, u;
    int count;
    struct node *n_left, *n_right;
}
```
Hier, d ist die kleinere Grenze des integer-segment und u die Obere Schranke. count Hinzugefügt wird, um zu nehmen Pflege von möglichen Dubletten im array : beim Versuch, fügen Sie ein bereits vorhandenes element in den Baum, anstatt nichts zu tun, wir erhöhen den count Wert des Knotens, in dem es gefunden wird.
```
struct root {
    struct node *root;
}        
```
Den Baum speichern nur disjunkte Knoten, so dass das einsetzen ist ein wenig komplexer als eine klassische Rot-Schwarz-Baum einfügen. Beim einfügen von Abständen, müssen Sie die scans auf mögliche überläufe mit bereits bestehenden Intervalle. In Ihrem Fall, da Sie nur einfügen singletons dies sollte nicht zu viel overhead.

Drei Knoten P, L und R, L wird der linke Kind von P und R das Rechte Kind von P. Dann ist, müssen Sie erzwingen, L. u < P. d und P. u < R. d (und für jeden Knoten, d <= u, natürlich).

Beim einfügen eines ganzzahligen segment [x,y], müssen Sie die "überlappung" - Segmenten, das heißt, die Intervalle [u,d] erfüllt, dass eine der folgenden Ungleichungen :

y >= d - 1

ODER

x <= u + 1

Wenn die eingelegte Intervall ist ein singleton x, dann können Sie nur finden bis zu 2 überlappende Intervall Knoten N1 und N2, so dass N1.d == x + 1 und N2.u == x - 1. Dann haben Sie die Zusammenführung der beiden Intervalle und update zu zählen, die Sie Blätter mit N3, so dass N3.d = N2.d, N3.u = N1.u und N3.count = N1.count + N2.count + 1. Da das delta zwischen N1.d und N2.u ist das minimale delta für die zwei Segmente werden disjunkt, dann sind Sie muss haben eine der folgenden :
- N1 ist das Rechte Kind von N2
- N2 ist das linke Kind von N1
Damit Sie die Einfügemarke noch in O(log(n)) im schlimmsten Fall.

Von hier aus kann ich nicht herausfinden, wie zu handhaben die Ordnung in der ersten Folge, aber hier ist ein Ergebnis, das interessant sein könnte : wenn das Eingabe-array definiert einen perfekte integer-segment, dann wird der Baum hat nur einen Knoten.

InformationsquelleAutor Rerito
1

UPD2: Die folgende Lösung für ein problem, wenn es nicht erforderlich ist, dass subarray ist zusammenhängend. Habe ich falsch verstanden, die problem-Anweisung. Nicht löschen diese, wie jemand möglicherweise eine Idee, basierend auf der mine, die die Arbeit für das eigentliche problem.

Hier ist, was ich mir ausgedacht habe:

Erstellen Sie eine Instanz des dictionary (implementiert als hash-Tabelle, was O(1) in normalen Situationen). Die Schlüssel sind ganze zahlen, sind die Werte hash-sets der zahlen (auch O(1)) – var D = new Dictionary<int, HashSet<int>>.

Iteration durch das array A und für jede ganze Zahl n mit index i tun:
1. Prüfen Sie, ob Tasten n-1 und n+1 enthalten sind in D.
  - wenn keiner der Schlüssel vorhanden ist, tun D.Add(n, new HashSet<int>)
  - wenn nur ein Schlüssel vorhanden ist, z.B. n-1 tun D.Add(n, D[n-1])
  - wenn beide Tasten vorhanden sind, tun D[n-1].UnionWith(D[n+1]); D[n+1] = D[n] = D[n-1];
2. D[n].Add(n)
Gehen Sie nun durch die einzelnen Schlüssel in D und finden Sie die hash-set mit der größten Länge (Suche nach Länge O(1)). Die größte Länge wird die Antwort sein.

Meinem Verständnis, die schlimmsten Fall Komplexität O(n*log(n)), nur weil der UnionWith Betrieb. Ich weiß nicht, wie die Berechnung der durchschnittlichen Komplexität, aber es sollte in der Nähe der O(n). Bitte korrigieren Sie mich, wenn ich falsch bin.

UPD: Zu sprechen-code, hier ist eine test-Implementierung in C#, das gibt das richtige Ergebnis in den beiden OP ' s Beispiele:
```
var A = new int[] {4, 5, 1, 5, 7, 6, 8, 4, 1};
var D = new Dictionary<int, HashSet<int>>();

foreach(int n in A)
{
    if(D.ContainsKey(n-1) && D.ContainsKey(n+1))
    {
        D[n-1].UnionWith(D[n+1]);
        D[n+1] = D[n] = D[n-1];
    }
    else if(D.ContainsKey(n-1))
    {
        D[n] = D[n-1];
    }
    else if(D.ContainsKey(n+1))
    {
        D[n] = D[n+1];
    }
    else if(!D.ContainsKey(n))
    {
        D.Add(n, new HashSet<int>());
    }

    D[n].Add(n);
}

int result = int.MinValue;
foreach(HashSet<int> H in D.Values)
{
    if(H.Count > result)
    {
        result = H.Count;
    }
}

Console.WriteLine(result);
```
- Die Lösung des Arrays [10, 5, 3, 1, 4, 2, 8, 7, 0] sollte 5, die maximale subarray ist [5, 3, 1, 4, 2]. Die zusätzliche 0 am Ende nicht verändern! Aber dein code gibt das Ergebnis zurück 6, als es annimmt, das element 0 Teil der (nicht-zusammenhängend!) maximale subarray.
- OP nie gesagt das subarray müssen zusammenhängend sein. Nur die Elemente, wenn die sortiert werden müssen, kontinuierlich an. Aber jetzt sehe ich das problem Aussage ist mehrdeutig. Die OP haben können, stillschweigend contiguosity.
- Es wird angedeutet in der Frage: die Lösung [4, 5, 1, 5, 7, 6, 8, 4, 1] wäre 7 statt 5 wenn nicht-benachbart durften. Außerdem wird die Anzahl der möglichen Teilmengen wären 2^n statt n^2.
- Auch wenn das subarray müssen zusammenhängend sein im ursprünglichen array an, meine Lösung kann leicht modifiziert zu respektieren. Komplexität wird sich nicht ändern. Die eigentliche Frage ist: wie Komplex ist meine Lösung?
- Ich nahm an, dass Duplikate dürfen nicht gezählt werden. Das könnte schon eine falsche Annahme.
- Die Analyse für die angegebene code scheint korrekt zu sein. Ich wäre daran interessiert zu sehen, den veränderten code aber!
- lassen Sie uns weiter, diese Diskussion im chat
- Ihr Algorithmus nicht das problem löst, aber seine die Zeit-Komplexität ist linear in der Praxis. Ich habe es nachgemessen, mit die Umsetzung in Python.
InformationsquelleAutor Dmytro Shevchenko

Dies erfordert zwei Durchläufe über die Daten. Zuerst erstellen Sie eine hash-map, mapping-ints zu bools. Ich aktualisierte meinen Algorithmus nicht zu verwenden, anzeigen, aus der STL, die ich bin, positiv verwendet die Sortierung intern. Dieser Algorithmus verwendet hashing und problemlos aktualisiert werden kann, für jede maximale oder minimale Kombination, möglicherweise sogar alle möglichen Werte, die ein integer erhalten.

#include <iostream>

using namespace std;
const int MINIMUM = 0;
const int MAXIMUM = 100;
const unsigned int ARRAY_SIZE = MAXIMUM - MINIMUM;

int main() {

bool* hashOfIntegers = new bool[ARRAY_SIZE];
//const int someArrayOfIntegers[] = {10, 9, 8, 6, 5, 3, 1, 4, 2, 8, 7};
//const int someArrayOfIntegers[] = {10, 6, 5, 3, 1, 4, 2, 8, 7};
const int someArrayOfIntegers[] = { -2, -3, 8, 6, 12, 14,  4, 0, 16, 18, 20};
const int SIZE_OF_ARRAY = 11;

//Initialize hashOfIntegers values to false, probably unnecessary but good practice.
for(unsigned int i = 0; i < ARRAY_SIZE; i++) {
    hashOfIntegers[i] = false;
}

//Chage appropriate values to true.
for(int i = 0; i < SIZE_OF_ARRAY; i++) {
    //We subtract the MINIMUM value to normalize the MINIMUM value to a zero index for negative numbers.
    hashOfIntegers[someArrayOfIntegers[i] - MINIMUM] = true;
}

int sequence = 0;
int maxSequence = 0;
//Find the maximum sequence in the values
for(unsigned int i = 0; i < ARRAY_SIZE; i++) {

    if(hashOfIntegers[i]) sequence++;
    else sequence = 0;

    if(sequence > maxSequence) maxSequence = sequence;
}

cout << "MAX SEQUENCE: " << maxSequence << endl;
return 0;
}

Die Grundidee ist es, die hash-map als einen Eimer Sortieren, so dass Sie nur zwei Durchgänge über die Daten. Dieser Algorithmus ist O(2n), die wiederum O(n)

InformationsquelleAutor ChrisCM

0

Nicht Ihre Hoffnungen, dies ist nur eine unvollständige Antwort.

Ich bin mir ziemlich sicher, dass das problem nicht lösbar in O(n). Leider kann ich nicht beweisen.

Wenn es gibt einen Weg, um es zu lösen in weniger als O(n^2) ist, würde ich vermuten, dass die Lösung basiert auf folgender Strategie:
1. Entscheiden, in O(n) (oder vielleicht O(n log n)), ob es existiert eine kontinuierliche subarray wie du es beschreibst mit mindestens i Elemente. Nennen wir dieses Prädikat E(i).
2. Verwenden Zweiteilung zu finden, die maximale i für die E(i) hält.
Die Gesamtlaufzeit dieses Algorithmus wäre dann O(n log n) (oder O(n log^2 n)).

Dies ist der einzige Weg, ich könnte kommen mit, um zu reduzieren das problem auf ein anderes problem, dass hat zumindest das potential, einfacher als die ursprüngliche Formulierung. Allerdings konnte ich nicht einen Weg finden, um zu berechnen E(i) in weniger als O(n^2), so kann ich Sie komplett ausschalten...

InformationsquelleAutor blubb
0

hier ist ein weiterer Weg, zu denken, Ihr problem: angenommen Sie haben ein array setzt sich nur aus 1en und 0EN, die Sie wollen, zu finden, die längste aufeinanderfolgenden ausführen von 1s. dies kann in linearer Zeit durch run-length-encoding 1s (ignorieren Sie die 0 ist). damit verwandeln Sie Ihren ursprünglichen problem in diesem neuen run-length-encoding problem, Sie berechnen ein neues array b[i] = (a[i] < a[i+1]). dies muss nicht explizit gemacht, können Sie tun es einfach implizit zu erreichen, einen Algorithmus mit konstanter Speicherbedarf und die lineare Komplexität.

InformationsquelleAutor NQZ
-1

Hier sind 3 sinnvolle Lösungen:

Die erste ist O(nlog(n)) im Zeit-und O(n) Raum, das zweite ist O(n) im Zeit-und O(n) im Raum, und die Dritte ist O(n) im Zeit-und O(1) im Raum.
1. bauen binary search tree dann durchqueren es um.
  
  halten Sie 2 Zeiger, einen für den start von max Teilmenge und eine für das Ende.
  halten Sie die max_size Wert während der Iteration der Struktur.
  es ist ein O(n*log(n)) Zeit und Raum Komplexität.
2. kann man immer Sortieren, zahlen-set mit zählen, Sortieren in einer linearen Zeit
  und nach dem Durchlauf durch das array, was bedeutet, dass O(n) Zeit und Raum
  die Komplexität.
3. Vorausgesetzt, es ist nicht überlaufen oder einen großen ganzzahligen Datentyp. Vorausgesetzt das array ist ein mathematischer Satz (keine doppelten Werte). Sie können es in O(1) Speicher:
  - berechnen Sie die Summe der Reihe und dem Produkt aus dem array
  - herauszufinden, welche zahlen Sie haben es angenommen, Sie haben die min-und max-das original-set. Völlig es ist O(n) Zeit Komplexität.
- Könnten Sie näher erläutern, wie zu konstruieren, die den binären Baum? Ich nehme an, du meinst einen ausgeglichenen Baum, sondern konnte Sie zeigen, was der Baum sieht aus wie für die Beispiele, die von der OP?
- Ich kam auch mit einer rot-schwarz-Intervall-Baum, konnte aber nicht herausfinden, wie halten Sie die Reihenfolge in einer guten Weise. Dies ist der Schlüssel. Aufbau eines binären Baums zu Sortieren das array wird nicht schwierig sein. Ganzzahl-Segmente wurden zusammenhängend in der ersten array ist viel schwieriger ! Könnte Sie darauf bestehen, auf diesen Schritt ?
- down-voting nicht hilft, bitte sagen Sie uns, was ist hier falsch.
- Ich habe nicht nach unten Abstimmung, die ich gerade erzählt habe 😉
- wenn Sie verstehen, wie zu finden die max Teilmenge in einem geordneten array, es ist die gleiche Sache.
- Nein, es ist nicht. Sie müssen eine zusammenhängende und unsortiert subarray, das ist etwas anderes.
- sobald Sie die Werte in einem binären Baum, und Sie durchqueren es in Ordnung ist äquivalent zu einem sortierten array.
- Ich sehe keine Lösung hier. Sortieren Sie das array ist nicht genug, um das subarray. Auch, counting-sort ist nicht O(n), wenn die ganzen zahlen sind unbegrenzt. Wenn keine Duplikate vorhanden sind; Sie brauchen nicht die Summe und das Produkt: min, max, size sind genug.
InformationsquelleAutor 0x90

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.

Hier sind 3 sinnvolle Lösungen: