Die meisten effizienten Algorithmus für die Zusammenführung sortiert IEnumerable<T>

Habe ich mehrere riesige sortiert enumerable-Sequenzen, die ich Zusammenführen möchten. Diese Listen manipuliert, weil IEnumerable aber bereits sortiert. Da die input-Listen sortiert sind, sollte es möglich sein, mischen Sie Sie in einer Tour, ohne neu zu Sortieren alles.

Möchte ich halten, die zeitlich verzögert die Ausführung Verhalten.

Ich zu schreiben versucht, ein naiver Algorithmus, die das tun (siehe unten). Allerdings sieht es ziemlich hässlich und ich bin mir sicher, dass es optimiert werden kann. Es kann existieren eine mehr Akademische Algorithmus...

IEnumerable<T> MergeOrderedLists<T, TOrder>(IEnumerable<IEnumerable<T>> orderedlists, 
                                            Func<T, TOrder> orderBy)
{
    var enumerators = orderedlists.ToDictionary(l => l.GetEnumerator(), l => default(T));
    IEnumerator<T> tag = null;

    var firstRun = true;
    while (true)
    {
        var toRemove = new List<IEnumerator<T>>();
        var toAdd = new List<KeyValuePair<IEnumerator<T>, T>>();
        foreach (var pair in enumerators.Where(pair => firstRun || tag == pair.Key))
        {
            if (pair.Key.MoveNext())
                toAdd.Add(pair);
            else
                toRemove.Add(pair.Key);
        }

        foreach (var enumerator in toRemove)
            enumerators.Remove(enumerator);

        foreach (var pair in toAdd)
            enumerators[pair.Key] = pair.Key.Current;

        if (enumerators.Count == 0)
            yield break;

        var min = enumerators.OrderBy(t => orderBy(t.Value)).FirstOrDefault();
        tag = min.Key;
        yield return min.Value;

        firstRun = false;
    }
}

Die Methode kann verwendet werden, wie:

//Person lists are already sorted by age
MergeOrderedLists(orderedList, p => p.Age);

vorausgesetzt, die folgenden Person Klasse existiert irgendwo:

    public class Person
    {
        public int Age { get; set; }
    }

Duplikate sollten konserviert werden, wir kümmern uns nicht um Ihre Reihenfolge in der Sequenz. Sehen Sie offensichtliche Optimierung, die ich verwenden könnte?

InformationsquelleAutor franck | 2010-05-04

algorithm c#linq optimization performance

Hier ist meine vierte (Dank an @tanascius zum schieben diese zusammen zu etwas viel mehr LINQ -) Schnitt ist es:

public static IEnumerable<T> MergePreserveOrder3<T, TOrder>(
    this IEnumerable<IEnumerable<T>> aa,
    Func<T, TOrder> orderFunc)
where TOrder : IComparable<TOrder>
{
    var items = aa.Select(xx => xx.GetEnumerator()).Where(ee => ee.MoveNext())
        .OrderBy(ee => orderFunc(ee.Current)).ToList();

    while (items.Count > 0)
    {
        yield return items[0].Current;

        var next = items[0];
        items.RemoveAt(0);
        if (next.MoveNext())
        {
            //simple sorted linear insert
            var value = orderFunc(next.Current);
            var ii = 0;
            for ( ; ii < items.Count; ++ii)
            {
                if (value.CompareTo(orderFunc(items[ii].Current)) <= 0)
                {
                    items.Insert(ii, next);
                    break;
                }
            }

            if (ii == items.Count) items.Add(next);
        }
        else next.Dispose(); //woops! can't forget IDisposable
    }
}

Ergebnisse:

for (int p = 0; p < people.Count; ++p)
{
    Console.WriteLine("List {0}:", p + 1);
    Console.WriteLine("\t{0}", String.Join(", ", people[p].Select(x => x.Name)));
}

Console.WriteLine("Merged:");
foreach (var person in people.MergePreserveOrder(pp => pp.Age))
{
    Console.WriteLine("\t{0}", person.Name);
}

List 1:
        8yo, 22yo, 47yo, 49yo
List 2:
        35yo, 47yo, 60yo
List 3:
        28yo, 55yo, 64yo
Merged:
        8yo
        22yo
        28yo
        35yo
        47yo
        47yo
        49yo
        55yo
        60yo
        64yo

Verbessert .Net 4.0 ist Tupel-Unterstützung:

public static IEnumerable<T> MergePreserveOrder4<T, TOrder>(
    this IEnumerable<IEnumerable<T>> aa,
    Func<T, TOrder> orderFunc) where TOrder : IComparable<TOrder>
{
    var items = aa.Select(xx => xx.GetEnumerator())
                  .Where(ee => ee.MoveNext())
                  .Select(ee => Tuple.Create(orderFunc(ee.Current), ee))
                  .OrderBy(ee => ee.Item1).ToList();

    while (items.Count > 0)
    {
        yield return items[0].Item2.Current;

        var next = items[0];
        items.RemoveAt(0);
        if (next.Item2.MoveNext())
        {
            var value = orderFunc(next.Item2.Current);
            var ii = 0;
            for (; ii < items.Count; ++ii)
            {
                if (value.CompareTo(items[ii].Item1) <= 0)
                {   //NB: using a tuple to minimize calls to orderFunc
                    items.Insert(ii, Tuple.Create(value, next.Item2));
                    break;
                }
            }

            if (ii == items.Count) items.Add(Tuple.Create(value, next.Item2));
        }
        else next.Item2.Dispose(); //woops! can't forget IDisposable
    }
}

Schön, es ist viel sauberer und führt ein wenig besser als meine schreckliche version. Wenn Sie darüber nachdenken, eine andere version zögern Sie nicht, aktualisieren Sie Ihre Antwort. danke!
Die Letzte cut MergePreserveOrder2 ist w linear.r.t. Anzahl von Personen oder Listen. Mein original und dein original sind beide viel viel schlimmer in Bezug auf Wachstum.
Ok, ich denke, das ist die beste Lösung nach meinen Bedürfnissen. Der Algorithmus scheint führen Sie nur notwendige Operationen, die wahrscheinlich optimal im Sinne der Vorstellungen, und ist immer noch einfach zu Lesen/verstehen.
Würde nicht items.Any() viel schneller als items.Count in einer Vielzahl von Situationen? Es ist wahrscheinlich ein bisschen langsamer, für in-memory-Listen, aber wenn einer der Enumeratoren sind wirklich lazy loading oder mit yield, dann .Any() sollte viel schneller sein.
items ist ein List<T>, so items.Count wird O(1).
Ich verglich die zweite Lösung für einige einfachere Lösungen und es hat nicht fair gut was Leistung und Performance betrifft. Ist mein test zu einfach? gist.github.com/3930708 und alicebobandmallory.com/articles/2012/10/18/...

InformationsquelleAutor user7116

11

Einen Versuch würde ich machen, die möglicherweise verbessern die Klarheit und Leistung ist diese:
- Erstellen einer Warteschlange über Paare von T, IEnumerable<T> geordnet nach Ihrer Vergleich-Funktion auf T
- Für jeden IEnumerable<T> zusammengeführt werden kann, fügen Sie das Element an die Warteschlange Priorität versehen mit einem Verweis auf die IEnumerable<T> wo es entstanden ist
- Während der priority-queue ist nicht leer
  - Extrahieren Sie das minimale element aus der priority queue
  - Voraus, die IEnumerable<T> in seiner Anmerkung zu dem nächsten element
  - Wenn MoveNext() true zurückgegeben, fügen Sie das nächste element der Warteschlange Priorität versehen mit einem Verweis auf die IEnumerable<T> Sie gerade fortgeschrittene
  - Wenn MoveNext() false zurückgegeben, don nichts hinzufügen, um die Warteschlange
  - Ertrag der aus der Warteschlange entfernten element
- Dies ist übrigens auch, wie würden Sie die Struktur einer gleichzeitigen mergesort.
- Ich habe eine solche Implementierung hier: svn.vkarlsen.no:81/public/filedetails.php?repname=LVK&path=/..., verwenden Sie Strg+F und Suche nach MergeSorted.
- Ähm, jup, genau so. Gut gemacht, Lasse.
- Beachten Sie, dass so ziemlich jede Nutzung von IEnumerable in diese Antwort sollte eigentlich IEnumerator. Sie nicht Voraus, einen IEnumerable Sie einfach nur ein IEnumerator aus ihm heraus. Sie Voraus eine IEnumerator. Sie brauchen auch nicht zu haben Tuple<T, IEnumerator<T>>, können Sie auch einfach einen IEnumerator<T> und verwenden IEnumerator.Current Wann immer Sie möchten, das aktuelle Element in der Sequenz.
InformationsquelleAutor Doug McClean

Hier ist eine Lösung, die sehr gut die Komplexität-Analyse-und das ist wesentlich kürzer als die anderen vorgeschlagenen Lösungen.

public static IEnumerable<T> Merge<T>(this IEnumerable<IEnumerable<T>> self) 
    where T : IComparable<T>
{
    var es = self.Select(x => x.GetEnumerator()).Where(e => e.MoveNext());
    var tmp = es.ToDictionary(e => e.Current);
    var dict = new SortedDictionary<T, IEnumerator<T>>(tmp);
    while (dict.Count > 0)
    {
        var key = dict.Keys.First();
        var cur = dict[key];
        dict.Remove(key);
        yield return cur.Current;
        if (cur.MoveNext())
            dict.Add(cur.Current, cur);                    
    }
}

sieht auch wie die Speicherauslastung wäre sehr gering
Diese Umsetzung wird scheitern, wenn zwei Elemente als gleich verglichen werden, sind in zwei verschiedenen Sequenzen. (Entweder bei es.ToDictionary oder dict.Hinzufügen). Wenn das ist eine Möglichkeit, die Sie brauchen, um eine echte Priorität.
Rufen Sie die Dispose() auf Ihrem Zähler

InformationsquelleAutor cdiggins

5

Wie viele Listen, die Sie erwarten zu müssen, um zu fusionieren? Es sieht aus wie dein Algorithmus nicht effizient, wenn Sie viele verschiedene Listen zu verschmelzen. Diese Zeile ist das Problem:
```
var min = enumerators.OrderBy(t => orderBy(t.Value)).FirstOrDefault();
```
Dieser wird ausgeführt, sobald die für jedes element in allen Listen, so dass Ihre Laufzeit in O(n * m), wobei n die GESAMTZAHL der Elemente in allen Listen, und n ist die Anzahl der Listen. Ausgedrückt in der durchschnittlichen Länge einer Liste in der Liste von Listen, die Laufzeit ist O(a * m^2).

Wenn Sie gehen zu müssen, verbinden eine Menge von Listen, würde ich vorschlagen, mit einem heap. Dann in jeder iteration können Sie den kleinsten Wert aus dem heap, und fügen Sie das nächste element auf dem heap aus der Liste, der kleinste Wert kam.
- Das ist eine gute Beobachtung. Aber ich würde sagen, dass die Listen zu verschmelzen, sind wahrscheinlich zu 2 - 10 in den meisten.
- +1, vorausgesetzt, du meinst ein heap als priority queue-Implementierung
- cdiggins Antwort verwendet diese heap Stil, aber hat den code :p
InformationsquelleAutor Daniel Plaisted
5

Hier ist eine Lösung OHNE SORTIERUNG ... nur die minimale Anzahl von vergleichen. (Ich weggelassen, um tatsächliche func übergeben, für die Einfachheit). Aktualisiert zu bauen, einen ausgeglichenen Baum:-
```
    ///<summary>
    ///Merge a pair of ordered lists
    ///</summary>
    public static IEnumerable<T> Merge<T>(IEnumerable<T> aList, IEnumerable<T> bList)
        where T:IComparable<T>
    {
        var a = aList.GetEnumerator();
        bool aOK = a.MoveNext();

        foreach (var b in bList)
        {
            while (aOK && a.Current.CompareTo(b) <= 0) {yield return a.Current; aOK = a.MoveNext();}
            yield return b;
        }
        //And anything left in a
        while (aOK) { yield return a.Current; aOK = a.MoveNext(); }
    }

    ///<summary>
    ///Merge lots of sorted lists
    ///</summary>
    public static IEnumerable<T> Merge<T>(IEnumerable<IEnumerable<T>> listOfLists)
        where T : IComparable<T>
    {
        int n = listOfLists.Count();
        if (n < 2) 
            return listOfLists.FirstOrDefault();
        else
            return Merge (Merge(listOfLists.Take(n/2)), Merge(listOfLists.Skip(n/2)));
    }


public static void Main(string[] args)
{

    var sample = Enumerable.Range(1, 5).Select((i) => Enumerable.Range(i, i+5).Select(j => string.Format("Test {0:00}", j)));

    Console.WriteLine("Merged:");
    foreach (var result in Merge(sample))
    {
        Console.WriteLine("\t{0}", result);
    }
```
- listOfLists.FirstOrDefault() <- die Elemente dieser Liste aufgezählt werden m-mal, wobei m die Anzahl der Listen, die zusammengeführt werden. joelonsoftware.com/articles/fog0000000319.html
- Dies ist eine sehr clevere Lösung ... und es ist schnell für eine kleine Menge von Listen, auch. @Craig: Er verdient mehr, als ein einfaches "Das ist, wie ich es getan hätte". Aber für viele Listen es wird schlechter.
- Was wolltest du mir sagen? Er schlug vor, eine Lösung, die sahen meinen sehr ähnlich. Daher habe ich die nicht posten, die gleiche Sache zweimal. sicher, in der Merge-listOfLists routine, ständig baut ein weiteres Durchlaufen würde wahrscheinlich schneller sein, aber wie viele Listen reden wir hier eigentlich? Vorzeitige Optimierung kann ein problem sein. Das ist eine tote einfache Lösung, faul aufgezählt und löst das problem.
- nehmen Sie noch einmal mit verbesserter balanced tree-Ansatz.
- Es muss nicht mehr übersetzen ^^ Keine überlastung der Merge() nimmt zwei IEnumerables. Aber ich denke, dass das nicht hilft anyfurther - das problem mit deinem Ansatz ist, dass der Vergleich zwischen den Elementen der verschiedenen Listen ist ein großer Aufwand (siehe Daniel ' s Antwort). Aber auch dies geschieht nur für eine große Menge von Listen (2-5 sicherlich kein Problem sein).
- Rufen Sie die Dispose() auf Ihrem Zähler
InformationsquelleAutor Ian Mercer

Hier ist meine Lösung:

Der Algorithmus nimmt die erste element jeder Liste und legt Sie in eine kleine helper-Klasse (eine sortierte Liste, die akzeptiert mehrere Elemente mit dem gleichen Wert). Diese sortierte Liste verwendet eine binary einfügen.

Also das erste element in dieser Liste ist das element, wir wollen zurück weiter. Danach entfernen wir es aus der sortierten Liste aus, und legen Sie das nächste element aus der ursprünglichen Quelle Liste (zumindest so lange, wie diese Liste enthält mehr Elemente). Wieder können wir das erste element unserer sortierten Liste. Wenn die sortierte Liste leer ist, sobald wir verwendet alle element aus verschiedenen Quell-Listen und sind fertig.

Diese Lösung verbraucht weniger foreach Aussagen und keine OrderBy in jedem Schritt - verbessert das Laufzeitverhalten. Nur die Binärdatei einfügen getan werden muss, wieder und wieder.

IEnumerable<T> MergeOrderedLists<T, TOrder>( IEnumerable<IEnumerable<T>> orderedlists, Func<T, TOrder> orderBy )
{
    //Get an enumerator for each list, create a sortedList
    var enumerators = orderedlists.Select( enumerable => enumerable.GetEnumerator() );
    var sortedEnumerators = new SortedListAllowingDoublets<TOrder, IEnumerator<T>>();

    //Point each enumerator onto the first element
    foreach( var enumerator in enumerators )
    {
        //Missing: assert true as the return value
        enumerator.MoveNext();

        // Initially add the first value
        sortedEnumerators.AddSorted( orderBy( enumerator.Current ), enumerator );
    }

    //Continue as long as we have elements to return
    while( sortedEnumerators.Count != 0 )
    {
        //The first element of the sortedEnumerator list always
        //holds the next element to return
        var enumerator = sortedEnumerators[0].Value;

        //Return this enumerators current value
        yield return enumerator.Current;

        //Remove the element we just returned
        sortedEnumerators.RemoveAt( 0 );

        //Check if there is another element in the list of the enumerator
        if( enumerator.MoveNext() )
        {
            //Ok, so add it to the sorted list
            sortedEnumerators.AddSorted( orderBy( enumerator.Current ), enumerator );
        }
    }

Mein Helfer-Klasse (mit Hilfe eines einfachen binären einfügen):

private class SortedListAllowingDoublets<TOrder, T> : Collection<KeyValuePair<TOrder, T>> where T : IEnumerator
{
    public void AddSorted( TOrder value, T enumerator )
    {
        Insert( GetSortedIndex( value, 0, Count - 1 ), new KeyValuePair<TOrder, T>( value, enumerator ) );
    }

    private int GetSortedIndex( TOrder item, int startIndex, int endIndex )
    {
        if( startIndex > endIndex )
        {
            return startIndex;
        }
        var midIndex = startIndex + ( endIndex - startIndex ) / 2;
        return Comparer<TOrder>.Default.Compare( this[midIndex].Key, item ) < 0 ? GetSortedIndex( item, midIndex + 1, endIndex ) : GetSortedIndex( item, startIndex, midIndex - 1 );
    }
}

Was nicht umgesetzt und jetzt: überprüfen Sie, ob eine leere Liste, die wird Probleme verursachen.

Und die SortedListAllowingDoublets Klasse verbessert werden könnten, nehmen einen comparer, anstatt die Comparer<TOrder>.Default auf seine eigenen.

Dies ist zumindest eine Bestellung eleganter als meine. Ich mag es.
Haben Sie versucht, mit einer verlinkten Liste anstelle einer Sammlung? Es scheint, wie es könnte schneller sein.
Nein, ich habe nicht versucht, eine verknüpfte Liste. Diese Antwort ist eine Lösung, die ich nur codiert für die OP - ich habe nicht einen profiler verwenden, zu. Aber ich bin sehr optimistisch, dass es ist ein schneller Algorithmus (die jedoch weiter verbessert werden kann ^^)

InformationsquelleAutor tanascius

Meine version von sixlettervariables Antwort. Ich reduzierte die Anzahl der Aufrufe orderFunc (jedes element nur durchläuft orderFunc einmal), und im Fall von Bindungen, die Sortierung übersprungen. Dieser ist optimiert für eine kleine Zahl von Quellen, die eine größere Anzahl von Elementen innerhalb jeder Quelle und möglicherweise eine teure orderFunc.

public static IEnumerable<T> MergePreserveOrder<T, TOrder>(
  this IEnumerable<IEnumerable<T>> sources, 
  Func<T, TOrder> orderFunc)  
  where TOrder : IComparable<TOrder> 
{
  Dictionary<TOrder, List<IEnumerable<T>>> keyedSources =
    sources.Select(source => source.GetEnumerator())
      .Where(e => e.MoveNext())
      .GroupBy(e => orderFunc(e.Current))
      .ToDictionary(g => g.Key, g => g.ToList()); 

  while (keyedSources.Any())
  {
     //this is the expensive line
    KeyValuePair<TOrder, List<IEnumerable<T>>> firstPair = keyedSources
      .OrderBy(kvp => kvp.Key).First();

    keyedSources.Remove(firstPair.Key);
    foreach(IEnumerable<T> e in firstPair.Value)
    {
      yield return e.Current;
      if (e.MoveNext())
      {
        TOrder newKey = orderFunc(e.Current);
        if (!keyedSources.ContainsKey(newKey))
        {
          keyedSources[newKey] = new List<IEnumerable<T>>() {e};
        }
        else
        {
          keyedSources[newKey].Add(e);
        }
      }
    }
  }
}

Bin ich Wetten könnte dies weiter verbessert werden, indem ein SortedDictionary, bin aber nicht mutig genug, zu versuchen, eine Lösung, bei der man ohne einen editor.

Verwenden Sie ein Wörterbuch/ - Liste Kombination zum Sortieren der Elemente - ich bin nicht sicher, über das erstellen eines eigenen List für jeden Wert. Die OP sagt, dass er will, um große Listen Sortieren - also die Initialisierung von so vielen Listen ein problem sein könnte. Ich hatte eine Lösung mit einer SortedDictionary, aber der Schlüssel muss eindeutig sein - so muss der Wert einer Sammlung wieder. Das ist, warum ich beschlossen, mit einer einzigen Liste, die ist in der Lage, mehrere Schlüssel enthalten (und nutzt schnelle binäre Suche)
Guter Punkt, es ist nicht schwer zu pool-Listen.

InformationsquelleAutor Amy B

Hier ist eine Linq-freundliche Lösung, basierend auf dem Wintellect ist OrderedBag:

public static IEnumerable<T> MergeOrderedLists<T, TOrder>(this IEnumerable<IEnumerable<T>> orderedLists, Func<T, TOrder> orderBy)
    where TOrder : IComparable<TOrder>
{
    var enumerators = new OrderedBag<IEnumerator<T>>(orderedLists
        .Select(enumerable => enumerable.GetEnumerator())
        .Where(enumerator => enumerator.MoveNext()),
        (x, y) => orderBy(x.Current).CompareTo(orderBy(y.Current)));
    while (enumerators.Count > 0)
    {
        IEnumerator<T> minEnumerator = enumerators.RemoveFirst();
        T minValue = minEnumerator.Current;
        if (minEnumerator.MoveNext())
            enumerators.Add(minEnumerator);
        else
            minEnumerator.Dispose();
        yield return minValue;
    }
}

Wenn Sie eine Enumerator-basierte Lösung, vergessen Sie nicht zu nennen Dispose()

Und hier ist ein einfacher test:

[Test]
public void ShouldMergeInOrderMultipleOrderedListWithDuplicateValues()
{
    //given
    IEnumerable<IEnumerable<int>> orderedLists = new[]
    {
        new [] {1, 5, 7},
        new [] {1, 2, 4, 6, 7}
    };

    //test
    IEnumerable<int> merged = orderedLists.MergeOrderedLists(i => i);

    //expect
    merged.ShouldAllBeEquivalentTo(new [] { 1, 1, 2, 4, 5, 6, 7, 7 });
}

InformationsquelleAutor Laymain

Diese sieht aus wie eine furchtbar nützliche Funktion zu haben, um, so habe ich beschlossen, nehmen Sie einen Stich an Sie. Mein Ansatz ist ein viel wie heightechrider, dass es bricht, das problem in das Zusammenführen von zwei sortierten IEnumerables in einem, dann mit ein und verbindet es mit dem nächsten in der Liste. Es ist wahrscheinlich eine Optimierung, die Sie tun können, es funktioniert aber mit meiner einfachen testcase:

      public static IEnumerable<T> mergeSortedEnumerables<T>(
            this IEnumerable<IEnumerable<T>> listOfLists, 
            Func<T, T, Boolean> func)
      {
            IEnumerable<T> l1 = new List<T>{};
            foreach (var l in listOfLists)
            {
                 l1 = l1.mergeTwoSorted(l, func);
            }

            foreach (var t in l1)
            {
                 yield return t;
            }
      }

      public static IEnumerable<T> mergeTwoSorted<T>(
            this IEnumerable<T> l1, 
            IEnumerable<T> l2, 
            Func<T, T, Boolean> func)
      {
            using (var enumerator1 = l1.GetEnumerator())
            using (var enumerator2 = l2.GetEnumerator())
            {
                 bool enum1 = enumerator1.MoveNext();
                 bool enum2 = enumerator2.MoveNext();
                 while (enum1 || enum2)
                 {
                      T t1 = enumerator1.Current;
                      T t2 = enumerator2.Current;

                      //if they are both false
                      if (!enum1 && !enum2)
                      {
                            break;
                      }
                      //if enum1 is false
                      else if (!enum1)
                      {
                            enum2 = enumerator2.MoveNext();
                            yield return t2;

                      }
                      //if enum2 is false
                      else if (!enum2)
                      {
                            enum1 = enumerator1.MoveNext();
                            yield return t1;

                      }
                      //they are both true
                      else
                      {
                            //if func returns true then t1 < t2
                            if (func(t1, t2))
                            {
                                 enum1 = enumerator1.MoveNext();
                                 yield return t1;

                            }
                            else
                            {
                                 enum2 = enumerator2.MoveNext();
                                 yield return t2;

                            }
                      }
                 }
            }
      }

Dann, um es zu testen:

                List<int> ws = new List<int>() { 1, 8, 9, 16, 17, 21 };
                List<int> xs = new List<int>() { 2, 7, 10, 15, 18 };
                List<int> ys = new List<int>() { 3, 6, 11, 14 };
                List<int> zs = new List<int>() { 4, 5, 12, 13, 19, 20 };
                List<IEnumerable<int>> lss = new List<IEnumerable<int>> { ws, xs, ys, zs };

                foreach (var v in lss.mergeSortedEnumerables(compareInts))
                {
                     Console.WriteLine(v);
                }

InformationsquelleAutor cirons42

Wurde ich gefragt diese Frage eine interview-Frage an diesem Abend nicht und haben eine tolle Antwort in 20 Minuten oder so zugeteilt. Also habe ich mich gezwungen zu schreiben, ein Algorithmus, ohne irgendetwas zu suchen. Die Einschränkung war, dass die Eingänge wurden bereits sortiert sind. Hier ist mein code:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

namespace Merger
{
  class Program
  {
    static void Main(string[] args)
    {
      int[] a = { 1, 3, 6, 102, 105, 230 };
      int[] b = { 101, 103, 112, 155, 231 };

      var mm = new MergeMania();

      foreach(var val in mm.Merge<int>(a, b))
      {
        Console.WriteLine(val);
      }
      Console.ReadLine();
    }
  }

  public class MergeMania
  {
    public IEnumerable<T> Merge<T>(params IEnumerable<T>[] sortedSources) 
      where T : IComparable
    {
      if (sortedSources == null || sortedSources.Length == 0) 
        throw new ArgumentNullException("sortedSources");

      //1. fetch enumerators for each sourc
      var enums = (from n in sortedSources 
             select n.GetEnumerator()).ToArray();

      //2. fetch enumerators that have at least one value
      var enumsWithValues = (from n in enums 
                   where n.MoveNext() 
                   select n).ToArray();
      if (enumsWithValues.Length == 0) yield break; //nothing to iterate over

      //3. sort by current value in List<IEnumerator<T>>
      var enumsByCurrent = (from n in enumsWithValues 
                  orderby n.Current 
                  select n).ToList();
      //4. loop through
      while (true)
      {
        //yield up the lowest value
        yield return enumsByCurrent[0].Current;

        //move the pointer on the enumerator with that lowest value
        if (!enumsByCurrent[0].MoveNext())
        {
          //remove the first item in the list
          enumsByCurrent.RemoveAt(0);

          //check for empty
          if (enumsByCurrent.Count == 0) break; //we're done
        }
        enumsByCurrent = enumsByCurrent.OrderBy(x => x.Current).ToList();
      }
    }
  }
}

Hoffe, es hilft.

InformationsquelleAutor Tyler Jensen

Den Versuch, die auf @cdiggins ist Antwort.
Diese Implementierung funktioniert, wenn zwei Elemente als gleich verglichen werden, sind in zwei unterschiedlichen Sequenzen (ich. e. nicht die Fehler erwähnt, die von @ChadHenderson).

Wird der Algorithmus beschrieben in der Wikipedia, die Komplexität ist O(m log n), wo n wird die Anzahl der Listen, die zusammengeführt und m ist die Summe der Längen der Listen.

Den OrderedBag<T> aus Wintellect.PowerCollections verwendet, anstatt eine heap-basierte priority queue, aber es ändert nichts an der Komplexität.

public static IEnumerable<T> Merge<T>(
   IEnumerable<IEnumerable<T>> listOfLists,
   Func<T, T, int> comparison = null)
{
   IComparer<T> cmp = comparison != null
      ? Comparer<T>.Create(new Comparison<T>(comparison))
      : Comparer<T>.Default;
   List<IEnumerator<T>> es = listOfLists
      .Select(l => l.GetEnumerator())
      .Where(e => e.MoveNext())
      .ToList();
   var bag = new OrderedBag<IEnumerator<T>>(
      (e1, e2) => cmp.Compare(e1.Current, e2.Current));
   es.ForEach(e => bag.Add(e));
   while (bag.Count > 0)
   {
      IEnumerator<T> e = bag.RemoveFirst();
      yield return e.Current;
      if (e.MoveNext())
      {
         bag.Add(e);
      }
   }
}

Vergessen Sie bitte nicht, rufen Sie Dispose() auf Ihrem Zähler

InformationsquelleAutor Gebb

Jede Liste zusammengeführt werden sollen, bereits sortiert. Diese Methode wird finden die gleichen Elemente in Bezug auf die Reihenfolge der Listen. Zum Beispiel, wenn Elemente Ti == Tj, und Sie werden jeweils aus der Liste i und Liste j (i < j), dann ist Ti vor Tj in das zusammengeführte Ergebnis.
Die Komplexität ist O(mn), wobei n die Anzahl der Listen, die zusammengeführt und m ist die Summe der Längen der Listen.

public static IEnumerable<T> Merge<T, TOrder>(this IEnumerable<IEnumerable<T>> TEnumerable_2, Func<T, TOrder> orderFunc, IComparer<TOrder> cmp=null)
{
    if (cmp == null)
    {
        cmp = Comparer<TOrder>.Default;
    }

    List<IEnumerator<T>> TEnumeratorLt = TEnumerable_2
       .Select(l => l.GetEnumerator())
       .Where(e => e.MoveNext())
       .ToList();

    while (TEnumeratorLt.Count > 0)
    {
        int intMinIndex;
        IEnumerator<T> TSmallest = TEnumeratorLt.GetMin(TElement => orderFunc(TElement.Current), out intMinIndex, cmp);
        yield return TSmallest.Current;

        if (TSmallest.MoveNext() == false)
        {
            TEnumeratorLt.RemoveAt(intMinIndex);
        }
    }
}

///<summary>
///Get the first min item in an IEnumerable, and return the index of it by minIndex
///</summary>
public static T GetMin<T, TOrder>(this IEnumerable<T> self, Func<T, TOrder> orderFunc, out int minIndex, IComparer<TOrder> cmp = null)
{
    if (self == null) throw new ArgumentNullException("self");            

    IEnumerator<T> selfEnumerator = self.GetEnumerator();
    if (!selfEnumerator.MoveNext()) throw new ArgumentException("List is empty.", "self");

    if (cmp == null) cmp = Comparer<TOrder>.Default;

    T min = selfEnumerator.Current;
    minIndex = 0;
    int intCount = 1;
    while (selfEnumerator.MoveNext ())
    {
        if (cmp.Compare(orderFunc(selfEnumerator.Current), orderFunc(min)) < 0)
        {
            min = selfEnumerator.Current;
            minIndex = intCount;
        }
        intCount++;
    }

    return min;
}

Entfernen Sie die 4 Räume aus allen Zeilen: Wählen Sie den gesamten code und drücken Sie die {} - Taste. Es ist ein Knebel, den Sie sehen.

InformationsquelleAutor pengdlzn

Habe ich nahm einen mehr funktionalen Ansatz, hoffe das liest sich gut.

Hier ist zunächst einmal die merge-Methode selbst:

public static IEnumerable<T> MergeSorted<T>(IEnumerable<IEnumerable<T>> xss) where T :IComparable
{
    var stacks = xss.Select(xs => new EnumerableStack<T>(xs)).ToList();

    while (true)
    {
        if (stacks.All(x => x.IsEmpty)) yield break;

        yield return 
            stacks
                .Where(x => !x.IsEmpty)
                .Select(x => new { peek = x.Peek(), x })
                .MinBy(x => x.peek)
                .x.Pop();
    }
}

Die Idee ist, dass wir jeden IEnumerable in EnumerableStack hat Peek(), Pop() und IsEmpty Mitglieder.

Es funktioniert wie eine normale stack. Beachten Sie, dass der Aufruf IsEmpty könnte aufzählen gewickelt IEnumerable.

Hier ist der code:

///<summary>
///Wraps IEnumerable in Stack like wrapper
///</summary>
public class EnumerableStack<T>
{
    private enum StackState
    {
        Pending,
        HasItem,
        Empty
    }

    private readonly IEnumerator<T> _enumerator;

    private StackState _state = StackState.Pending;

    public EnumerableStack(IEnumerable<T> xs)
    {
        _enumerator = xs.GetEnumerator();
    }

    public T Pop()
    {
        var res = Peek(isEmptyMessage: "Cannot Pop from empty EnumerableStack");
        _state = StackState.Pending;
        return res;
    }

    public T Peek()
    {
        return Peek(isEmptyMessage: "Cannot Peek from empty EnumerableStack");
    }

    public bool IsEmpty
    {
        get
        {
            if (_state == StackState.Empty) return true;
            if (_state == StackState.HasItem) return false;
            ReadNext();
            return _state == StackState.Empty;
        }
    }

    private T Peek(string isEmptyMessage)
    {
        if (_state != StackState.HasItem)
        {
            if (_state == StackState.Empty) throw new InvalidOperationException(isEmptyMessage);
            ReadNext();
            if (_state == StackState.Empty) throw new InvalidOperationException(isEmptyMessage);
        }
        return _enumerator.Current;
    }

    private void ReadNext()
    {
        _state = _enumerator.MoveNext() ? StackState.HasItem : StackState.Empty;
    }
}

Schließlich, hier ist der MinBy Erweiterung Methode im Falle noch nicht geschrieben man auf der eigenen schon:

public static T MinBy<T, TS>(this IEnumerable<T> xs, Func<T, TS> selector) where TS : IComparable
{
    var en = xs.GetEnumerator();
    if (!en.MoveNext()) throw new Exception();

    T max = en.Current;
    TS maxVal = selector(max);
    while(en.MoveNext())
    {
        var x = en.Current;
        var val = selector(x);
        if (val.CompareTo(maxVal) < 0)
        {
            max = x;
            maxVal = val;
        }
    }

    return max;
}

InformationsquelleAutor Nikolay Gusev

Dies ist eine Alternative Lösung:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Reflection;
using System.Data;
using System.Text.RegularExpressions;

namespace ConsoleApplication1
{

    class Person
    {
        public string Name
        {
            get;
            set;
        }

        public int Age
        {
            get;
            set;
        }
    }

    public class Program
    {
        public static void Main()
        {
            Person[] persons1 = new Person[] { new Person() { Name = "Ahmed", Age = 20 }, new Person() { Name = "Ali", Age = 40 } };
            Person[] persons2 = new Person[] { new Person() { Name = "Zaid", Age = 21 }, new Person() { Name = "Hussain", Age = 22 } };
            Person[] persons3 = new Person[] { new Person() { Name = "Linda", Age = 19 }, new Person() { Name = "Souad", Age = 60 } };

            Person[][] personArrays = new Person[][] { persons1, persons2, persons3 };

            foreach(Person person in MergeOrderedLists<Person, int>(personArrays, person => person.Age))
            {
                Console.WriteLine("{0} {1}", person.Name, person.Age);
            }

            Console.ReadLine();
        }

        static IEnumerable<T> MergeOrderedLists<T, TOrder>(IEnumerable<IEnumerable<T>> orderedlists, Func<T, TOrder> orderBy)
        {
            List<IEnumerator<T>> enumeratorsWithData = orderedlists.Select(enumerable => enumerable.GetEnumerator())
                                                                   .Where(enumerator => enumerator.MoveNext()).ToList();

            while (enumeratorsWithData.Count > 0)
            {
                IEnumerator<T> minEnumerator = enumeratorsWithData[0];
                for (int i = 1; i < enumeratorsWithData.Count; i++)
                    if (((IComparable<TOrder>)orderBy(minEnumerator.Current)).CompareTo(orderBy(enumeratorsWithData[i].Current)) >= 0)
                        minEnumerator = enumeratorsWithData[i];

                yield return minEnumerator.Current;

                if (!minEnumerator.MoveNext())
                    enumeratorsWithData.Remove(minEnumerator);
            }             
        }
    }   
}

InformationsquelleAutor Tarik

-2

Ich bin misstrauisch LINQ ist smart genug, um die Vorteile der vor bestehende Sortierung:
```
IEnumerable<string> BiggerSortedList =  BigListOne.Union(BigListTwo).OrderBy(s => s);
```
- Auf jeden IEnumerable im Allgemeinen? Ich bezweifle es.
- Hat Union erhalten Duplikate, wenn? Ich weiß, UNION in SQL nicht.
- Es scheint unmöglich, zu wissen, dass. Mit OrderBy führt eine Art, die verbraucht alle Speicher-etwas, das ich gerne vermeiden möchte
- Union verzögert und verursacht keine dupes.
- Verwenden Concat statt der Union zu bewahren alle Elemente der Quellen. Auch Dies ist eine vollständige re-Bestellung und nutzt nicht die Vorteile der Vorsortierung.
- Wenn Union nicht erhalten dupes, dann, dass nicht Arbeit für franck, richtig?
InformationsquelleAutor Brent Arias

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.