Große Ausführungszeit Unterschied zwischen java Lambda-vs Anonyme Klasse

War ich neugierig auf die Leistung der Schaffung von java8 lambda-Instanzen, gegen die gleiche anonyme Klasse. (Messung erfolgt auf win32-java build 1.8.0-ea-b106). Ich habe sehr einfaches Beispiel, und gemessen wenn java vorschlagen, einige Optimierung von new Bediener beim erstellen lambda-Ausdruck:

static final int MEASURES = 1000000;
static interface ICallback{
    void payload(int[] a);
}
/**
* force creation of anonymous class many times
*/
static void measureAnonymousClass(){
    final int arr[] = {0};
    for(int i = 0; i < MEASURES; ++i){
        ICallback clb = new ICallback() {
            @Override
            public void payload(int[] a) {
                a[0]++;
            }
        };
        clb.payload(arr);
    }
}
/**
* force creation of lambda many times 
*/
static void measureLambda(){ 
    final int arr[] = {0};
    for(int i = 0; i < MEASURES; ++i){
        ICallback clb = (a2) -> {
            a2[0]++;
        };
        clb.payload(arr);
    }
}

(Vollständigen code können dort getroffen werden: http://codepad.org/Iw0mkXhD) Das Ergebnis ist eher vorhersehbar - lambda gewinnt 2 mal.

Aber wirklich wenig zu verschieben, um Verschluss zeigt sehr schlechte Zeit für die lambda. Anonyme Klasse gewinnt 10 mal!!!
So, jetzt anonyme Klasse sieht wie folgt aus:

ICallback clb = new ICallback() {
        @Override
        public void payload() {
            arr[0]++;
        }
    };

Lambda funktioniert wie folgt:

ICallback clb = () -> {
            arr[0]++;
        };

(Vollständigen code können dort getroffen werden: http://codepad.org/XYd9Umty )
Kann jemand mir erklären, warum existiert so groß (schlecht) Unterschied im Umgang mit der Schließung?

Das ist ein sehr naiver Ansatz zu microbenchmarking. Zumindest verwenden System.nanoTime und die Einführung der " Wegwerf-Ausführungen zum Aufwärmen der JVM. Mehrere System.gc() Anrufe zwischen den Ausführungen wäre auch eine gute Idee. Idealerweise tun Sie dies mit Google Bremssattel oder Oracle-jmh.
eigentlich habe ich vorgesehen, dieser Hinweis, dass ist der Grund, warum ich 2 Messungen durchgeführt, wenn measureLambda zuerst ausgeführt, und wenn measureLambda läuft nach measureAnonymousClass - ohne Auswirkungen auf alle! Und nanoTime zeigen können, Unterschied in der genauen Messung, aber nicht wenn ich Rede 10 mal
Meinst du 10 Sekunden? Auch, es hätte geholfen, wenn Sie enthalten den Hinweis zum ausführen von sowohl Auftragseingang als im text Ihrer Frage.
oh Nein, für meine CPU: für den ersten Fall (wo die lambda gewinnt) 7ms vs 14ms, für den zweiten Fall (mit Verschluss wo die lambda verlieren) 160ms vs 20ms. Die änderung der Bestellung hat keinen Einfluss auf gemessene Zeit.
Die Genauigkeit der currentTimeMillis ist oft auf dem Niveau von einem Zehntel einer Sekunde (Plattform-abhängig). Die Genauigkeit der nanoTime ist in der Regel auf der Ebene einer Mikrosekunde. Auch, nur die Neuordnung Ausführungen beweist gar nichts: jeder code-Pfad muss erwärmt werden, bis auf seine eigenen. Warm-up-Ausführungen ist der Weg, es zu tun und garbage collection muss überwacht werden, für.
Sie erstellen ein neues Objekt in jeder iteration, dann ist das eine riesige Anzahl von Objekten. Sie wenig tun, außer, dass (nur eine Methode aufrufen, die hat einen trivialen operation). GC konnte noch Dominieren die insgesamt verbrachte Zeit.
es ist kein Problem mit den GC - da beide Fälle DIE GLEICHE ANZAHL VON ZUWEISUNGEN. Erste Programm nicht verwenden Schließung zweite Programm verwenden. Hast du jemals versucht zu verstehen, was die beiden Programme machen? Ich bin ganz damit einverstanden, dass viel Zeit damit verbracht wird, von GC, aber die gleiche Zeit in beiden Programmen! So ist dieses ständige Abweichung und keinen Unterschied, ob ich dies Messen mit warm-up oder mit nano - Messung. Nur zum Beweis meiner position, die ich gelegt habe, empfehlen Sie Google Bremssattel und warm-up! SIE KOMMENTARE SIND IRRELEVANT, weil die relative Anzahl der gleichzeitig x2 und x10.
Hast du eigentlich Messen der GC-overhead, oder sind Sie nur raten? Winkende Hände und schrie, dass GC mal das gleiche mit absolut keinen festen Beweis ist nicht der Weg zur Erleuchtung. Zuweisungen sind gemessen in bytes, nicht in der Zuteilung rechnen. Sie haben zumindest eine solide Beweis dafür, dass in beiden Fällen die gleiche Anzahl von bytes ist reserviert?
"Ich habe empfehlen Sie Google Bremssattel und warm-up!" --- Ich verstehe nicht diese Satz.
Vielleicht fehlt der Punkt, der meine Kommentare so weit: es ist die Fälschung einer Reihe von standard-Hypothesen über die häufigsten Fehlerquellen beim benchmarking auf der JVM. Nur wenn Sie die solide gelöscht, können Sie geben Sie eine ernsthafte Diskussion der Ergebnisse.
Beachten Sie, dass, neben der Tatsache, dass dieser "benchmark" ist weit entfernt von der beabsichtigten Anwendungsfall, nur die Angabe der -server option bei JVM-start wird die aufgenommene overhead gehen ganz Weg.
habe gerade versucht deine Empfehlung und bekommen genau das gleiche Ergebnis wie für reguläre JRE. Schließung in lambda langsamer als Verschluss für die anonyme Klasse in der Nähe der 10-mal.

InformationsquelleAutor Dewfy | 2013-09-25

27

UPDATE

Einige Kommentare Wundern, wenn mein benchmark unten war fehlerhaft - nach der Einführung eine Menge von Zufälligkeiten (um zu verhindern, dass die JIT-Optimierung zu viel Zeug), noch bekomme ich ähnliche Ergebnisse, so Neige ich zu denken, es ist ok.

In der Zwischenzeit, ich bin gekommen, über diese Präsentation durch das lambda-team für die Umsetzung. Seite 16 zeigt einige Kennzahlen: innere Klassen und-Verschlüsse haben eine ähnliche Leistung /nicht-Erfassung von lambda sind bis zu 5x schneller.

Und @StuartMarks gepostet sehr interessanter link, die seziert lambda performance. Die Quintessenz ist, dass die post die JIT-Kompilierung, Lambda-Ausdrücke und anonyme Klassen führen in ähnlicher Weise auf aktuelle Hostpot JVM-Implementierungen.

IHRE BENCHMARK

Habe ich auch Ihr testen, wie du es gepostet hast. Das problem ist, dass es ausgeführt wird, für so wenig wie 20 ms für die erste Methode, und 2 ms für die zweite. Das ist zwar im Verhältnis 10:1, es ist in keiner Weise repräsentativ, da die Messzeit ist viel zu klein.

Habe ich dann modifiziert Ihr test, um zu ermöglichen, weitere JIT-warmup und ich ähnliche Ergebnisse erhalten wie mit jmh (d.h. kein Unterschied zwischen anonyme Klasse und lambda-Ausdruck).
```
public class Main {

    static interface ICallback {
        void payload();
    }
    static void measureAnonymousClass() {
        final int arr[] = {0};
        ICallback clb = new ICallback() {
            @Override
            public void payload() {
                arr[0]++;
            }
        };
        clb.payload();
    }
    static void measureLambda() {
        final int arr[] = {0};
        ICallback clb = () -> {
            arr[0]++;
        };
        clb.payload();
    }
    static void runTimed(String message, Runnable act) {
        long start = System.nanoTime();
        for (int i = 0; i < 10_000_000; i++) {
            act.run();
        }
        long end = System.nanoTime();
        System.out.println(message + ":" + (end - start));
    }
    public static void main(String[] args) {
        runTimed("as lambdas", Main::measureLambda);
        runTimed("anonymous class", Main::measureAnonymousClass);
        runTimed("as lambdas", Main::measureLambda);
        runTimed("anonymous class", Main::measureAnonymousClass);
        runTimed("as lambdas", Main::measureLambda);
        runTimed("anonymous class", Main::measureAnonymousClass);
        runTimed("as lambdas", Main::measureLambda);
        runTimed("anonymous class", Main::measureAnonymousClass);
    }
}
```
Den letzten Lauf über 28 Sekunden für beide Methoden.

JMH MICRO-BENCHMARK

Habe ich der gleiche test mit jmh und die Quintessenz ist, dass die vier Methoden, die nehmen so viel Zeit, wie die entsprechenden:
```
void baseline() {
    arr[0]++;
}
```
In anderen Worten, die JIT-inlines-sowohl die anonyme Klasse und lambda-Ausdruck, und Sie nehmen genau die gleiche Zeit.

Zusammenfassung der Ergebnisse:
```
Benchmark                Mean    Mean error    Units
empty_method             1.104        0.043  nsec/op
baseline                 2.105        0.038  nsec/op
anonymousWithArgs        2.107        0.028  nsec/op
anonymousWithoutArgs     2.120        0.044  nsec/op
lambdaWithArgs           2.116        0.027  nsec/op
lambdaWithoutArgs        2.103        0.017  nsec/op
```
- Wirklich danke für Sie überprüfen. Ich habe nur re-run der code auf meinem comp und Holen Sie sich die absolut gleiche Nummer von meinem Beispiel oben: ... lambdaWithArgs...7.121 lambdaWithoutArgs....176.568, So was kann auf mein comp?
- Nicht sicher, um ehrlich zu sein - es kann vieles sein. Sie sollten beginnen, durch die Anwendung der richtigen warm-up vor Beginn der Messung, überwachung GC und Zusammenstellung stellen Sie sicher, Messen Sie an der kompilierte code und die überprüfung der Zeit, in der im GC.
- Ich habe gerade angefangen deinen code durch: mvn exec:java -Dexec.mainClass="com.assylias.performance.RunTest" - ist es richtige warm-up?
- bekommt man eine lange Ausgabe mit Warmup Iterationen und normale Iterationen sowie eine ähnliche Tabelle wie die Ergebnisse in meiner Antwort (d.h. jmh Ausgang)? Wenn Sie dann tun, ja, und ich muss erneut mein test, wenn Sie nicht die gleichen Ergebnisse erhalten!
- ja, ich habe in der Nähe von 8k Ausgabe vor dem Ergebnis
- Das würde ich zunächst überprüfen, hier ist die Laufzeit, wenn keine Zuordnung beteiligt ist. Ich würde auch nicht einige 1000 Iterationen innerhalb der test-Methode zu beseitigen overhead des Methodenaufrufs.
- BTW ich starte den benchmark einfach mit java -jar target/microbenchmarks.jar '.*' -wi <warmup_iterations> -i <main_iterations>. Ich bekomme nicht lange-Ausgang zum Aufwärmen, nur ein kurzer Hinweis "Warmup" iteration 1" etc.
- Ich Lauf mit annähernd den gleichen Möglichkeiten (siehe hier)
- leere Methode 1.1 ns, Methode, die nicht einfach die addition und gibt den Wert nimmt, 2.1 ns (das klingt vernünftig für eine variable Lesen + neben + variable schreiben) und die anonyme/lmabda Versionen nehmen 2.1 ns zu. Ich könnte versaut haben irgendwo...
- Das Ergebnis würde implizieren, dass der JIT vollständig eliminiert die Zuordnung der tatsächlichen lambda/anonyme Klasse Instanzen. Allerdings, wenn die OP ist, die verschiedene Ergebnisse, dann würde ich gehen Sie wie beschrieben vor: trennen Sie die Zuordnung von Aufruf, zu sehen, ob die Diskrepanz ist immer noch da.
- Mmmmm.... Ein paar Sachen verändert und es sieht aus wie der JIT killed my-test.... Haben wird, um erneut zu versuchen. Auf der anderen Seite das Ergebnis sinnvoll ist (der Betrieb ist nur wenige Zyklen und ist ein guter Kandidat für inlining)...
- Reran die ganze Sache mit einer guten portion Zufall - jede Methode dauert viel länger - aber Sie nehmen alle zur gleichen Zeit... ich denke, meine Ergebnisse sind ok - aber fühlen Sie sich frei zu teilen, Ihnen, wenn Sie Zeit haben, es zu versuchen.
- Ich habe nicht das JDK 8 einrichten... sonst würd ich nicht verbringen Zeit nur reden 🙂 hier Der Schlüssel sein könnte, escape-Analyse, die möglicherweise beseitigen Sie die dynamische Zuordnung. Sagen Sie das mit der Zufälligkeit gibt es noch keinen Unterschied zwischen der direkten Methode call (baseline) und indirekte Anrufe auf lambda/anonyme Instanzen? Vielleicht ist die Zufälligkeit nicht behindern, Flucht-Analyse. Die Art und Weise, es zu brechen ist, indem Sie die Instanz in eine ArrayList oder ähnliches.
- Wie auch immer, ich bin mir ziemlich sicher, dass OP große Diskrepanz ist durch eine code-Pfad, mit dem Vorteil, EA und die anderen gehen durch die full dynamic allocation. Ich sehe nichts anderes, was erklären würde einen Faktor von 10 und mehr.
- Wenn der code war eigentlich das man verknüpft die Frage, läuft es in weniger als 20 ms auf meinem Rechner, so dass das Ergebnis nicht stabil sein oder relevant sind. Einfach wiederholen Sie den test innerhalb der gleichen JVM-Sitzung hilft und so für genug warmup erhält ähnliche Ergebnisse wie das, was ich bekam zunächst.
- Wie Sie sehen können, habe ich versucht zu erklären, das gleiche zu OP 8 Stunden 🙂 Es gibt noch eine off-chance, dass auf seinem Rechner möglicherweise gibt es Abweichungen, aber es wird wieder einmal zu nichts mehr als das sehr spezielle resultierenden code in EA arbeiten für eine und nicht das andere. Ändern Sie winzig kleine Sache und die Wirkung ist Weg. Also mein Fazit ist, dass nichts wirklich groß werden hier gelernt. Wie auch immer, was ist der Unterschied bei der bytecode-Ebene zwischen dem anon-Klasse und die lambda? Beide kompilieren in der gleichen oder nahezu der gleichen Klasse, nicht wahr?
- Nop - anonyme Klasse verwendet invokespecial + innere Klasse vs. lambda verwendet, invokedynamic und erstellt nicht eine neue innere Klasse.
- Wow, ich hatte keine Ahnung, dass es verwendet dynamische Aufruf! Das öffnet die Möglichkeit, geringere Leistung, für den Versand selbst.
- Vielen Dank für das schreiben Sie Ihre performance-Untersuchungen. +1. Das original (meist Prototypen) JDK-8-Implementierung des lambda-war genau eine anonyme innere Klasse, um etwas zu bekommen, die Arbeit so früh, dass wir erforschen die Sprache und die Bibliothek der evolution. Dies scheint hervorgebracht haben ein Mythos, dass die lambdas sind nichts mehr als anonyme innere Klassen. Mehr vor kurzem die Implementierung wurde optimiert, so dass die lambda ist fast immer schneller als die "gleichwertigen" anonyme innere Klasse.
- Außerdem gibt es zwei große JVM-Sprache-Gipfel spricht von der Leistung der Jungs. Erste, Alexey Shipilev (Autor von jmh) spricht über das benchmarking und seine vielen Tücken. (Dies wurde zum besten Vortrag auf JVMLS in diesem Jahr.) Zweite, Sergey Kuksenko Gespräche über das, was er getan, zu optimieren lambda performance. [1] medianetwork.oracle.com/video/player/2630310904001 [2] medianetwork.oracle.com/video/player/2623576348001
- Hervorragende links - danke.
- Lassen Sie mich mitmachen mit Brian Goetz und die Folien aus seinem Gespräch über die Umsetzung des lambda in Java.
InformationsquelleAutor assylias

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.

UPDATE

IHRE BENCHMARK

JMH MICRO-BENCHMARK