Warum Tupeln nehmen weniger Platz im Speicher als Listen?

Einen tuple nimmt weniger Speicherplatz in Python:

>>> a = (1,2,3)
>>> a.__sizeof__()
48

in der Erwägung, dass lists braucht mehr Speicherplatz:

>>> b = [1,2,3]
>>> b.__sizeof__()
64

Was geschieht intern auf die Python Speicherverwaltung?

Ich bin mir nicht sicher, wie das intern funktioniert, aber die Liste Objekt hat zumindest mehr Funktionen, wie z.B. Anhängen, die die Tupel nicht haben. Es ist daher sinnvoll, wenn das Tupel als eine einfachere Art des Objekts, die kleiner sein
Ich denke, es hängt auch von Maschine zu Maschine ....für mich, wenn ich überprüfen a = (1,2,3) dauert 72 und b = [1,2,3] nimmt 88.
Python Tupel sind unveränderlich. Veränderliche Objekte haben zusätzliche overhead Umgang mit runtime-änderungen.
die Anzahl der Methoden, die ein Typ hat keine Auswirkungen auf den Speicherplatz der Instanzen nehmen. Die Methode Liste aus, und Ihre Codes werden von den object-Prototyp, aber Instanzen speichern nur die Daten und die internen Variablen.

InformationsquelleAutor JON | 2017-10-10

130

Ich nehme an, du bist mit CPython und mit 64 bit (ich habe die gleichen Ergebnisse auf meinem CPython 2.7 64-bit). Es könnte Unterschiede zu anderen Python-Implementierungen, oder wenn Sie eine 32-bit-Python.

Unabhängig von der Implementierung lists sind mit variabler Größe, während tuples sind eine Feste Größe hat.

So tuples speichern können die Elemente direkt in die Struktur, listet auf der anderen Seite müssen Sie eine Schicht der Dereferenzierung (es speichert einen Zeiger auf die Elemente). Diese Schicht der Dereferenzierung ist ein Zeiger, der auf 64bit-Systemen, das ist 64bit, also 8bytes.

Aber es gibt eine Sache, die lists tun: Sie über-zuteilen. Ansonsten list.append wäre ein O(n) Betrieb immer zu machen, amortisiert O(1) (viel schneller!!!) es über-weist. Aber jetzt ist es zu verfolgen, die zugeordnet Größe und die gefüllt Größe (tuples nur speichern müssen eine Größe, weil reserviert und gefüllt Größe sind immer identisch). Das bedeutet, dass jede Liste zu speichern hat eine andere "Größe", die auf 64-bit-Systeme ist ein 64bit integer, wieder 8 bytes.

So lists müssen mindestens 16 bytes mehr Speicher als tuples. Warum ich sage "mindestens"? Wegen der überallokation. Über-Zuweisung bedeutet, es weist mehr Raum als nötig. Jedoch, der Betrag der über-Zuteilung hängt davon ab, "wie" Sie die Liste erstellen, und fügen Sie/Löschung-Geschichte:
```
>>> l = [1,2,3]
>>> l.__sizeof__()
64
>>> l.append(4)  # triggers re-allocation (with over-allocation), because the original list is full
>>> l.__sizeof__()
96

>>> l = []
>>> l.__sizeof__()
40
>>> l.append(1)  # re-allocation with over-allocation
>>> l.__sizeof__()
72
>>> l.append(2)  # no re-alloc
>>> l.append(3)  # no re-alloc
>>> l.__sizeof__()
72
>>> l.append(4)  # still has room, so no over-allocation needed (yet)
>>> l.__sizeof__()
72
```
Bilder

Ich beschlossen, einige Bilder begleiten die Erklärung oben. Vielleicht sind diese hilfreich

Dies ist, wie es (schematisch) im Arbeitsspeicher gespeichert wird in deinem Beispiel. Ich hob die Unterschiede mit rot (frei hand) Zyklen:

Das ist eigentlich nur eine Annäherung, weil int Objekte sind auch Python-Objekte und CPython sogar wiederverwendet kleinen ganzen zahlen, so eine wohl genauere Darstellung (wenn auch nicht so gut lesbar) der Objekte im Speicher wäre:

Nützliche links:
Beachten Sie, dass __sizeof__ nicht wirklich zurück die "richtige" Größe! Es gibt nur die Größe der gespeicherten Werte. Allerdings, wenn Sie verwenden sys.getsizeof das Ergebnis ist unterschiedlich:
```
>>> import sys
>>> l = [1,2,3]
>>> t = (1, 2, 3)
>>> sys.getsizeof(l)
88
>>> sys.getsizeof(t)
72
```
Gibt es 24 "extra" - bytes. Diese sind real, dass der garbage collector Aufwand, der nicht bilanziert, die __sizeof__ Methode. Das ist, weil Sie sind in der Regel nicht zugelassen, Magie zu verwenden Methoden, die direkt die Funktionen verwenden, die wissen, wie man mit Ihnen umgeht, in diesem Fall: sys.getsizeof (die eigentlich fügt die GC overhead der zurückgegebene Wert von __sizeof__).
- Re "So Listen müssen mindestens 16 bytes mehr Speicher als Tupel.", Wäre das nicht 8? Eine Größe für Tupel und zwei Größen für die Listen bedeutet eine zusätzliche Größe für Listen.
- Ja, die Liste hat eine extra "Größe" (8 byte), sondern auch speichert einen Zeiger (8byte) auf "array von PyObject"s statt speichert Sie in der Struktur direkt (was ein Tupel ist). 8+8=16.
- Ein weiteres sinnvoll - link zu list memory allocation stackoverflow.com/questions/40018398/...
- Das ist nicht wirklich im Zusammenhang mit der Frage, weil der code in die Frage nicht über-reservieren Sie auf alle. Aber ja, es ist nützlich, wenn Sie mehr wissen wollen über die Höhe der über-Allokation bei der Verwendung von list() oder eine Liste Verständnis.
- Die Menge des "verschwendeten" Speicher ist so klein, dass es in der Regel egal, es sei denn, Sie haben eine riesige Menge von Listen/Tupel. Wenn viele der Container sind leer, der Unterschied wird größer, wenn. Ein leeres Tupel wird ein singleton (zumindest CPython), so dass Sie in der Praxis keinen Arbeitsspeicher. Eine neue leere Liste wird immer ein neues Objekt, das braucht seine eigene Speicherzuweisung.
- Sie haben erwähnt, dass Listen versuchen zu amortisieren den append-Befehl. Bedeutet es, dass Tupel nicht tun. Und damit Tupel werden langsamer, wenn Sie versuchen, anfügen von Elementen in ein Tupel?
- Tupel unveränderlich sind, so können Sie nichts Anhängen, um ein Tupel oder entfernen Sie ein Element aus einem Tupel.
InformationsquelleAutor MSeifert
30

Nehme ich tiefer in die CPython codebase, damit wir sehen können, wie sich die Größen tatsächlich berechnet. In Ihre spezifischen Beispiel, keine Zuweisungen durchgeführt wurden, also werde ich nicht berühren, dass.

Werde ich für die Verwendung von 64-bit-Werte hier, wie Sie sind.

Größe für lists berechnet sich aus der folgenden Funktion, list_sizeof:
```
static PyObject *
list_sizeof(PyListObject *self)
{
    Py_ssize_t res;

    res = _PyObject_SIZE(Py_TYPE(self)) + self->allocated * sizeof(void*);
    return PyInt_FromSsize_t(res);
}
```
Hier Py_TYPE(self) ist ein makro, das packt die ob_type von self (Rückkehr PyList_Type), während _PyObject_SIZE ist ein weiteres makro, das packt tp_basicsize von diesem Typ. tp_basicsize berechnet als sizeof(PyListObject) wo PyListObject ist die Instanz-struct.

Den PyListObject - Struktur hat drei Felder:
```
PyObject_VAR_HEAD     # 24 bytes 
PyObject **ob_item;   #  8 bytes
Py_ssize_t allocated; #  8 bytes
```
diese Kommentare haben (die ich gekürzt) erklären, was Sie sind, Folgen Sie den obigen link, um Sie zu Lesen. PyObject_VAR_HEAD erweitert, die in drei 8-byte-Felder (ob_refcount, ob_type und ob_size) so ein 24 byte-Beitrag.

So jetzt res ist:
```
sizeof(PyListObject) + self->allocated * sizeof(void*)
```
oder:
```
40 + self->allocated * sizeof(void*)
```
Wenn Sie in der Liste Instanz hat Elemente zugeordnet sind. der zweite Teil errechnet sich Ihr Beitrag. self->allocated, wie der name schon sagt, hält die Anzahl der zugewiesenen Elemente.

Ohne Elemente, die Größe der Listen berechnet werden:
```
>>> [].__sizeof__()
40
```
ich.e die Größe der Instanz-struct.

tuple Objekte definieren nicht ein tuple_sizeof Funktion. Stattdessen nutzen Sie object_sizeof zu berechnen, Ihre Größe:
```
static PyObject *
object_sizeof(PyObject *self, PyObject *args)
{
    Py_ssize_t res, isize;

    res = 0;
    isize = self->ob_type->tp_itemsize;
    if (isize > 0)
        res = Py_SIZE(self) * isize;
    res += self->ob_type->tp_basicsize;

    return PyInt_FromSsize_t(res);
}
```
Diese, wie für lists, schnappt sich die tp_basicsize und, wenn das Objekt einen nicht-null - tp_itemsize (D. H. es hat die variable-Länge-Instanzen), es multipliziert die Anzahl der Elemente im Tupel (die er bekommt über Py_SIZE) mit tp_itemsize.

tp_basicsize wieder verwendet sizeof(PyTupleObject) wo die PyTupleObject struct enthält:
```
PyObject_VAR_HEAD       # 24 bytes 
PyObject *ob_item[1];   # 8  bytes
```
So, ohne alle Elemente (d.h. Py_SIZE zurück 0) die Größe des leeren Tupel ist gleich sizeof(PyTupleObject):
```
>>> ().__sizeof__()
24
```
nicht wahr? Nun, hier ist eine kuriosität, die ich habe nicht gefunden, eine Erklärung für die tp_basicsize von tuples ist eigentlich wie folgt berechnet:
```
sizeof(PyTupleObject) - sizeof(PyObject *)
```
warum eine zusätzliche 8 bytes entfernt ist tp_basicsize ist etwas, was ich noch nicht herausfinden können. (Siehe MSeifert Kommentar für eine mögliche Erklärung)

Aber, das ist im Grunde der Unterschied in Ihre spezifischen Beispiel. lists auch halten, um eine Anzahl der zugeordneten Elemente, die hilft, festzustellen, wenn über-reservieren Sie wieder.

Nun, wenn zusätzliche Elemente Hinzugefügt werden, Listen zu tun, in der Tat diese über-Allokation zu erreichen, um O(1) hängt. Diese Ergebnisse in größeren Größen als MSeifert ist, deckt schön in seiner Antwort.
- Ich glaube, die ob_item[1] ist meist ein Platzhalter (es macht also Sinn, es ist subtrahiert von der basicsize). Die tuple zugeordnet wird, die mit PyObject_NewVar. Ich habe nicht herausgefunden, die details, also das ist nur eine Vermutung...
- Sorry für die, behoben :-). Ich weiß es wirklich nicht, ich erinnere mich, es zu finden, in der Vergangenheit irgendwann, aber ich habe nie geben, zu viel Aufmerksamkeit, vielleicht werde ich nur Fragen, eine Frage, die irgendwann in der Zukunft 🙂
InformationsquelleAutor Jim Fasarakis Hilliard
29

MSeifert Antwort deckt es weitgehend; um es einfach zu halten kann man sich denken:

tuple unveränderlich ist. Sobald es gesetzt ist, können Sie es nicht ändern. So wissen Sie im Voraus, wie viel Speicher Sie brauchen, um zu reservieren für das Objekt.

list ist veränderlich. Sie können Elemente hinzufügen oder entfernen oder von ihm. Es hat zu wissen, die Größe der es (für interne impl.). Es ändert, wie gebraucht.

Es gibt keine kostenlosen Mahlzeiten - diese Fähigkeiten kommt mit einem Preis. Daher der overhead im Speicher für Listen.

InformationsquelleAutor Chen A.
3

Die Größe der Tupel wird ein Präfix vorangestellt, das heißt an Tupel Initialisierung der Dolmetscher genügend Platz für die enthaltenen Daten, und das ist das Ende, was es ist unveränderlich (kann nicht geändert werden), in der Erwägung, dass eine Liste ist ein veränderliches Objekt daher impliziert die dynamische Zuweisung von Speicher, um zu vermeiden, zuweisen von Speicherplatz jedes mal, wenn Sie anfügen oder ändern Sie die Liste ( genügend Raum enthalten, werden die geänderten Daten und kopieren der Daten), weist er den zusätzlichen Raum für Zukunft Anhängen, änderungen, ... , dass ziemlich viel bringt es auf.

InformationsquelleAutor rachid el kedmiri

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.

Bilder