Array slicing in Ruby: Erklärung für das unlogische Verhalten (entnommen aus Rubykoans.com)

Ging ich durch die übungen in Ruby Koans und ich war beeindruckt von den folgenden Ruby-quirk, fand ich wirklich unerklärliche:

array = [:peanut, :butter, :and, :jelly]

array[0]     #=> :peanut    #OK!
array[0,1]   #=> [:peanut]  #OK!
array[0,2]   #=> [:peanut, :butter]  #OK!
array[0,0]   #=> []    #OK!
array[2]     #=> :and  #OK!
array[2,2]   #=> [:and, :jelly]  #OK!
array[2,20]  #=> [:and, :jelly]  #OK!
array[4]     #=> nil  #OK!
array[4,0]   #=> []   #HUH??  Why's that?
array[4,100] #=> []   #Still HUH, but consistent with previous one
array[5]     #=> nil  #consistent with array[4] #=> nil  
array[5,0]   #=> nil  #WOW.  Now I don't understand anything anymore...

Also, warum ist array[5,0] nicht gleich array[4,0]? Gibt es einen Grund, warum array-slicing verhält sich dies seltsam, wenn Sie beginnen, auf die (Länge+1)^th position??

Siehe auch Warum array.Scheibe Verhalten sich unterschiedlich (Länge, n)
sieht aus wie die erste Zahl ist der index zu Beginn an, die zweite Zahl gibt an, wie viele Elemente zu schneiden

InformationsquelleAutor Pascal Van Hecke | 2010-08-25

arrays ruby

177

Schneiden und Indizierung sind zwei verschiedene Vorgänge, und abzuleiten, der das Verhalten des einen vom anderen ist, wo dein problem liegt.

Das erste argument in der Scheibe erkennt nicht das element, sondern die Orte, die zwischen den Elementen und die Definition erstreckt (und nicht die Elemente selbst):
```
  :peanut   :butter   :and   :jelly
0         1         2      3        4
```
4 ist immer noch innerhalb des Arrays, gerade noch; wenn Sie Anfrage 0-Elemente, erhalten Sie das leere Ende des Arrays. Aber es gibt keinen index 5, man kann also nicht die Scheibe von dort.

Wenn Sie das tun-index (wie array[4]), Sie verweisen auf Elemente selbst, also die Indizes gehen nur von 0 bis 3.

Eine gute Vermutung, es sei denn, dies ist unterstützt von der Quelle. Nicht snarky, ich hätte Interesse an einem link, wenn jeder nur zu erklären das "warum", wie das OP und die anderen Kommentatoren bitten. Dein Diagramm macht Sinn, außer Array[4] ist null. Array[3]: jelly. Ich würde erwarten, dass Array[4,N] auf null, aber es ist [] wie der OP sagt. Wenn es ein Ort, es ist eine ziemlich nutzlose Ort, weil Array[4, -1] ist null. So können Sie nichts mit Array[4].
Ich habe gerade die Bestätigung von Charles Oliver Nutter (@headius auf Twitter), dass die Erklärung richtig ist. Er ist ein big-time-JRuby dev, so würde ich prüfen, sein Wort Recht MAßGEBEND.
Im folgenden ist die Begründung für dieses Verhalten: Klinge.nagaokaut.ac.jp/cgi-bin/scat.rb/ruby - /ruby-talk/380637
Richtige Erklärung. Ähnliche Diskussionen auf ruby-core: redmine.ruby-lang.org/issues/4245 , redmine.ruby-lang.org/issues/4541
Auch bezeichnet als "Zaun-posten." Der fünfte Zaun-post (id 4) vorhanden ist, aber das fünfte element nicht. Slicing ist ein Zaun-post-operation, die Indizierung ist ein element der Bedienung.

InformationsquelleAutor Amadan
27

dies hat mit der Tatsache zu tun, dass die Scheibe ein array zurückgibt, relevante Quelle Dokumentation von Array#slice:
```
 *  call-seq:
 *     array[index]                -> obj      or nil
 *     array[start, length]        -> an_array or nil
 *     array[range]                -> an_array or nil
 *     array.slice(index)          -> obj      or nil
 *     array.slice(start, length)  -> an_array or nil
 *     array.slice(range)          -> an_array or nil
```
das lässt mich vermuten, dass, wenn Sie geben die start -, das ist außerhalb der Grenzen, wird es wieder null, also in deinem Beispiel array[4,0] bittet für das 4. element, das vorhanden ist, aber bittet um Rückgabe ein array mit null Elementen. Während array[5,0] aufgefordert, einen index out of bounds, also es wird nil zurückgegeben. Dies macht das vielleicht mehr Sinn, wenn Sie sich daran erinnern, dass die slice-Methode ist wieder eine neue array, nicht änderung der ursprünglichen Datenstruktur.

EDIT:

Nach der überprüfung der Kommentare, die ich beschlossen, zu Bearbeiten, zu beantworten. Scheibe ruft die folgende code-snippet, wenn die arg-Wert zwei:
```
if (argc == 2) {
    if (SYMBOL_P(argv[0])) {
        rb_raise(rb_eTypeError, "Symbol as array index");
    }
    beg = NUM2LONG(argv[0]);
    len = NUM2LONG(argv[1]);
    if (beg < 0) {
        beg += RARRAY(ary)->len;
    }
    return rb_ary_subseq(ary, beg, len);
}
```
wenn man sich in der array.c Klasse, wo die rb_ary_subseq Methode definiert ist, sehen Sie, dass es ist die Rückgabe nil, wenn die Länge ist außerhalb der Grenzen, nicht der index:
```
if (beg > RARRAY_LEN(ary)) return Qnil;
```
In diesem Fall das ist, was passiert, wenn 4 übergeben wird, prüft es, dass es 4 Elemente sind und daher löst keine der null-Rendite. Es geht dann auf und ein leeres array zurück, wenn das zweite argument auf null gesetzt ist. während, wenn 5 übergeben wird, es gibt nicht die 5 Elemente im array, so wird nil zurückgegeben, bevor der null-arg ausgewertet wird. code hier an der Linie 944.

Ich glaube, dass dies ein Fehler zu sein, oder zumindest unberechenbar und nicht das 'Prinzip der Geringsten Überraschung'. Wenn ich ein paar Minuten werde ich mindestens das Einreichen einer fehlerhaften test-patch auf ruby-core.

Aber... das element gekennzeichnet, durch das 4 in array[4,0] existiert nicht... - denn es ist tatsächlich die 5the-element (0-basiert zählen, siehe die Beispiele). So ist es out-of-bounds als gut.
du hast Recht. Ich ging zurück und sah auf die Quelle, und es sieht aus wie das erste argument behandelt wird, innerhalb von c-code als die Länge, nicht der index. Ich passe meine Antwort, um dies zu reflektieren. Ich denke, das vorgelegt werden könnte als ein bug.
Verblüffende Verhalten

InformationsquelleAutor Jed Schneider
23

Zumindest beachten, dass das Verhalten konsistent ist. Von 5 auf bis alles wirkt gleich; die Verrücktheit tritt nur bei [4,N].

Vielleicht dieses Muster hilft, oder vielleicht bin ich einfach nur müde und es überhaupt nicht helfen.
```
array[0,4] => [:peanut, :butter, :and, :jelly]
array[1,3] => [:butter, :and, :jelly]
array[2,2] => [:and, :jelly]
array[3,1] => [:jelly]
array[4,0] => []
```
In [4,0], fangen wir mit dem Ende des Arrays. Würde ich finde es eigentlich ziemlich seltsam, so weit, wie die Schönheit in den mustern zu gehen, wenn der Letzte zurück nil. Da von einem Zusammenhang wie diesem, 4 ist eine akzeptable option für den ersten parameter, so dass die leeres array zurückgegeben werden können. Sobald wir die Treffer 5 und bis, obwohl, die Methode wahrscheinlich sofort beendet wird durch die Natur des seins ganz und völlig abwegig.

InformationsquelleAutor Matchu
12

Dies macht Sinn, wenn man bedenkt, als ein array-slice kann ein Gültiger lvalue, nicht nur ein rvalue:
```
array = [:peanut, :butter, :and, :jelly]
# replace 0 elements starting at index 5 (insert at end or array):
array[4,0] = [:sandwich]
# replace 0 elements starting at index 0 (insert at head of array):
array[0,0] = [:make, :me, :a]
# array is [:make, :me, :a, :peanut, :butter, :and, :jelly, :sandwich]

# this is just like replacing existing elements:
array[3, 4] = [:grilled, :cheese]
# array is [:make, :me, :a, :grilled, :cheese, :sandwich]
```
Dies wäre nicht möglich, wenn array[4,0] zurückgegeben nil statt []. Allerdings array[5,0] zurück nil weil es out of bounds (einfügen nach dem 4. element der 4-element-array sinnvoll ist, aber das einfügen nach dem 5. element der 4-element-array nicht).

Lesen Sie die slice-syntax array[x,y] wie "ab nach x Elemente in array wählen Sie bis zu y Elemente". Dies ist nur sinnvoll, wenn array hat mindestens x Elemente.

InformationsquelleAutor Frank Szczerba
11

Diese hat sinnvoll

Müssen Sie in der Lage sein zu ordnen, um diejenigen, die Scheiben, Sie sind also so definiert, dass der Beginn und das Ende der Zeichenfolge an der Arbeit mit null-Länge Ausdrücken.
```
array[4, 0] = :sandwich
array[0, 0] = :crunchy
=> [:crunchy, :peanut, :butter, :and, :jelly, :sandwich]
```
Sie können auch die Zuordnung zu dem Bereich, den slice, kehrt als null, so wäre es sinnvoll, erweitern Sie diese Erklärung. array[5,0]=:foo # array is now [:peanut, :butter, :and, :jelly, nil, :foo]
was bedeutet die zweite Zahl soll bei der Zuordnung? es scheint, um ignoriert zu werden. [26] pry(main)> array[4,5] = [:love, :hope, :peace] => [:peanut, :butter, :and, :jelly, :love, :hope, :peace]
es nicht ignoriert: array = [:a, :b, :c, :d, :e]; array[1,2] = :x, :x; array => [:a, :x, :x, :d, :e]

InformationsquelleAutor DigitalRoss
8

Ich bin damit einverstanden, dass dies scheint wie ein seltsames Verhalten, aber auch die offizielle Dokumentation auf Array#slice zeigt das gleiche Verhalten, wie in Ihrem Beispiel, in "besonderen Fällen" unter:
```
   a = [ "a", "b", "c", "d", "e" ]
   a[2] +  a[0] + a[1]    #=> "cab"
   a[6]                   #=> nil
   a[1, 2]                #=> [ "b", "c" ]
   a[1..3]                #=> [ "b", "c", "d" ]
   a[4..7]                #=> [ "e" ]
   a[6..10]               #=> nil
   a[-3, 3]               #=> [ "c", "d", "e" ]
   # special cases
   a[5]                   #=> nil
   a[5, 1]                #=> []
   a[5..10]               #=> []
```
Leider, auch Ihre Beschreibung von Array#slice scheint nicht zu bieten jede Einsicht zu warum es funktioniert auf diese Weise:

Element Referenz—Liefert das element an der index, oder gibt einen subarray ab start - und Weiterbildung für Länge Elemente, oder gibt einen subarray angegeben Bereich. Negative Indizes zählen rückwärts vom Ende des Arrays (-1 ist das Letzte element). Wird nil zurückgegeben, wenn der index (oder ab-index) sind außerhalb der Reichweite.

InformationsquelleAutor Mark Rushakoff
8

Fand ich die Erklärung von Gary Wright sehr hilfreich sein.
http://www.ruby-forum.com/topic/1393096#990065

Die Antwort von Gary Wright ist -

http://www.ruby-doc.org/core/classes/Array.html

Den docs könnte sicherlich mehr sein, klar, aber das tatsächliche Verhalten ist
selbst-konsistent und hilfreich.
Hinweis: ich gehe davon aus, 1.9.X-version von String.

Hilft es zu überlegen, die die Nummerierung in der folgenden Weise:
```
  -4  -3  -2  -1    <-- numbering for single argument indexing
   0   1   2   3
 +---+---+---+---+
 | a | b | c | d |
 +---+---+---+---+
 0   1   2   3   4  <-- numbering for two argument indexing or start of range
-4  -3  -2  -1
```
Dem gemeinsamen (und verständlichen) Fehler ist zu vermuten, dass die Semantik
das einzige argument index sind die gleichen wie die Semantik der
ersten argument in den beiden argument-Szenario (oder mehrere). Sie sind nicht
die gleiche Sache in der Praxis und in der Dokumentation nicht spiegeln dies wider.
Der Fehler ist aber auf jeden Fall in die Dokumentation und nicht in der
Umsetzung:

einziges argument: der index repräsentiert ein einzelnes Zeichen position
innerhalb der Zeichenfolge. Das Ergebnis ist entweder ein einzelnes Zeichen
gefunden auf der index oder null, denn es gibt kein Zeichen an der angegebenen
index.
```
  s = ""
  s[0]    # nil because no character at that position

  s = "abcd"
  s[0]    # "a"
  s[-4]   # "a"
  s[-5]   # nil, no characters before the first one
```
beiden integer-Argumente: Argumente identifizieren, die einen Teil der Zeichenfolge
extrahieren oder zu ersetzen. Insbesondere die null-Breite Teile des Strings
kann auch identifiziert werden, so dass text eingefügt werden kann, die vor oder nach
bereits bestehende Charaktere, darunter an der front oder am Ende der Zeichenfolge. In diesem
Fall das erste argument ist nicht identifizieren, die eine Zeichenposition aber
stattdessen identifiziert der Platz zwischen den Zeichen, wie in der Abbildung gezeigt
oben. Das zweite argument ist die Länge, die kann 0 sein.
```
s = "abcd"   # each example below assumes s is reset to "abcd"

To insert text before 'a':   s[0,0] = "X"           #  "Xabcd"
To insert text after 'd':    s[4,0] = "Z"           #  "abcdZ"
To replace first two characters: s[0,2] = "AB"      #  "ABcd"
To replace last two characters:  s[-2,2] = "CD"     #  "abCD"
To replace middle two characters: s[1..3] = "XX"    #  "aXXd"
```
Das Verhalten eines Bereichs ist ziemlich interessant. Der Ausgangspunkt ist die
gleiche wie das erste argument, wenn zwei Argumente (wie beschrieben
oben), aber der Endpunkt der Strecke kann die "Zeichen position" als
mit Einzel-Indizierung oder die "edge position" mit zwei integer
Argumente. Der Unterschied wird festgestellt, ob die double-dot-Bereich
oder triple-Punkt-Bereich verwendet wird:
```
s = "abcd"
s[1..1]           # "b"
s[1..1] = "X"     # "aXcd"

s[1...1]          # ""
s[1...1] = "X"    # "aXbcd", the range specifies a zero-width portion of
the string

s[1..3]           # "bcd"
s[1..3] = "X"     # "aX",  positions 1, 2, and 3 are replaced.

s[1...3]          # "bc"
s[1...3] = "X"    # "aXd", positions 1, 2, but not quite 3 are replaced.
```
Wenn Sie wieder durch diese Beispiele und darauf bestehen und mit der single
index Semantik für die Doppel-oder range-Indizierung Beispiele werden Sie nur
verwirrt. Du hast die Verwendung des alternativen Nummerierung zeige ich in der
ascii-Diagramm-Modell das tatsächliche Verhalten.

Können Sie auch die Haupt-Idee von diesem thread? (falls der link eines Tages ungültig wird)

InformationsquelleAutor vim
7

Einer Erklärung zur Verfügung gestellt von Jim Weirich

Eine Art, nachzudenken ist es, die index-position 4 ist an der Kante
der array. Wenn gefragt wird, für ein Stück, kehren Sie so viel von der
array Links. So betrachten Sie das array[2,10], array[3,10] und
array[4,10] ... jeder gibt die restlichen bits der Ende der
array: 2 Elemente, 1 element und 0 Elemente jeweils. Allerdings
position 5 ist deutlich außerhalb das array und nicht am Rand, so
array[5,10], wird nil zurückgegeben.

InformationsquelleAutor suvankar
6

Betrachten Sie das folgende array:
```
>> array=["a","b","c"]
=> ["a", "b", "c"]
```
Können Sie ein Element einfügen, um den Anfang (Kopf) des Arrays durch Zuweisung a[0,0]. Setzen Sie das element zwischen "a" und "b" verwenden a[1,0]. Im Grunde, in der notation a[i,n], i stellt einen index und n eine Anzahl von Elementen. Wenn n=0 es bezeichnet eine position, die zwischen den Elementen des Arrays.

Nun, wenn Sie denken, über das Ende des Arrays, wie können Sie fügen Sie ein Element zu Ihrem Ende mit der notation oben beschrieben? Einfach, weisen Sie den Wert zu a[3,0]. Dies ist der Schwanz des Arrays.

So, wenn Sie versuchen, Zugriff auf das element an a[3,0] erhalten Sie []. In diesem Fall sind Sie noch im Bereich des Arrays. Aber wenn Sie versuchen, Zugriff auf a[4,0] erhalten Sie nil als return-Wert, da Sie nicht innerhalb des Bereichs der array nicht mehr.

Lesen Sie mehr darüber auf http://mybrainstormings.wordpress.com/2012/09/10/arrays-in-ruby/ .

InformationsquelleAutor Tairone
0

tl;dr: in den source-code in array.c, unterschiedliche Funktionen aufgerufen werden, je nachdem, ob Sie pass 1 oder 2 Argumente in Array#slice was in der unerwartete Werte zurückgeben.

(First off, würde ich mag darauf hinweisen, dass ich keinen code in C, aber habe mit Ruby seit Jahren. Also, wenn Sie nicht vertraut sind mit C, aber nehmen Sie ein paar Minuten, um sich vertraut mit den Grundlagen von Funktionen und Variablen es ist wirklich nicht schwer, Folgen Sie den Ruby-source-code, wie unten gezeigt. Diese Antwort basiert auf Ruby v2.3, aber ist mehr oder weniger das gleiche zurück zu v1.9.)

Szenario #1

array.length == 4; array.slice(4) #=> nil

Wenn du dir den source-code für Array#slice (rb_ary_aref), sehen Sie, dass, wenn nur ein argument übergeben wird (Linien 1277-1289), rb_ary_entry genannt wird, vorbei an der index-Wert (das kann positiv oder negativ sein).

rb_ary_entry berechnet dann die position des gewünschten element aus dem Anfang des Arrays (in anderen Worten, wenn ein negativer Wert übergeben wird, wird er berechnet das positive äquivalent) und ruft dann rb_ary_elt, um das angeforderte element.

Als erwartet, rb_ary_elt zurück nil wenn die Länge des array len ist weniger als oder gleich der index (hier genannt offset).
```
1189:  if (offset < 0 || len <= offset) {
1190:    return Qnil;
1191:  } 
```
Szenario #2

array.length == 4; array.slice(4, 0) #=> []

Allerdings, wenn 2 Argumente übergeben werden (d.h. die Indexposition beg, und die Länge der Scheibe len), rb_ary_subseq genannt wird.

In rb_ary_subseq, wenn der Start-index beg ist größer als die array-Länge alen, nil zurückgegeben:
```
1208:  long alen = RARRAY_LEN(ary);
1209:
1210:  if (beg > alen) return Qnil;
```
Sonst die Länge des slice len berechnet wird, und wenn es bestimmt zu null, wird ein leeres array zurückgegeben:
```
1213:  if (alen < len || alen < beg + len) {
1214:  len = alen - beg;
1215:  }
1216:  klass = rb_obj_class(ary);
1217:  if (len == 0) return ary_new(klass, 0);
```
So, da die Start-index von 4 ist nicht größer als array.length, wird ein leeres array zurückgegeben wird, anstatt des nil Wert, dass man annehmen könnte.

Frage beantwortet?

Wenn die eigentliche Frage hier ist nicht "Was code bewirkt, dass dies geschehen kann?", sondern vielmehr, "Warum hat Matz es so machen?", nun müssen Sie nur kaufen Sie ihm eine Tasse Kaffee an der nächsten RubyConf und ihn Fragen.

InformationsquelleAutor Scott Schupbach

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.

Array slicing in Ruby: Erklärung für das unlogische Verhalten (entnommen aus Rubykoans.com)

Diese hat sinnvoll

tl;dr: in den source-code in `array.c`, unterschiedliche Funktionen aufgerufen werden, je nachdem, ob Sie pass 1 oder 2 Argumente in `Array#slice` was in der unerwartete Werte zurückgeben.

Szenario #1

`array.length == 4; array.slice(4) #=> nil`

Szenario #2

`array.length == 4; array.slice(4, 0) #=> []`

Frage beantwortet?