Pure-Ruby gleichzeitige Hash

Was ist der beste Weg zur Implementierung eines Hash geändert werden kann über mehrere threads, aber mit der kleinsten Anzahl von sperren. Für die Zwecke dieser Frage, können Sie davon ausgehen, dass der Hash gelesen werden-schwer. Es muss thread-safe in allen Ruby-Implementierungen, einschließlich diejenigen, die arbeiten in einer wahrhaft gleichzeitigen Mode, wie JRuby, und es muss geschrieben werden, in pure-Ruby (kein C, Java oder erlaubt).

Fühlen Sie sich frei, um senden Sie eine naive Lösung, die immer sperrt, aber das ist nicht wahrscheinlich, die beste Lösung zu sein. Punkte für Eleganz, aber eine kleinere Wahrscheinlichkeit von sperren Siege über einen kleineren code.

Ruby 1.8 oder 1.9?
Ich nehme die Antwort als Werke, die auf Ruby 1.9, solange es funktioniert auf JRuby in 1.9-Modus. Ich bevorzuge eine Antwort als " funktioniert sowohl auf 1.8 und 1.9.
Wie ist das nützlich? Sicher, Sie haben mittlerweile den Wert sicher, aber es ist nicht abzusehen, wie lange der Wert gültig ist. Könnten Sie ziehen es aus dem hash, der andere könnte geplant werden, und schreiben Sie die gleiche Taste, die alle, bevor Sie etwas tun interessant, mit.
Nur damit die Leute nicht denken, dass ich aufgegeben habe, werde ich akzeptieren, eine Antwort morgen 🙂

InformationsquelleAutor Yehuda Katz | 2009-07-03

Okay, jetzt, dass Sie angegeben haben, die tatsächlich Bedeutung von "threadsicher", hier werden zwei mögliche Implementierungen. Der folgende code wird ausgeführt für immer im MRT und JRuby. Die lockless Implementierung folgt eine eventual consistency Modell, bei dem jeder thread verwendet es die eigene Ansicht des hash-wenn der Meister im Wandel. Es ist etwas Trickserei erforderlich, um sicher zu speichern alle Informationen, die in dem thread nicht ein Speicherleck, aber das ist behandelt und getestet ― Prozess die Größe nicht wachsen, läuft dieser code. Beide Implementierungen müssten mehr arbeiten, um sein "complete", was bedeutet, delete, update, etc. müssten einige denken, aber eines der beiden Konzepte unter Ihren Anforderungen gerecht wird.

Es ist sehr wichtig für Menschen, die Lesen dieses Threads klar, das ganze Thema ist exklusiv für JRuby ― im MRT der built-in Hash ist ausreichend.

module Cash
  def Cash.new(*args, &block)
    env = ENV['CASH_IMPL']
    impl = env ? Cash.const_get(env) : LocklessImpl
    klass = defined?(JRUBY_VERSION) ? impl : ::Hash
    klass.new(*args)
  end

  class LocklessImpl
    def initialize
      @hash = {}
    end

    def thread_hash
      thread = Thread.current
      thread[:cash] ||= {}
      hash = thread[:cash][thread_key]
      if hash
        hash
      else
        hash = thread[:cash][thread_key] = {}
        ObjectSpace.define_finalizer(self){ thread[:cash].delete(thread_key) }
        hash
      end
    end

    def thread_key
      [Thread.current.object_id, object_id]
    end

    def []=(key, val)
      time = Time.now.to_f
      tuple = [time, val]
      @hash[key] = tuple
      thread_hash[key] = tuple
      val
    end

    def [](key)
    # check the master value
    #
      val = @hash[key]

    # someone else is either writing the key or it has never been set.  we
    # need to invalidate our own copy in either case
    #
      if val.nil?
        thread_val = thread_hash.delete(key)
        return(thread_val ? thread_val.last : nil)
      end

    # check our own thread local value
    #
      thread_val = thread_hash[key]

    # in this case someone else has written a value that we have never seen so
    # simply return it
    #
      if thread_val.nil?
        return(val.last)
      end

    # in this case there is a master *and* a thread local value, if the master
    # is newer juke our own cached copy
    #
      if val.first > thread_val.first
        thread_hash.delete(key)
        return val.last
      else
        return thread_val.last
      end
    end
  end

  class LockingImpl < ::Hash
    require 'sync'

    def initialize(*args, &block)
      super
    ensure
      extend Sync_m
    end

    def sync(*args, &block)
      sync_synchronize(*args, &block)
    end

    def [](key)
      sync(:SH){ super }
    end

    def []=(key, val)
      sync(:EX){ super }
    end
  end
end



if $0 == __FILE__
  iteration = 0

  loop do
    n = 42
    hash = Cash.new

    threads =
      Array.new(10) {
        Thread.new do
          Thread.current.abort_on_exception = true
          n.times do |key|
            hash[key] = key
            raise "#{ key }=nil" if hash[key].nil?
          end
        end
      }

    threads.map{|thread| thread.join}

    puts "THREADSAFE: #{ iteration += 1 }"
  end
end

Tut mir Leid es dauerte so lange, um wieder zu Lesen. Ich eigentlich wirklich wie diese, aber ich bin ein bisschen unangenehm durch Ihre Behauptung, dass "dies ist nur ein problem in JRuby." Das kann gut wahr sein, heute (oder könnte es nicht sein, einmal Implementierungen wie macruby und maglev sind berücksichtigt), aber es kann kaum als gegeben hinnehmen, in die Zukunft. In der Tat, wäre ich nicht erstaunt, dass, wenn Ruby 2.0 verwaltet, um zu vermeiden, die GIL insgesamt zu Gunsten der feinere sperren. Und es wird wahrscheinlich ein Problem in der Magnetschwebebahn, MacRuby, und möglicherweise Rubinius.
Ich bin der Annahme dieser Lösung; es wäre schön zu sehen, einige benchmarks gegen die naiv implementiert schließlösung.
Ich würde auch gerne sehen wie die benchmarks gegen Josh ' s copy-and-swap-Lösung (die wir in Schienen, und das war meine ursprüngliche stab bei diesem problem)
Ich versuchte benchmark mit den anderen Implementierungen, aber ich habe es nicht eine einfache Möglichkeit, Iteratoren, ohne hinzufügen von sperren und bewahren noch immer alle Tasten genau einmal. Ich kann die Bank es ohne Iteratoren, wenn Sie mögen.
Wenn Sie nur gehst, um es in JRuby, die 'rein sein muss-Ruby' ist sicherlich nicht gelten, in welchem Fall Sie können auch mit java.util.gleichzeitige.ConcurrentHashMap?
Es ist schon eine lange Zeit, nur eine Frage zur Umsetzung: Warum brauchen Sie den Faden.aktuelle.object_id als Teil der thread_key, würden nicht die Instanz object_id ausreichen?

InformationsquelleAutor ara t howard

10

Posting base/naive Lösung, nur um boost meine Stack-Überlauf cred:
```
require 'thread'

class ConcurrentHash < Hash
  def initialize
    super
    @mutex = Mutex.new
  end

  def [](*args)
    @mutex.synchronize { super }
  end

  def []=(*args)
    @mutex.synchronize { super }
  end
end
```
- Die Tatsache, dass Sie gepostet, dass nur zu bekommen, Ruf lässt mich nur ungern upvote. 😛
- Ist es nicht das Ziel, den Ruf baumeln, eine Karotte, die dazu zwingen, Benutzer zu geben, gute Antworten?
- Würden Sie nicht, zumindest wollen mutex alle mutierenden Operationen auf dem Hash?
InformationsquelleAutor
7

Yehuda, ich denke, Sie erwähnten ivar Einstellung war atomic? Was ist mit einem einfachen kopieren-und tauschen dann?
```
require 'thread'

class ConcurrentHash
  def initialize
    @reader, @writer = {}, {}
    @lock = Mutex.new
  end

  def [](key)
    @reader[key]
  end

  def []=(key, value)
    @lock.synchronize {
      @writer[key] = value
      @reader, @writer = @writer, @reader
      @writer[key] = value
    }
  end
end
```
- Was ist, wenn zwei Schreiboperationen dup die hash-zur gleichen Zeit, bevor entweder schreibt? Nicht einer der schreibt verloren?
- Aktualisiert. Es sollte nicht wirklich weh zu viel.
- Würde nicht Klonen, besser zu sein, als dup? IIRC der Unterschied ist, dass clone-gibt Sie ein gefrorenes Objekt, wenn das original war eingefroren - das ist, was Sie wollen.
- Einer der Unterschiede. clone auch kopieren singleton-Methoden in der Erwägung, dass dup nicht.
- Klonen würde nicht funktionieren. Der hash wäre noch gefroren und h[key] = value würde sprengen.
- würde dies nicht machen, schreiben super teuer, wenn der hash ist groß?
InformationsquelleAutor

Dies ist eine wrapper-Klasse um die Hash-ermöglicht gleichzeitigen Leser, aber sperren sich die Dinge nach unten für alle anderen Arten von Zugang (einschließlich der iterierten liest).

class LockedHash
  def initialize
    @hash = Hash.new
    @lock = ThreadAwareLock.new()
    @reader_count = 0
  end

  def [](key)
    @lock.lock_read
    ret = @hash[key]
    @lock.unlock_read
    ret
  end

  def []=(key, value)
    @lock.lock_write
    @hash[key] = value
    @lock.unlock_write
  end

  def method_missing(method_sym, *arguments, &block)
    if @hash.respond_to? method_sym
      @lock.lock_block
      val = lambda{@hash.send(method_sym,*arguments, &block)}.call
      @lock.unlock_block
      return val
    end
    super
  end
end

Hier ist die locking-code verwendet:

class RWLock
  def initialize
    @outer = Mutex.new
    @inner = Mutex.new
    @reader_count = 0
  end
  def lock_read
    @outer.synchronize{@inner.synchronize{@reader_count += 1}}
  end
  def unlock_read
    @inner.synchronize{@reader_count -= 1}
  end
  def lock_write
    @outer.lock
    while @reader_count > 0 ;end
  end
  def unlock_write
    @outer.unlock
  end
end

class ThreadAwareLock < RWLock
  def initialize
    @owner = nil
    super
  end
  def lock_block
    lock_write
    @owner = Thread.current.object_id
  end
  def unlock_block
    @owner = nil
    unlock_write
  end
  def lock_read
    super unless my_block?
  end
  def unlock_read
    super unless my_block?
  end
  def lock_write
    super unless my_block?
  end
  def unlock_write
    super unless my_block?
  end
  def my_block?
    @owner == Thread.current.object_id
  end
end

Den thread-aware-lock ist, Ihnen zu erlauben, sperren Sie die Klasse einmal, und dann Methoden aufzurufen, die normalerweise sperren und nicht sperren. Sie benötigen diese, da Sie die Ausbeute in Blöcke innerhalb einiger Methoden, und diese Blöcke können Anruf sperren Methoden auf das Objekt, und Sie nicht möchten, dass ein deadlock oder eine double-lock-Fehler. Sie könnten eine Zählung sperren, anstatt für diesen.

Hier ist ein Versuch, zu implementieren bucket-Ebene lese-schreib-sperren:

class SafeBucket
  def initialize
    @lock = RWLock.new()
    @value_pairs = []
  end

  def get(key)
    @lock.lock_read
    pair = @value_pairs.select{|p| p[0] == key}
    unless pair && pair.size > 0
      @lock.unlock_read
      return nil
    end
    ret = pair[0][1]
    @lock.unlock_read
    ret
  end

  def set(key, value)
    @lock.lock_write
    pair = @value_pairs.select{|p| p[0] == key}
    if pair && pair.size > 0
      pair[0][1] = value
      @lock.unlock_write
      return
    end
    @value_pairs.push [key, value]
    @lock.unlock_write
    value
  end

  def each
    @value_pairs.each{|p| yield p[0],p[1]}
  end

end

class MikeConcurrentHash
  def initialize
    @buckets = []
    100.times {@buckets.push SafeBucket.new}
  end

  def [](key)
    bucket(key).get(key)
  end

  def []=(key, value)
    bucket(key).set(key, value)
  end

  def each
    @buckets.each{|b| b.each{|key, value| yield key, value}}
  end

  def bucket(key)
    @buckets[key.hash % 100]
  end
end

Habe ich aufgehört zu arbeiten, weil es zu langsam ist, so das jede Methode ist unsicher (können Mutationen durch andere threads während einer iteration) und es unterstützt nicht die meisten hash-Verfahren.

Und hier ist eine Testumgebung für die gleichzeitige hashes:

require 'thread'
class HashHarness
  Keys = [:a, :basic, :test, :harness, :for, :concurrent, :testing, :of, :hashes,
          :that, :tries, :to, :provide, :a, :framework, :for, :designing, :a, :good, :ConcurrentHash,
          :for, :all, :ruby, :implementations]

  def self.go
    h = new
    r = h.writiness_range(20, 10000, 0, 0)
    r.each{|k, v| p k + ' ' + v.map{|p| p[1]}.join(' ')}
    return
  end
  def initialize(classes = [MikeConcurrentHash, JoshConcurrentHash, JoshConcurrentHash2, PaulConcurrentHash, LockedHash, Hash])
    @classes = classes
  end
  def writiness_range(basic_threads, ops, each_threads, loops)
    result = {}
    @classes.each do |hash_class|
      res = []
      0.upto 10 do |i|
        writiness = i.to_f / 10
        res.push [writiness,test_one(hash_class, basic_threads, ops, each_threads, loops, writiness)]
      end
      result[hash_class.name] = res
    end
    result
  end
  def test_one(hash_class, basic_threads, ops, each_threads, loops, writiness)
    time = Time.now
    threads = []
    hash = hash_class.new
    populate_hash(hash)
    begin
    basic_threads.times do
      threads.push Thread.new{run_basic_test(hash, writiness, ops)}
    end
    each_threads.times do
      threads.push Thread.new{run_each_test(hash, writiness, loops)}
    end
    threads.each{|t| t.join}
    rescue ThreadError => e
      p [e.message, hash_class.name, basic_threads, ops, each_threads, loops, writiness].join(' ')
      return -1
    end
    p [hash_class.name, basic_threads, ops, each_threads, loops, writiness, Time.now - time].join(' ')
    return Time.now - time
  end
  def run_basic_test(hash, writiness, ops)
    ops.times do
      rand < writiness ? hash[choose_key]= rand : hash[choose_key]
    end
  end
  def run_each_test(hash, writiness, loops)
    loops.times do
      hash.each do |k, v|
        if rand < writiness
          each_write_work(hash, k, v)
        else
          each_read_work(k, v)
        end
      end
    end
  end
  def each_write_work(hash, key, value)
    hash[key] = rand
  end
  def each_read_work(key, value)
    key.to_s + ": " + value.to_s
  end
  def choose_key
    Keys[rand(Keys.size)]
  end
  def populate_hash(hash)
    Keys.each{|key| hash[key]=rand}  
  end
end

Zahlen:
Jruby

Writiness      0.0   0.1   0.2   0.3   0.4   0.5   0.6   0.7   0.8   0.9   1.0
ConcurrentHash 2.098 3.179 2.971 3.083 2.731 2.941 2.564 2.480 2.369 1.862 1.881
LockedHash     1.873 1.896 2.085 2.058 2.001 2.055 1.904 1.921 1.873 1.841 1.630
Hash           0.530 0.672 0.685 0.822 0.719 0.877 0.901 0.931 0.942 0.950 1.001

- Und MRT -

Writiness      0.0    0.1    0.2    0.3    0.4    0.5    0.6    0.7    0.8    0.9    1.0
ConcurrentHash  9.214  9.913  9.064 10.112 10.240 10.574 10.566 11.027 11.323 11.837 13.036
LockedHash     19.593 17.712 16.998 17.045 16.687 16.609 16.647 15.307 14.464 13.931 14.146
Hash            0.535  0.537  0.534  0.599  0.594  0.676  0.635  0.650  0.654  0.661  0.692

MRT zahlen sind ziemlich Auffällig. Verriegelung in der MRT ist wirklich beschissen.

Schön. Ja, ich möchte die Lösung unterstützt alle Hash-Methode. Ich bin besorgt, dass die Umsetzung der Eimer Semantik im pure-Ruby hätte eigentlich langsamer sein als nur beißen die Kugel und nehmen den perf-hit zu sperren, jedes mal. Pflege zu benchen?

InformationsquelleAutor

Könnte dies ein Fall für das hamster gem

Hamster implementiert Hash-Array Abgebildet Versucht (HAMT), sowie einige andere persistente Datenstrukturen, in reinem Ruby.

Persistente Datenstrukturen sind unveränderlich, und anstatt mutiert (verändert) die Struktur, wie durch hinzufügen oder ersetzen eines Schlüssel-Wert-paar in einem Hash, der Sie, statt zurück eine neue Daten-Struktur enthält die änderung. Der trick, mit dem beständigen unveränderlichen Datenstrukturen, ist, dass die neu zurückgegebenen Daten-Struktur wieder verwendet, wie viel von den Vorgänger als möglich.

Ich denke, zu implementieren, über hamster, die Sie verwenden würden, Ihre veränderliche hash-wrapper, die er alle liest, um den aktuellen Wert der persistenten immutable hash (dh, sollte schnell sein), während die Bewachung schreibt alles mit einer mutex und austauschen, um den neuen Wert der persistenten immutable hash nach dem schreiben.

Beispiel:

require 'hamster'
require 'hamster/experimental/mutable_hash'    
hsh = Hamster.mutable_hash(:name => "Simon", :gender => :male)

# reading goes directly to hash
puts hsh[:name] # Simon

# writing is actually swapping to new value of underlying persistent data structure
hsh.put(:name, "Joe")
puts hsh[:name] # Joe

So, lassen Sie uns dieses für ein ähnliches problem beschrieben:

(gist hier)

require 'hamster'
require 'hamster/experimental/mutable_hash'

# a bunch of threads with a read/write ratio of 10:1
num_threads = 100
num_reads_per_write = 10
num_loops = 100 
hsh = Hamster.mutable_hash

puts RUBY_DESCRIPTION
puts "#{num_threads} threads x #{num_loops} loops, #{num_reads_per_write}:1 R/W ratio"

t0 = Time.now
Thread.abort_on_exception = true
threads = (0...num_threads).map do |n|
  Thread.new do
    write_key = n % num_reads_per_write
    read_keys = (0...num_reads_per_write).to_a.shuffle # random order
    last_read = nil

    num_loops.times do
      read_keys.each do |k|
        # Reads
        last_read = hsh[k]

        Thread.pass

        # Atomic increments in the correct ratio to reads
        hsh.put(k) { |v| (v || 0) + 1 } if k == write_key
      end
    end
  end
end

threads.map { |t| t.join }
t1 = Time.now

puts "Error in keys" unless (0...num_reads_per_write).to_a == hsh.keys.sort.to_a
puts "Error in values" unless hsh.values.all? { |v| v == (num_loops * num_threads) / num_reads_per_write }
puts "Time elapsed: #{t1 - t0} s"

Ich bin immer folgende Ausgänge:

ruby 1.9.2p320 (2012-04-20 revision 35421) [x86_64-linux]
100 threads x 100 loops, 10:1 R/W ratio
Time elapsed: 5.763414627 s

jruby 1.7.0 (1.9.3p203) 2012-10-22 ff1ebbe on Java HotSpot(TM) 64-Bit Server VM 1.6.0_26-b03 [linux-amd64]
100 threads x 100 loops, 10:1 R/W ratio
Time elapsed: 1.697 s

Was haltet Ihr von dieser?

Diese Lösung ist ähnlich, wie könnte man dies lösen, in Scala oder Clojure, obwohl in diesen Sprachen würde man eher mit software transactional memory mit low-level-CPU-Unterstützung für die Atomare compare-and-swap-Operationen, die implementiert sind.

Bearbeiten: Es ist erwähnenswert, dass ein Grund, warum der hamster Umsetzung ist schnell ist, dass es verfügt über eine lock-free Lesen Pfad. Bitte Antworten Sie in den Kommentaren, wenn Sie Fragen haben, oder wie es funktioniert.

InformationsquelleAutor ms-tg

1

diese (video, pdf) ist über lock-free hash-Tabelle in Java implementiert.

spoiler: verwendet atomic Compare-And-Swap (CAS) Operationen, wenn nicht in Ruby könnte man emulieren Sie mit sperren. nicht sicher, ob das hätte keinen Vorteil gegenüber dem einfachen lock-bewacht hashtables
- Die Frage ausdrücklich gesagt, dass eine Java-Lösung nicht akzeptiert werden würde.
- es ist keine Umsetzung, es ist ein Algorithmus Präsentation.
- Dies ist eine gute Diskussion über die Optimierung hash-Tabellen auf die Prozessor-core-Ebene, Umgang mit cache-lines, cache-misses und cache-Kohärenz-primitiven. Es ist nicht hilfreich, um ein problem zu lösen in pure Ruby, obwohl.
- es ist alles spezifisch auf lock-freie algorithmen
- wie verträgt sich dieser auf meine Antwort mit dem hamster Juwel unten?
- AFAICT, Ihre Antwort ist über unveränderliche Strukturen. Das ist eine ganz andere Art und Weise zu erreichen, Parallelität, mit sehr verschiedenen Kompromisse.
- jedoch, die Schnittmenge ist, dass würde man mit atomic Compare-And-Swap ersetzen die "amtliche" Referenz auf die neue unveränderliche Struktur
- zu klären, kann man entweder ein einzelnes CAS-Zelle für die Referenz auf das immutable Datenstruktur als ganzes, oder man kann einen separaten CAS-Zelle für jeden veränderlichen Schlitz in der veränderliche Daten-Struktur. Macht das Sinn?
- nicht sicher, was Sie Fragen; CAS ist eine Aktion, nicht ein Objekt. schreib besser eine separate Frage.
- Ja, ich verstehe, was CAS ist. Ob Sie sich vergleichen-und-tauschen ein Verweis auf eine unveränderliche Struktur der Daten, oder verwenden Sie stattdessen mutable Datenstrukturen, die sich selbst nicht vergleichen-und-tauschen jedes interne element, beispielsweise als Liste von Zeigern oder hash-Elemente, war die Unterscheidung.
InformationsquelleAutor Javier
1

Nicht getestet, und einen naiven stechen um die Optimierung für liest. Es wird davon ausgegangen, dass die meisten der Zeit, wird der Wert nicht gesperrt werden. Wenn Sie es ist, die enge Schleife wird versuchen, bis es ist. Ich legte Thread.critical dort zu helfen, sicherzustellen, dass die gelesenen threads nicht ausgeführt werden, bis das schreiben beendet ist. Nicht sicher, ob der kritische Teil ist gebraucht, es hängt wirklich davon ab, wie gelesen-schwere meinst du, so einige benchmarking ist in Ordnung.
```
class ConcurrentHash < Hash

  def initialize(*args)
    @semaphore = Mutex.new
    super
  end

  def []=(k,v)
    begin
      old_crit = Thread.critical
      Thread.critical = true unless old_crit
      @semaphore.synchronize { super }
    ensure
      Thread.critical = old_crit
    end
  end

  def [](k)
    while(true)
      return super unless @semaphore.locked?
    end
  end

end
```
Gibt es vielleicht ein paar anderen lese-Methoden, müssen Sie die @semaphore sperren, ich weiß nicht, ob alles andere ist implementiert #[].
- Ich denke, das wird Rennen die Bedingungen, unter JRuby.
- Dein reader ist nicht sicher, denn super ist nicht atomar. Wir müssen sicherstellen, dass keine schreibt dann starten, wenn die Leute Lesen.
InformationsquelleAutor Paul
1

ich bin mir ziemlich unklar, was damit gemeint ist. ich denke, die einfachste Implementierung ist einfach
```
Hash
```
ist zu sagen, dass die eingebauten ruby-hash ist threadsicher, wenn durch threadsicher, du meinst nicht die Luft zu sprengen, falls > 1 threads versucht, darauf zuzugreifen. dieser code wird sicher für immer
```
n = 4242
hash = {}

loop do
  a =
    Thread.new do
      n.times do
        hash[:key] = :val
      end
    end

  b =
    Thread.new do
      n.times do
        hash.delete(:key)
      end
    end

  c =
    Thread.new do
      n.times do
        val = hash[:key]
        raise val.inspect unless [nil, :val].include?(val)
      end
    end

  a.join
  b.join
  c.join
  p :THREADSAFE
end
```
ich vermute, mit der thread-sicheren Sie wirklich meinen SÄURE - zum Beispiel ein schreiben wie hash[:key]=:val, gefolgt von einer gelesen hat[:key] zurückkehren würde :val. aber keine Menge von Tricks, mit der sperren können vorsehen, dass - die Letzte in würden immer gewinnen. zum Beispiel, sagen, Sie haben 42 Gewinde alle aktualisieren threadsicher hash - welcher Wert gelesen werden soll, die 43'rd?? sicherlich threasafe Sie nicht bedeuten, eine Art von Gesamt-Bestellung schreibt - also wenn 42 threads aktiv waren, schreiben die "richtige" Wert ist alle Recht? aber ruby ' s eingebaute Hash-funktioniert genau auf diese Weise...

vielleicht meinst du so etwas wie
```
hash.each do ...
```
in einem thread, und
```
hash.delete(key)
```
würden sich nicht gegenseitig stören? ich kann mir vorstellen wollen, dass threadsicher, aber das ist noch nicht einmal sicher in einer single thread mit dem MRI-ruby (natürlich werden Sie nicht ändern können eine hash-während der Iteration über es)

so können Sie präzisieren, was du meinst mit 'threadsicher' ??

nur so ACID-Semantik wäre ein grober Sperre (sicher, das könnte eine Methode sein, nahm einen block - aber noch eine externe-Sperre).

ruby ' s thread-scheduler ist nicht nur zu planen, ein thread genau in der Mitte von einem beliebigen c-Funktion (wie die built-in hash-aref aset-Methoden), so dass diese effektiv sind threadsicher.
- Zumindest kann ich verlangen, dass, wenn zwei threads versuchen, einen Schlüssel in der gleichen Zeit, beide gesetzt sind, und dass, wenn mehrere threads führen ein schreiben + Lesen Sie in der Folge auf die gleiche Taste, die nur zwei mögliche Werte gelesen werden würde, diejenigen, die gesetzt sind (D. H. nicht null). Ich bin nicht damit zufrieden, zu beobachten, MRT-Verhalten, denn ich möchte die Lösung, um in Fällen von wahren gleichzeitig liest und/oder schreibt, wie in JRuby.
- ich muss sagen, es scheint wie ein bug in jruby, dass hash-schreibt und liest, sind nicht atomar, aber das ist in der Tat der Fall. ich will darauf hinweisen, dass ruby-Hash erhalten Sie diese kostenlos in 1,8 und 1,9, also wirklich, Sie wollen ein Werk, das gibt einfach Hash, es sei denn, Sie sind in jruby.
- Ich bin nicht davon überzeugt, dass "threads nicht gleichzeitig zu betreiben" kann als ein Merkmal von Ruby. Ich halte den thread-scheduler in der MRT (mit 10ms timeslices), um eine Implementierung detail -- und ich wollen sowohl MRI und andere Implementierungen, frei zu sein zu verbessern threading-Semantiken ohne solche Verbesserungen, als ein bug.
- Ich glaube, du verpasst diesen Teil der Frage: "muss thread-safe in allen Ruby-Implementierungen, einschließlich diejenigen, die arbeiten in einer wahrhaft gleichzeitigen Mode, wie JRuby"
InformationsquelleAutor ara t howard

Leider kann ich nicht hinzufügen, einen Kommentar zu Michael Sofaer Antwort, wo er eingeführt: Klasse RWLock und Klasse LockedHash mit @reader_count etc. (die haben nicht genug karma noch)

Dass die Lösung nicht funktioniert. Gibt es einen Fehler:
in `unlock': Versuch zum entsperren eines mutex, die nicht gesperrt ist (ThreadError)

Aufgrund der logischen Fehler: wenn es Zeit zu entsperren Dinge wieder entsperren, passiert 1 extra Zeit (wegen fehlender überprüfen my_block?(). Stattdessen verstopfte es auch, wenn die Entsperrung nicht notwendig war "mein block") und so 2. freischalten auf schon freigeschaltet stumm wirft eine exception. (Ich werde einfügen vollständigen code, wie Sie diesen Fehler zu reproduzieren, die am Ende von diesem post).

Auch Michael erwähnt, "die jede Methode ist unsicher (können Mutationen durch andere threads während einer iteration)" das war wichtig für mich, so dass ich am Ende mit dieser vereinfachten Lösung, die funktioniert für alle meine Anwendungsfälle und es einfach sperren mutex auf jedem Aufruf alle hash-Methode aufgerufen, wenn aus dem anderen thread (Anrufe aus dem gleichen thread, in dessen Besitz sich das Schloss nicht blockieren, um deadlocks zu vermeiden):

#
# This TrulyThreadSafeHash works!
#
# Note if one thread iterating the hash by #each method
# then the hash will be locked for all other threads (they will not be 
# able to even read from it)
#
class TrulyThreadSafeHash
  def initialize
    @mutex = Mutex.new
    @hash = Hash.new
  end

  def method_missing(method_sym, *arguments, &block)

    if !@mutex.owned?  # Returns true if this lock is currently held by current thread
        # We're trying to lock only if mutex is not owned by the current thread (is not locked or is locked by some other thread).
        # Following call will be blocking if mutex locked by other thread:
        @mutex.synchronize{
            return lambda{@hash.send(method_sym,*arguments, &block)}.call
        }
    end

    # We already own the lock (from current thread perspective).
    # We don't even check if @hash.respond_to?(method_sym), let's make Hash
    # respond properly on all calls (including bad calls (example: wrong method names))
    lambda{@hash.send(method_sym,*arguments, &block)}.call
  end

  # since we're tyring to mimic Hash we'll pretend to respond as Hash would
  def self.respond_to?(method_sym, include_private = false)
    Hash.respond_to(method_sym, include_private)
  end

  # override Object's to_s because our method_missing won't be called for to_s
  def to_s(*arguments)
      @mutex.synchronize{
        return @hash.to_s
      }
  end

  # And for those, who want to run extra mile:
  # to make our class json-friendly we shoud require 'json' and uncomment this:
  #def to_json(*options)
  #    @mutex.synchronize{
  #        return @hash.to_json(*options)
  #    }
  #end

end

Und nun das vollständige Beispiel zu veranschaulichen bzw. zu reproduzieren, den Fehler der doppelten Erschließung in Michael Sofaer Lösung:

#!/usr/bin/env ruby

# ======= unchanged copy-paste part from Michael Sofaer answer (begin) =======

class LockedHash
  def initialize
    @hash = Hash.new
    @lock = ThreadAwareLock.new()
    @reader_count = 0
  end

  def [](key)
    @lock.lock_read
    ret = @hash[key]
    @lock.unlock_read
    ret
  end

  def []=(key, value)
    @lock.lock_write
    @hash[key] = value
    @lock.unlock_write
  end

  def method_missing(method_sym, *arguments, &block)
    if @hash.respond_to? method_sym
      @lock.lock_block
      val = lambda{@hash.send(method_sym,*arguments, &block)}.call
      @lock.unlock_block
      return val
    end
    super
  end
end



class RWLock
  def initialize
    @outer = Mutex.new
    @inner = Mutex.new
    @reader_count = 0
  end
  def lock_read
    @outer.synchronize{@inner.synchronize{@reader_count += 1}}
  end
  def unlock_read
    @inner.synchronize{@reader_count -= 1}
  end
  def lock_write
    @outer.lock
    while @reader_count > 0 ;end
  end
  def unlock_write
    @outer.unlock
  end
end

class ThreadAwareLock < RWLock
  def initialize
    @owner = nil
    super
  end
  def lock_block
    lock_write
    @owner = Thread.current.object_id
  end
  def unlock_block
    @owner = nil
    unlock_write
  end
  def lock_read
    super unless my_block?
  end
  def unlock_read
    super unless my_block?
  end
  def lock_write
    super unless my_block?
  end
  def unlock_write
    super unless my_block?
  end
  def my_block?
    @owner == Thread.current.object_id
  end
end

# ======= unchanged copy-paste part from Michael Sofaer answer (end) =======


# global hash object, which will be 'shared' across threads
$h = LockedHash.new

# hash_reader is just iterating through the 'shared' hash $h
# and prints specified delimeter (capitalized when last hash item read)
def hash_reader(delim)
    loop{
        count = 0
        $h.each{
            count += 1
            if count != $h.size
                $stderr.print delim
            else
                $stderr.puts delim.upcase
            end
        }
    }
end

# fill hash with 10 items
10.times{|i|
    $h[i] = i
}

# create a thread which will read $h hash
t1 = Thread.new(){
    hash_reader("o")
}

t1.join  # will never happen, but for completeness

die gibt die folgende Fehlermeldung:

./LockedHash_fails_to_unlock.rb
oooooooooO
./LockedHash_fails_to_unlock.rb:55:in `unlock': Attempt to unlock a mutex which is not locked (ThreadError)
        from ./LockedHash_fails_to_unlock.rb:55:in `unlock_write'
        from ./LockedHash_fails_to_unlock.rb:82:in `unlock_write'
        from ./LockedHash_fails_to_unlock.rb:70:in `unlock_block'
        from ./LockedHash_fails_to_unlock.rb:29:in `method_missing'
        from ./LockedHash_fails_to_unlock.rb:100:in `block in hash_reader'
        from ./LockedHash_fails_to_unlock.rb:98:in `loop'
        from ./LockedHash_fails_to_unlock.rb:98:in `hash_reader'
        from ./LockedHash_fails_to_unlock.rb:119:in `block in <main>'

InformationsquelleAutor Dmitry Shevkoplyas

-1

Da Sie erwähnen die Hash wäre Lesen schwer, mit einer mutex-locking mit lese-und Schreibvorgänge führen würde, race conditions, die sind wohl durch liest. Wenn das ok mit Ihnen ist, dann ignorier die Antwort.

Wenn Sie wollen, zu geben, schreibt eine Priorität, ein read-write lock helfen würde. Der folgende code basiert auf einem alten c++ - Zuordnung für Betriebssysteme Klasse, so könnte nicht beste Qualität, aber gibt eine Allgemeine Vorstellung.

require 'thread'

class ReadWriteLock
  def initialize
    @critical_section = Mutex.new
    @are_writers_finished = ConditionVariable.new
    @are_readers_finished = ConditionVariable.new
    @readers = 0
    @writers = 0
    @writer_locked = false
  end

  def read
    begin
      start_read
      yield
    ensure
      end_read
    end
  end

  def start_read
    @critical_section.lock
    while (@writers != 0 || @writer_locked)
      @are_writers_finished.wait(@critical_section)
    end
    @readers += 1
    @critical_section.unlock
  end

  def end_read
    @critical_section.lock
    if (@readers -= 1) == 0
      @are_readers_finished.broadcast
    end
    @critical_section.unlock
  end

  def write
    begin
      start_write
      yield
    ensure
      end_write
    end
  end

  def start_write
    @critical_section.lock
    @writers += 1
    while @readers > 0
      @are_readers_finished.wait(@critical_section)
    end
    while @writer_locked
      @are_writers_finished.wait(@critical_section)
    end
    @writers -= 1
    @writer_locked = true
    @critical_section.unlock
  end

  def end_write
    @critical_section.lock
    @writer_locked = false
    @are_writers_finished.broadcast
    @critical_section.unlock
  end
end

Dann nur wickeln Sie []= und [] in Sperre.write und lock.Lesen. Könnte sich auf die Leistung auswirken, aber die Garantie, dass schreibt, wird 'durchkommen' der liest. Nützlichkeit dieser hängt davon ab, wie Lesen schwer es eigentlich ist.

Falsch. Eine einzelne mutex gibt gleich Priorität jeder Leser oder Schriftsteller.

InformationsquelleAutor grk

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.