RabbitMQ-cluster nicht wiederherstellen der Verbindung nach Netzwerk-Ausfall

Ich habe RabbitMQ-cluster mit zwei Knoten, die in der Produktion und der cluster bricht mit folgenden Fehlermeldungen:

=ERROR REPORT==== 23-Dec-2011::04:21:34 ===
** Knoten rabbit@rabbitmq02 reagiert nicht **
** Entfernen (timedout) - Anschluss **

=INFO REPORT==== 23-Dec-2011::04:21:35 ===
Knoten rabbit@rabbitmq02 verloren 'rabbit'

=ERROR REPORT==== 23-Dec-2011::04:21:49 ===
Mnesia(rabbit@rabbitmq01): ** ERROR ** mnesia_event bekam {inconsistent_database, running_partitioned_network, rabbit@rabbitmq02}

Habe ich versucht zu simulieren, das problem durch das töten der Verbindung zwischen zwei Knoten mit "tcpkill", die cluster getrennt wurde,und überraschend die beiden Knoten nicht versucht zu verbinden !

Wenn der cluster bricht, load balancer haproxy noch Noten sowohl Knoten als aktiv und Anfrage senden, um beide von Ihnen, obwohl Sie nicht in einem cluster.

Meine Fragen:

  1. Wenn die Knoten konfiguriert sind, um als ein cluster, wenn ich einen Netzwerk-Ausfall , warum nicht Sie versuchen, erneut zu verbinden, nachdem ?
  2. Wie erkenne ich defekte cluster und shutdown einer der Knoten ? Ich habe die Konsistenz Probleme bei der Arbeit mit der zwei-Knoten getrennt.

InformationsquelleAutor Ranch | 2011-12-28

Schreibe einen Kommentar