Wie benutze ich den ELB s HealthyHostCount für die überwachung der in CloudWatch?
Wir haben drei EC2-instances—eine in jeder availability zone (AZ) in der eu-west-1-region. Sie sind loadbalanced mit ELB. Wir möchten, um zu überwachen, wie viele Instanzen registriert sind, auf die loadbalancer, die Verwendung von CloudWatch. Das problem ist: ich weiß nicht wirklich verstehen, die HealthyHostCount
Metrik.
Für einen Einsatz, wir möchten in der Lage sein, zu de-registrieren einer einzigen Instanz (nehmen Sie es aus dem LB) ohne Kenntnis. Also, der alarm wäre: Benachrichtigen Sie, wenn es nur 1 gesund Instanz Links hinter dem loadbalancer für 5 Minuten.
Soweit ich das verstanden habe, HealthyHostCount
(HHC) ist die Anzahl der Instanzen, die registriert sind, die mit einer bestimmten ELB, gemittelt über alle AZs. Wenn alles in Ordnung ist, wird der HHC-1 sein soll (egal über welchen Zeitraum), weil es ist 1 Instanz in jedem AZ.
Vor ein paar Tagen, jemand bereitgestellt, ohne sich erneut zu registrieren und die Instanzen, also gab es nur 1 Instanz ausgeglichen wird. Als wir merkten, dass wir erstellt ein alarm war, uns zu Benachrichtigen, wenn der Durchschnittliche HHC versenkt unter 0,6 nach 5 Minuten. (Wenn nur 1 Instanz registriert ist, in der ELB, der HHC sollte durchschnittlich 0,33 für einen beliebigen Zeitraum.) Allerdings, wird der alarm nie geändert Zustand "ALARM."
Wenn ich überprüft die HHC in CloudWatch, der HHC waren zahlen, die nicht sinnvoll (Summe 10,0 für ein 5-Minuten-Intervall ist alle, jetzt erinnere ich mich).
Es ist alles ein großes Durcheinander für mich. Jedes mal, wenn ich denke, ich verstehe die Metrik, die CloudWatch-charts sind alles Kauderwelsch für mich.
Könnte mir bitte jemand erklären, wie man HHC zu bekommen einen alarm, wenn nur 1 Instanz registriert ist? Durchschnittlich HHC-der Weg zu gehen oder sollte ich eine andere Metrik?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Den
HealthyHostCount
Metrische Datensätze eines data-Wert mit der Anzahl der verfügbaren hosts für jede availability zone, jedes mal, wenn ein Gesundheits-check durchgeführt wird. Ihre ELB Gesundheits-check hat einenInterval
parameter, der definiert, wie viele Gesundheits-checks ausgeführt werden, pro minute.Wenn Sie beobachten, wie ein Pro-AZ-Metrik, mit einem Gesundheits-check
Interval
von 10 Sekunden, mit 2 gesunden hosts, die AZ, Sie werden sehen, 6 Datenpunkten pro minute (60/10
) mit einem Wert von 2. Der Mittelwert, max und min eine 2, aber die Summe wird6*2=12
.Wenn du 3 AZs mit 2 hosts, die jeweils wieder mit einer
Interval
=10; suchen Sie auf der Pro-LB Metrisch, sehen Sie3*6=18
Datenpunkte pro minute, jeweils mit einem Wert von 2. Der Mittelwert, max und min eine 2, aber die Summe wird18*2=36
Empfehle ich Ihnen, um set-up ein Intervall-Wert, den können Sie sich teilen 60 Sekunden 5, 6, 10, 15, 20, 30 oder 60 Sekunden).
In deinem Fall, wenn das Intervall 30 Sekunden, und Sie haben 3 AZs und 1 server pro AZ: Man sollte erwarten, dass die 2 Datenpunkte pro AZ pro minute, also set-up-alarm Pro-LB, mit einem
Period
1 minute, fürSum of HealthyHostCount
auslöst, wenn der Wert LowerOrEqual als 2 (2 data values * 1 Healthy AZ * 1 healthy server = 2
, die anderen 4 Daten-Werte von dem ungesunden AZs sollte 0 sein, so dass Sie keine Auswirkung auf die Summe).UPDATE:
Es stellt sich heraus,, dass die Zahl der Gesundheits-check ausgeführt, hängt auch von der Anzahl der internen Instanzen, die Formen der ELB (ussually eine pro AZ), also, wenn Sie leiden unter einer Spitzenlast, oder genug laden, um nur ein einzelner elb-intern-Instanz, die Menge des internen Servern innerhalb der ELB wird wachsen, und Sie werden mehr Daten Punkte unerwartet. Dies kann Auswirkungen auf die
sum
Wert, nur wenn Sie viel Verkehr. Ich habe nicht gesehen, dieses Problem mit einer Spitzenlast von 6k U /MIN verteilt in 3 AZs. Wenn dies Ihr Szenario, dann mitaverage
ist eine sicherere Wette, aber ich würde empfehlen, dass Sie verwenden LowerThan 0.65 als deine Schwelle.Den link auch Frage ich mich wie funktioniert das
Cross-Zone Load Balancing
Funktion wirkt sich auf die Menge der Daten, die Punkte...Dies ist ein Bereich, wo die CloudWatch-web-Konsole nicht aussetzen, alles, was cloud watch für Sie tun kann. Als die docs erklären,
HealthyHostCount
ist ein pro availability zone Metrik. Mit der Konsole können Sie HealthHostCount durch die availability zone (aber in allen load-Balancer) oder durch load balancer (aber über alle Zonen), aber nicht in Scheiben geschnitten, in beide Richtungen.Wenn Sie nur ein load balancer die einfachste Sache wäre, um das setup ein alarm auf jeder der pro-zone-Metriken. Wenn Sie mehrere availability zones, dann sollten Sie in der Lage sein, um die api verwenden, um einen alarm erstellen, schneiden über die Verfügbarkeit zone und Lastenausgleich (wieder ein alarm pro load balancer), aber Sie können nicht dies tun, aus dem web-UI, soweit ich weiß.