Wie benutze ich den ELB s HealthyHostCount für die überwachung der in CloudWatch?

Wir haben drei EC2-instances—eine in jeder availability zone (AZ) in der eu-west-1-region. Sie sind loadbalanced mit ELB. Wir möchten, um zu überwachen, wie viele Instanzen registriert sind, auf die loadbalancer, die Verwendung von CloudWatch. Das problem ist: ich weiß nicht wirklich verstehen, die HealthyHostCount Metrik.

Für einen Einsatz, wir möchten in der Lage sein, zu de-registrieren einer einzigen Instanz (nehmen Sie es aus dem LB) ohne Kenntnis. Also, der alarm wäre: Benachrichtigen Sie, wenn es nur 1 gesund Instanz Links hinter dem loadbalancer für 5 Minuten.

Soweit ich das verstanden habe, HealthyHostCount (HHC) ist die Anzahl der Instanzen, die registriert sind, die mit einer bestimmten ELB, gemittelt über alle AZs. Wenn alles in Ordnung ist, wird der HHC-1 sein soll (egal über welchen Zeitraum), weil es ist 1 Instanz in jedem AZ.

Vor ein paar Tagen, jemand bereitgestellt, ohne sich erneut zu registrieren und die Instanzen, also gab es nur 1 Instanz ausgeglichen wird. Als wir merkten, dass wir erstellt ein alarm war, uns zu Benachrichtigen, wenn der Durchschnittliche HHC versenkt unter 0,6 nach 5 Minuten. (Wenn nur 1 Instanz registriert ist, in der ELB, der HHC sollte durchschnittlich 0,33 für einen beliebigen Zeitraum.) Allerdings, wird der alarm nie geändert Zustand "ALARM."

Wenn ich überprüft die HHC in CloudWatch, der HHC waren zahlen, die nicht sinnvoll (Summe 10,0 für ein 5-Minuten-Intervall ist alle, jetzt erinnere ich mich).

Es ist alles ein großes Durcheinander für mich. Jedes mal, wenn ich denke, ich verstehe die Metrik, die CloudWatch-charts sind alles Kauderwelsch für mich.

Könnte mir bitte jemand erklären, wie man HHC zu bekommen einen alarm, wenn nur 1 Instanz registriert ist? Durchschnittlich HHC-der Weg zu gehen oder sollte ich eine andere Metrik?

InformationsquelleAutor awendt | 2012-07-23

7

Den HealthyHostCount Metrische Datensätze eines data-Wert mit der Anzahl der verfügbaren hosts für jede availability zone, jedes mal, wenn ein Gesundheits-check durchgeführt wird. Ihre ELB Gesundheits-check hat einen Interval parameter, der definiert, wie viele Gesundheits-checks ausgeführt werden, pro minute.

Wenn Sie beobachten, wie ein Pro-AZ-Metrik, mit einem Gesundheits-check Interval von 10 Sekunden, mit 2 gesunden hosts, die AZ, Sie werden sehen, 6 Datenpunkten pro minute (60/10) mit einem Wert von 2. Der Mittelwert, max und min eine 2, aber die Summe wird 6*2=12.

Wenn du 3 AZs mit 2 hosts, die jeweils wieder mit einer Interval=10; suchen Sie auf der Pro-LB Metrisch, sehen Sie 3*6=18 Datenpunkte pro minute, jeweils mit einem Wert von 2. Der Mittelwert, max und min eine 2, aber die Summe wird 18*2=36

Empfehle ich Ihnen, um set-up ein Intervall-Wert, den können Sie sich teilen 60 Sekunden 5, 6, 10, 15, 20, 30 oder 60 Sekunden).

In deinem Fall, wenn das Intervall 30 Sekunden, und Sie haben 3 AZs und 1 server pro AZ: Man sollte erwarten, dass die 2 Datenpunkte pro AZ pro minute, also set-up-alarm Pro-LB, mit einem Period 1 minute, für Sum of HealthyHostCount auslöst, wenn der Wert LowerOrEqual als 2 (2 data values * 1 Healthy AZ * 1 healthy server = 2, die anderen 4 Daten-Werte von dem ungesunden AZs sollte 0 sein, so dass Sie keine Auswirkung auf die Summe).

UPDATE:

Es stellt sich heraus,, dass die Zahl der Gesundheits-check ausgeführt, hängt auch von der Anzahl der internen Instanzen, die Formen der ELB (ussually eine pro AZ), also, wenn Sie leiden unter einer Spitzenlast, oder genug laden, um nur ein einzelner elb-intern-Instanz, die Menge des internen Servern innerhalb der ELB wird wachsen, und Sie werden mehr Daten Punkte unerwartet. Dies kann Auswirkungen auf die sum Wert, nur wenn Sie viel Verkehr. Ich habe nicht gesehen, dieses Problem mit einer Spitzenlast von 6k U /MIN verteilt in 3 AZs. Wenn dies Ihr Szenario, dann mit average ist eine sicherere Wette, aber ich würde empfehlen, dass Sie verwenden LowerThan 0.65 als deine Schwelle.

Den link auch Frage ich mich wie funktioniert das Cross-Zone Load Balancing Funktion wirkt sich auf die Menge der Daten, die Punkte...
- Vielen Dank für diese ausführliche und tolle Erklärung!
InformationsquelleAutor Gerardo Grignoli
4

Dies ist ein Bereich, wo die CloudWatch-web-Konsole nicht aussetzen, alles, was cloud watch für Sie tun kann. Als die docs erklären, HealthyHostCount ist ein pro availability zone Metrik. Mit der Konsole können Sie HealthHostCount durch die availability zone (aber in allen load-Balancer) oder durch load balancer (aber über alle Zonen), aber nicht in Scheiben geschnitten, in beide Richtungen.

Wenn Sie nur ein load balancer die einfachste Sache wäre, um das setup ein alarm auf jeder der pro-zone-Metriken. Wenn Sie mehrere availability zones, dann sollten Sie in der Lage sein, um die api verwenden, um einen alarm erstellen, schneiden über die Verfügbarkeit zone und Lastenausgleich (wieder ein alarm pro load balancer), aber Sie können nicht dies tun, aus dem web-UI, soweit ich weiß.

InformationsquelleAutor Frederick Cheung

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.