Kafka auf Kubernetes multi-node

Also mein Ziel hier ist ein cluster von mehreren kafka-Broker in einem Mode verteilt. Aber ich kann nicht sehen den Weg, um den Broker zu wissen, jeder anderen.

Soweit ich das verstanden habe, jeder broker muss mit einer eigenen ID in Ihre config, das kann ich nicht garantieren, oder zu konfigurieren, wenn ich starten Sie den Behälter von kubernetes?

Werden Sie auch brauchen, um die gleiche advertised_host?

Gibt es irgendwelche Parameter, die ich bin fehlt, was müsste geändert werden für die Knoten gegenseitig zu entdecken?

Wäre es sinnvoll einen solchen Konfiguration am Ende der Dockerfile mit einem Skript? Und/oder ein gemeinsames Volumen?

Ich bin versucht derzeit, dies zu tun mit der spotify/kafka-Bild, das hat eine vorkonfigurierte Tierpfleger+kafka Kombination, auf Vanille Kubernetes.

InformationsquelleAutor NegatioN | 2015-08-21

11

Meine Lösung für dieses wurde zu verwenden Sie die IP-Adresse als ID: schneiden Sie die Punkte und Sie erhalten eine eindeutige ID, die auch außerhalb der container in andere Container.

Mit Service können Sie den Zugriff auf die mehrere Container s-IPs (siehe meine Antwort hier auf, wie dies zu tun:
was ist der beste Weg zu lassen kubenetes pods untereinander kommunizieren?

so können Sie Ihre IDs, wenn Sie einen nutzen IPs als eindeutige ID.
Das einzige Problem ist, dass die IDs sind nicht fortlaufend oder bei 0 beginnen, aber Tierpfleger /kafka scheinen nicht in den Sinn.

EDIT 1:

Den follow-up betrifft konfigurieren Tierpfleger:

Jeder ZK-Knoten kennen muss, der die anderen Knoten. Die Kubernetes-discovery-Dienst knowns von Knoten, die innerhalb einer Service so ist die Idee, starten Sie eine Service mit dem ZK-Knoten.

Dieser Dienst muss gestartet werden, BEVOR die Erstellung der ReplicationController (RC) der Tierpfleger Hülsen.

Start-up-Skript von der ZK-container müssen dann:
- warten, bis die discovery-service zum Auffüllen der ZK-Service, mit dessen Knoten (das dauert ein paar Sekunden, für die ich jetzt nur noch ein sleep 10 am Anfang von meinem startup-Skript, aber mehr zuverlässig sollten Sie sich für den service mindestens 3 Knoten drin.)
- schauen die Container bilden das Service der discovery service:
  dies geschieht durch die Abfrage der API.
  die KUBERNETES_SERVICE_HOST Umgebungsvariable ist in jedem container.
  Den Endpunkt zu finden, die service-Beschreibung ist dann
URL="http(s)://$USERNAME:$PASSWORD@${KUBERNETES_SERVICE_HOST/api/v1/namespaces/${NAMESPACE}/endpoints/${SERVICE_NAME}"

wo NAMESPACE ist default es sei denn, Sie ändern es, und SERVICE_NAME wäre Tierpfleger wenn Sie Ihren Namen service Tierpfleger.

dort bekommen Sie die Beschreibung der Behälter-formung der Service, mit dem Ihre ip in eine "ip" - Feld.
Sie tun kann:
```
curl -s $URL | grep '\"ip\"' | awk '{print $2}' | awk -F\" '{print $2}' 
```
um die Liste der IP-Adressen in den Dienst.
Mit, dass, bevölkern den zoo.cfg auf den Knoten mit der ID oben definiert

Müssen Sie möglicherweise die BENUTZERNAME und PASSWORT erreichen Sie den Endpunkt auf Dienste wie google container Motor. Diese müssen in einem Geheimnis Volumen (siehe doc hier: http://kubernetes.io/v1.0/docs/user-guide/secrets.html )

Würden Sie auch verwenden müssen curl -s --insecure auf Google Container Engine, es sei denn, Sie gehen durch die Mühe der Zugabe der CA-cert, um Ihre Hülsen

Im Grunde fügen Sie die Lautstärke auf den container, und suchen Sie die Werte aus der Datei. (im Gegensatz zu dem, was der doc sagt, NICHT das \n am Ende von Benutzername oder Passwort als base64-Codierung: es ist einfach machen dein Leben kompliziert, wenn Sie mit der Lektüre dieser)

EDIT 2:

Andere Sache, die Sie tun müssen, auf die Kafka-Knoten ist die IP und den Hostnamen, und setzen Sie Sie in die Datei /etc/hosts.
Kafka scheint zu müssen, um zu wissen, die Knoten-Hostnamen ein, und diese werden nicht gesetzt, innerhalb der service-Knoten standardmäßig

EDIT 3:

Nach viel Versuch und Gedanken, die die Verwendung von IP als eine ID darf nicht so groß sein: es hängt davon ab, wie Sie konfigurieren die Lagerung.
für jegliche Art von verteilten service-wie Tierpfleger, kafka, mongo, hdfs, möchten Sie vielleicht die Verwendung der emptyDir Art der Lagerung, so ist es nur auf diesem Knoten (Montage eines remote storage Art von Niederlagen den Zweck der Verteilung dieser Dienste!)
emptyDir reload wird mit den Daten auf dem gleichen Knoten, so scheint es logischer, mit der KNOTEN-ID (Knoten-IP) wie die ID, weil dann eine Hülse, neu gestartet, auf dem gleichen Knoten wird die Daten auch haben.
Sie vermeiden mögliche Beschädigung von Daten (falls der neue Knoten beginnt, schreiben in der gleichen dir, dass ist nicht wirklich leer, wer weiß, was passieren kann) - und auch bei Kafka, der die Themen vergeben werden, die ein broker.id, wenn der broker-id ändert, Tierpfleger, aktualisiert nicht das Thema broker.id und dem Thema aussieht, ist es verfügbar, ABER die Punkte an den falschen broker.id und es ist eine Schweinerei.

Bisher habe ich noch nicht gefunden, wie man den Knoten IP zwar nicht, aber ich denke, es ist möglich zu nachschlagen in der API durch einen Blick in die service-Hülsen-Namen und dann auf den Knoten, der Sie bereitgestellt werden.

BEARBEITEN 4

Um die IP-Knoten, können Sie den pod hostname == Namen aus der API-Endpunkte
/api/v1/namespaces/default/Endpunkte/
wie oben erläutert.
dann können Sie die Knoten-IP aus dem pod Namen mit
/api/v1/namespaces/default/pods/

PS: dies ist inspiriert durch das Beispiel in den Kubernetes-repo (Beispiel für rethinkdb hier: https://github.com/kubernetes/kubernetes/tree/master/examples/rethinkdb
- Gute Idee! Dies scheint eine machbare Lösung! Ich es geschafft, dass alle meine Broker-IDs nun durch ein startup-script zu tun: BROKER_ID=$(ip addr | awk '/inet/ && /eth0/{sub(/\/.*$/,"",$2); print $2}' | sed -r 's/\.//g') und : sed -r -i "s/(Makler.id)=(.*)/\1=$BROKER_ID/g" $KAFKA_HOME/config/server.Eigenschaften
- Ich verwendete ip=$(hostname -i) Dann id=${ip//./}
- Kann ich auch Fragen, wie man hinzufügen, den Server /conf/zoo.cfg? Einen freigegebenen Datenträger, die in Wechselwirkung mit den Kafka-Service von Kubernetes?
- Also die Idee ist diese, und ich werde Bearbeiten Sie die Antwort mit mehr details: starten Sie einen Dienst, mit dem zk-Knoten, und einen Dienst, mit dem kafka-Knoten. dann starten Sie die Replikation controller für Tierpfleger. an diesem Punkt der service registrieren, wird die zk-Container... aber es dauert ein paar Sekunden. so mittlerweile Ihren container warten muss das discovery-service zum Auffüllen des zk container-Knoten. Ich habe eine 10sek pause in meinem Skript ab Tierpfleger zu berücksichtigen, aber es ist nicht ideal. dann schauen die IPs und bevölkern den zoo.cfg vor der Ausführung zk.
- Vielen Dank für die Gründliche Exemplarische Vorgehensweise! Welchen Benutzernamen und Passwort beziehen Sie sich? Der API-server sich selbst nehme ich an? Ich auth an den server mit einem cert atm. Ich sollte nachschlagen, wie LOCKE mit einem cert dann?
- Ja Benutzername und Kennwort für den API-server. gefunden werden können durch die Beschreibung der cluster in gke: gcloud beta-container-Clustern beschreiben <yourclustername>, Wenn Sie haben, dass die Arbeit mit einem Zertifikat ab, ich wäre daran interessiert zu wissen, wie Sie dies einrichten.
- Kelsey Hightower geschrieben hat, ein Intro to Kubernetes, wo die Installation von certs abgedeckt wird in den sub-Themen "PKI-Infrastruktur" und "versorgen Sie den Controller-Knoten". Später diese certs sind Hinzugefügt Kubectl Das Handbuch konzentriert sich auf CoreOS, aber ich sehe keinen Grund, warum es nicht funktionieren sollte, auf anderen Distributionen. 🙂 Vielen Dank nochmal für die Hilfe. Es ist nicht ausgeführt, noch nicht, aber mit dieser Anleitung habe ich nur selber Schuld!
- wow, erstaunlich zu finden... Danke für die links!
InformationsquelleAutor MrE
2

Anschauen
https://github.com/CloudTrackInc/kubernetes-kafka
Es ermöglicht das starten Kafka in kubernetes-und support-Skalierung und die automatische extanding.
- Dieser link ist ziemlich veraltet. Wahrscheinlich besser zu finden Strimzi oder Konfluent Ruder-Charts jetzt.
InformationsquelleAutor Alexander Gunin
2

Dies zeigt sich prominent in meinen Recherchen enthält aber ziemlich veraltete Informationen. So aktualisieren Sie diese mit einer moderneren Lösung, die Sie verwenden sollten ein StatefulSet Einsatz, generiert Hülsen, die einen integer-Zähler anstelle eines hash in Ihrem Namen, wie zB. kafka-controller-0.

Dies ist natürlich der hostname, also von daher ist es einfach, zu extrahieren, eine Feste, unveränderliche Makler-ID mit awk:
```
hostname | awk -F'-' '{print $3}'
```
Den beliebtesten Container für Kafka in diesen Tagen eine broker-ID-Befehl.

InformationsquelleAutor Keith Nordstrom

Ich Tat dies mit docker-Komponieren (Die Differenz für Kubernetes wäre, dass Sie würde übergeben Sie die ID über Ihren service.yaml und habe 2 Dienste):

kafka1:
  build: kafka-0.8.1/
  ports:
  - 9092
  links:
  - zookeeper
  environment:
  - ID=1
kafka2:
  build: kafka-0.8.1/
  ports:
  - 9092
  links:
  - zookeeper
  environment:
  - ID=2

Config:

broker.id=${ID}
port=9092
advertised.host.name=${HOST}
advertised.port=9092
num.network.threads=3
num.io.threads=8
socket.send.buffer.bytes=102400
socket.receive.buffer.bytes=102400
socket.request.max.bytes=104857600
log.dirs=/kafka/kafka-logs-${ID}
num.partitions=200
num.recovery.threads.per.data.dir=1
log.retention.hours=168
log.segment.bytes=1073741824
log.retention.check.interval.ms=300000
log.cleaner.enable=false
zookeeper.connect=${DOCKER_ZOOKEEPER_1_PORT_2181_TCP_ADDR}:${DOCKER_ZOOKEEPER_1_PORT_2181_TCP_PORT}
zookeeper.connection.timeout.ms=6000

sh:

#!/bin/bash
echo "Running config"
export HOST=`grep $HOSTNAME /etc/hosts | awk '{print $1}'`
export ID=${ID:?}
perl -p -i -e 's/\$\{([^}]+)\}/defined $ENV{$1} ? $ENV{$1} : $&/eg' < /broker.template > $KAFKA_HOME/config/server.properties
echo "Done"
echo "starting kafka with:"
echo "$KAFKA_HOME/config/server.properties"
echo ""
cat $KAFKA_HOME/config/server.properties
$KAFKA_HOME/bin/kafka-server-start.sh $KAFKA_HOME/config/server.properties

Sind Sie sicher, es ist möglich, pass-Umwelt-Variablen, die durch einen kubernetes-service? denn außer, dass ich sehen dies als eine Lösung.
Es gibt einen Weg: github.com/kubernetes/kubernetes/issues/4710
Diese Gespräche über die übergabe Umwelt-Variablen, die in Hülsen oder ReplicationControllers? Ich bin mir bewusst, das ist möglich, aber gilt das auch bedeuten, dass es getan werden kann, in einem Service?

InformationsquelleAutor JuanIsFree

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.