1. Einführung
Sie können einen Network-Load Balancer so konfigurieren, dass der Traffic auf den Backend-Instanzen des Load Balancers basierend auf den von einer HTTP-Systemdiagnose gemeldeten Gewichtungen mit gewichtetem Load Balancing verteilt wird.
Für das gewichtete Load Balancing müssen Sie Folgendes konfigurieren:
- Sie müssen die Ort-Load Balancer-Richtlinie (localityLbPolicy) des Backend-Dienstes auf WEIGHTED_MAGLEV festlegen.
- Sie müssen den Backend-Dienst mit einer HTTP‑, HTTP/2‑ oder HTTPS-Systemdiagnose konfigurieren. Die Antworten der HTTP-Systemdiagnose müssen das benutzerdefinierte Feld X-Load-Balancing-Endpoint-Weight des HTTP-Antwortheaders enthalten, um die Gewichtungen mit ganzzahligen Werten von 0 bis 1.000 in dezimaler Darstellung für jede Backend-Instanz anzugeben.
Wenn Sie dieselbe Instanzgruppe als Backend für mehrere auf dem Back-End-Dienst basierende Netzwerk-Load-Balancer mit gewichtetem Load-Balancing verwenden, wird empfohlen, für jede Systemdiagnose des Back-End-Dienstes einen eindeutigen Anfragepfad zu verwenden. Weitere Informationen finden Sie unter Erfolgskriterien für HTTP-, HTTPS- und HTTP/2-Systemdiagnosen.
Die HTTP-Systemdiagnose sollte eine HTTP-Antwort 200 (OK) zurückgeben, damit die Systemdiagnosen bestanden werden und die Backend-Instanz als fehlerfrei gilt. Wenn alle Back-End-Instanzen die Systemdiagnosen bestehen und „X-Load-Balancing-Endpoint-Weight“ mit dem Gewicht „0“ zurückgeben, verteilt der Load-Balancer neue Verbindungen zwischen den fehlerfreien Back-Ends und behandelt sie, als wären sie alle gleich gewichtet. Der Load-Balancer kann neue Verbindungen auch auf fehlerhafte Back-Ends verteilen. Weitere Informationen finden Sie unter Trafficverteilung.
Beispiele für das gewichtete Load Balancing finden Sie unter Backend-Auswahl und Verbindungs-Tracking.
Das gewichtete Load Balancing kann in den folgenden Szenarien verwendet werden:
- Wenn einige Verbindungen mehr Daten als andere verarbeiten oder einige Verbindungen länger bestehen als andere, kann die Verteilung der Backend-Last ungleichmäßig sein. Durch die Signalisierung einer niedrigeren Gewichtung pro Instanz kann eine Instanz mit hoher Auslastung den Anteil der neuen Verbindungen verringern und gleichzeitig die bestehenden Verbindungen bedienen.
- Wenn ein Backend überlastet ist und die Zuweisung weiterer Verbindungen zum Bruch bestehender Verbindungen führen kann, können solche Verbindungen sich selbst eine Nullgewichtung zuordnen. Durch die Meldung einer Nullgewichtung nimmt eine Backend-Instanz keine neuen Verbindungen mehr an, verarbeitet jedoch weiterhin vorhandene Verbindungen.
- Wenn ein Backend vorhandene Verbindungen vor der Wartung schnell bearbeitet, weist es sich selbst eine Nullgewichtung zu. Durch die Meldung einer Nullgewichtung nimmt eine Backend-Instanz keine neuen Verbindungen mehr an, verarbeitet jedoch weiterhin vorhandene Verbindungen.
Lerninhalte
- So konfigurieren Sie einen Network-Load Balancer, damit der Traffic auf den Backend-Instanzen des Load Balancers basierend auf den von einer HTTP-Systemdiagnose gemeldeten Gewichtungen mit gewichtetem Load Balancing verteilt wird.
Einrichtung der Umgebung im eigenen Tempo
- Melden Sie sich in der Google Cloud Console an und erstellen Sie ein neues Projekt oder verwenden Sie ein vorhandenes. Wenn Sie noch kein Gmail- oder Google Workspace-Konto haben, müssen Sie eins erstellen.
- Der Projektname ist der Anzeigename für die Teilnehmer dieses Projekts. Es handelt sich um einen String, der nicht von Google APIs verwendet wird. Sie können ihn jederzeit aktualisieren.
- Die Projekt-ID ist für alle Google Cloud-Projekte eindeutig und kann nach dem Festlegen nicht mehr geändert werden. In der Cloud Console wird automatisch ein eindeutiger String generiert. Normalerweise ist es nicht wichtig, wie dieser String aussieht. In den meisten Codelabs müssen Sie auf die Projekt-ID verweisen (sie wird in der Regel als
PROJECT_ID
angegeben). Wenn Ihnen die generierte ID nicht gefällt, können Sie eine andere zufällige ID generieren. Alternativ können Sie es mit einem eigenen Namen versuchen und sehen, ob er verfügbar ist. Sie kann nach diesem Schritt nicht mehr geändert werden und bleibt für die Dauer des Projekts bestehen. - Zur Information: Es gibt einen dritten Wert, die Projektnummer, die von einigen APIs verwendet wird. Weitere Informationen zu diesen drei Werten
- Als Nächstes müssen Sie die Abrechnung in der Cloud Console aktivieren, um Cloud-Ressourcen/-APIs zu verwenden. Die Durchführung dieses Codelabs sollte keine oder nur geringe Kosten verursachen. Wenn Sie Ressourcen herunterfahren möchten, damit Ihnen nach Abschluss dieser Anleitung keine Kosten mehr in Rechnung gestellt werden, können Sie die von Ihnen erstellten Ressourcen oder das gesamte Projekt löschen. Neuen Nutzern von Google Cloud steht das Programm Kostenlose Testversion mit einem Guthaben von 300$ zur Verfügung.
Cloud Shell starten
Während Sie Google Cloud von Ihrem Laptop aus per Fernzugriff nutzen können, wird in diesem Codelab Google Cloud Shell verwendet, eine Befehlszeilenumgebung, die in der Cloud ausgeführt wird.
Klicken Sie in der Google Cloud Console in der Symbolleiste oben rechts auf das Cloud Shell-Symbol:
Die Bereitstellung und Verbindung mit der Umgebung dauert nur einen Moment. Anschließend sehen Sie in etwa Folgendes:
Diese virtuelle Maschine verfügt über sämtliche Entwicklertools, die Sie benötigen. Sie bietet ein Basisverzeichnis mit 5 GB nichtflüchtigem Speicher und läuft in Google Cloud, was die Netzwerkleistung und Authentifizierung erheblich verbessert. Alle Aufgaben in diesem Codelab können in einem Browser ausgeführt werden. Sie müssen nichts installieren.
2. Konfiguration starten
Für das Codelab ist ein einzelnes Projekt erforderlich.
In dieser Anleitung erstellen Sie eine Instanzgruppe mit drei VM-Instanzen und weisen jeder Instanz Gewichte zu. Sie erstellen eine HTTP-Systemdiagnose, um die Gewichtungen von Backend-Instanzen zu melden. Der gewichtete Netzwerk-Load-Balancer ist für den Backend-Dienst mit der Ort-Load-Balancer-Richtlinie WEIGHTED_MAGLEV aktiviert.
Hinweis
- Lesen Sie die Übersicht über das Backend-Dienst-basierte externe Netzwerk-Load-Balancing.
- Installieren Sie die Google Cloud CLI. Eine vollständige Übersicht über das Tool finden Sie im Leitfaden zur gcloud CLI. Befehle für das Load-Balancing finden Sie in der Referenz für die API und gcloud CLI. Wenn Sie die Google Cloud CLI noch nicht ausgeführt haben, führen Sie zuerst gcloud init zur Authentifizierung aus.
- Aktivieren Sie die Compute API.
gcloud services enable compute.googleapis.com
Hinweis:Sie können die Google Cloud Console nicht verwenden, um die Load-Balancer-Richtlinie für Standorte zu konfigurieren und VM-Instanzen Gewichtungen zuzuweisen. Verwenden Sie stattdessen die Google Cloud CLI.
VPC-Netzwerk, Subnetze und Firewallregeln erstellen
Erstellen Sie ein VPC-Netzwerk, ein Subnetz und Firewallregeln zum Zulassen von eingehendem Traffic, um Verbindungen zu den Backend-VMs Ihres Load Balancers zuzulassen.
- Erstellen Sie ein VPC-Netzwerk und ein Subnetz. a. Führen Sie den Befehl
gcloud compute networks create
:
aus, um das VPC-Netzwerk zu erstellen.
gcloud compute networks create NETWORK_NAME --subnet-mode custom
b. In diesem Beispiel ist der primäre IPv4-Adressbereich des Subnetzes 10.10.0.0/24
.
Führen Sie den Befehl gcloud compute networks subnets create
aus, um das Subnetz zu erstellen:
gcloud compute networks subnets create SUBNET_NAME \ --network=NETWORK_NAME \ --range=10.10.0.0/24 \ --region=us-central1
Ersetzen Sie Folgendes:
NETWORK_NAME
: der Name des zu erstellenden VPC-Netzwerks.SUBNET_NAME
ist der Name des zu erstellenden Subnetzwerks.
- Erstellen Sie eine Firewallregel für eingehenden Traffic, damit an die TCP-Ports 80 und 443 gesendete Pakete an die Backend-VMs zugestellt werden können. In diesem Beispiel lässt die Firewallregel Verbindungen von jeder Quell-IP-Adresse zu. Die Firewallregel gilt für VMs mit dem Netzwerk-Tag
network-lb-tag
. Führen Sie dengcloud compute firewall-rules create
-Befehl aus, um die Firewallregel zu erstellen:
gcloud compute firewall-rules create FIREWALL_RULE_NAME \ --direction=INGRESS \ --priority=1000 \ --network=NETWORK_NAME \ --action=ALLOW \ --rules=tcp:80,tcp:443 \ --source-ranges=0.0.0.0/0 \ --target-tags=network-lb-tag
Ersetzen Sie FIREWALL_RULE_NAME
durch den Namen der zu erstellenden Firewallregel.
VM-Instanzen erstellen und Gewichte zuweisen
Erstellen Sie drei VM-Instanzen und weisen Sie ihnen Gewichte zu:
- Konfigurieren Sie drei Backend-VM-Instanzen so, dass Gewichtungen im Header „X-Load-Balancing-Endpoint-Weight“ mit HTTP-Antworten zurückgegeben werden. In dieser Anleitung konfigurieren Sie eine Backend-Instanz zur Meldung einer Gewichtung von null, eine zweite Backend-Instanz zur Meldung einer Gewichtung von 100, und eine dritte Backend-Instanz zur Meldung einer Gewichtung von 900. Führen Sie den Befehl
gcloud compute instances create
aus, um die Instanzen zu erstellen:
gcloud compute instances create instance-0 \ --zone=us-central1-a \ --tags=network-lb-tag \ --image-family=debian-10 \ --image-project=debian-cloud \ --subnet= SUBNET_NAME \ --metadata=load-balancing-weight=0,startup-script='#! /bin/bash apt-get update apt-get install apache2 -y ln -sr /etc/apache2/mods-available/headers.load /etc/apache2/mods-enabled/headers.load vm_hostname="$(curl -H "Metadata-Flavor:Google" \ http://169.254.169.254/computeMetadata/v1/instance/name)" echo "Page served from: $vm_hostname" | \ tee /var/www/html/index.html lb_weight="$(curl -H "Metadata-Flavor:Google" \ http://169.254.169.254/computeMetadata/v1/instance/attributes/load-balancing-weight)" echo "Header set X-Load-Balancing-Endpoint-Weight \"$lb_weight\"" | \ tee /etc/apache2/conf-enabled/headers.conf systemctl restart apache2'
gcloud compute instances create instance-100 \ --zone=us-central1-a \ --tags=network-lb-tag \ --image-family=debian-10 \ --image-project=debian-cloud \ --subnet=SUBNET_NAME \ --metadata=load-balancing-weight=100,startup-script='#! /bin/bash apt-get update apt-get install apache2 -y ln -sr /etc/apache2/mods-available/headers.load /etc/apache2/mods-enabled/headers.load vm_hostname="$(curl -H "Metadata-Flavor:Google" \ http://169.254.169.254/computeMetadata/v1/instance/name)" echo "Page served from: $vm_hostname" | \ tee /var/www/html/index.html lb_weight="$(curl -H "Metadata-Flavor:Google" \ http://169.254.169.254/computeMetadata/v1/instance/attributes/load-balancing-weight)" echo "Header set X-Load-Balancing-Endpoint-Weight \"$lb_weight\"" | \ tee /etc/apache2/conf-enabled/headers.conf systemctl restart apache2'
gcloud compute instances create instance-900 \ --zone=us-central1-a \ --tags=network-lb-tag \ --image-family=debian-10 \ --image-project=debian-cloud \ --subnet= SUBNET_NAME \ --metadata=load-balancing-weight=900,startup-script='#! /bin/bash apt-get update apt-get install apache2 -y ln -sr /etc/apache2/mods-available/headers.load /etc/apache2/mods-enabled/headers.load vm_hostname="$(curl -H "Metadata-Flavor:Google" \ http://169.254.169.254/computeMetadata/v1/instance/name)" echo "Page served from: $vm_hostname" | \ tee /var/www/html/index.html lb_weight="$(curl -H "Metadata-Flavor:Google" \ http://169.254.169.254/computeMetadata/v1/instance/attributes/load-balancing-weight)" echo "Header set X-Load-Balancing-Endpoint-Weight \"$lb_weight\"" | \ tee /etc/apache2/conf-enabled/headers.conf systemctl restart apache2'
Instanzgruppe erstellen
In dieser Anleitung geben Sie Anweisungen zum Erstellen einer nicht verwalteten Instanzgruppe, die alle drei VM-Instanzen umfasst(instance-0, instance-100, and instance-900
).
- Führen Sie den Befehl
gcloud compute instance-groups unmanaged create
aus, um die Instanzgruppe zu erstellen:
gcloud compute instance-groups unmanaged create INSTANCE_GROUP --zone=us-central1-a
gcloud compute instance-groups unmanaged add-instances INSTANCE_GROUP \ --zone=us-central1-a \ --instances=instance-0,instance-100,instance-900
Ersetzen Sie INSTANCE_GROUP
durch den Namen der zu erstellenden Instanzgruppe.
HTTP-Systemdiagnose erstellen
In dieser Anleitung geben Sie Anweisungen zum Erstellen einer HTTP-Systemdiagnose, um die HTTP-Antwort mit der Gewichtung der Backend-VM zu lesen.
- Führen Sie zum Erstellen der HTTP-Systemdiagnose den Befehl
gcloud compute health-checks create
aus:
gcloud compute health-checks create http HTTP_HEALTH_CHECK_NAME \ --region=us-central1
Ersetzen Sie HTTP_HEALTH_CHECK_NAME
durch den Namen der zu erstellenden HTTP-Systemdiagnose.
Back-End-Dienst erstellen
Das folgende Beispiel enthält Anweisungen zum Erstellen eines regionalen externen Backend-Dienstes, der für die Verwendung des gewichteten Load-Balancings konfiguriert ist.
- Erstellen Sie einen Backend-Dienst mit der HTTP-Systemdiagnose und legen Sie die Load-Balancer-Richtlinie für Standorte auf WEIGHTED_MAGLEV fest.
- Führen Sie den Befehl
gcloud compute backend-services create
aus, um den Backend-Dienst zu erstellen:
gcloud compute backend-services create BACKEND_SERVICE_NAME \ --load-balancing-scheme=external \ --protocol=tcp \ --region=us-central1 \ --health-checks=HTTP_HEALTH_CHECK_NAME \ --health-checks-region=us-central1 \ --locality-lb-policy=WEIGHTED_MAGLEV
- Ersetzen Sie
BACKEND_SERVICE_NAME
durch den Namen des zu erstellenden Backend-Dienstes.
- Fügen Sie die Instanzgruppe dem Backend-Dienst hinzu:
- Führen Sie den Befehl
gcloud compute backend-services add-backend
aus, um die Instanzgruppe hinzuzufügen:
gcloud compute backend-services add-backend BACKEND_SERVICE_NAME \ --instance-group=INSTANCE_GROUP \ --instance-group-zone=us-central1-a \ --region=us-central1
- Reservieren Sie eine regionale externe IP-Adresse für den Load Balancer.
- Führen Sie den Befehl
gcloud compute addresses create
aus, um eine oder mehrere IP-Adressen zu reservieren:
gcloud compute addresses create ADDRESS_NAME \ --region us-central1
Ersetzen Sie ADDRESS_NAME
durch den Namen der zu erstellenden IP-Adresse. Verwenden Sie den Befehl compute addresses describe
, um das Ergebnis anzeigen zu lassen. Notieren Sie sich die reservierte statische externe IP-Adresse („IP_ADDRESS'
“).
gcloud compute addresses describe ADDRESS_NAME
- Erstellen Sie eine Weiterleitungsregel mit der reservierten regionalen externen IP-Adresse „IP_ADDRESS“. Verbinden Sie die Weiterleitungsregel mit dem Backend-Dienst.
- Führen Sie den Befehl
gcloud compute forwarding-rules create
aus, um die Weiterleitungsregel zu erstellen:
gcloud compute forwarding-rules create FORWARDING_RULE \ --region=us-central1 \ --ports=80 \ --address=IP_ADDRESS \ --backend-service=BACKEND_SERVICE_NAME
- Ersetzen Sie Folgendes:
FORWARDING_RULE
: der Name der zu erstellenden Weiterleitungsregel.IP_ADDRESS:
ist die IP-Adresse, die der Instanz zugewiesen werden soll. Verwenden Sie die reservierte statische externe IP-Adresse, nicht den Adressnamen.
Gewichtungen von Back-Ends mit der Backend-Dienst-API prüfen
Prüfen Sie, ob die Backend-Gewichtungen korrekt an die HTTP-Systemdiagnose gemeldet werden.
- Führen Sie den Befehl
gcloud compute backend-services get-health
aus, um Backend-Gewichtungen (zusammen mit Systemstatuswerten) von einem Backend-Dienst abzurufen:
gcloud compute backend-services get-health HTTP_HEALTH_CHECK_NAME \ --region=us-central1
Die Ausgabe sollte so aussehen:
backend: https://www.googleapis.com/compute/projects/project-name/{project}/zones/us-central1-a/instanceGroups/{instance-group-name} status: healthStatus: - forwardingRule: https://www.googleapis.com/compute/projects/{project}/regions/us-central1/forwardingRules/{firewall-rule-name} forwardingRuleIp: 34.135.46.66 healthState: HEALTHY instance: https://www.googleapis.com/compute/projects/{project}/zones/us-central1-a/instances/instance-0 ipAddress: 10.10.0.5 port: 80 weight: '0' - forwardingRule: https://www.googleapis.com/compute/projects/{project}/regions/us-central1/forwardingRules/{firewall-rule-name} forwardingRuleIp: 34.135.46.66 healthState: HEALTHY instance: https://www.googleapis.com/compute/projects/{project}/zones/us-central1-a/instances/instance-100 ipAddress: 10.10.0.6 port: 80 weight: '100' - forwardingRule: https://www.googleapis.com/compute/projects/{project}/regions/us-central1/forwardingRules/{firewall-rule-name} forwardingRuleIp: 34.135.46.66 healthState: HEALTHY instance: https://www.googleapis.com/compute/projects/{project}/zones/us-central1-a/instances/instance-900 ipAddress: 10.10.0.7 port: 80 weight: '900' kind: compute#backendServiceGroupHealth