Diese Seite wurde von der Cloud Translation API übersetzt.

Anwendungsbasierte Systemdiagnose und automatische Reparatur einrichten

In diesem Dokument wird gezeigt, wie Sie eine anwendungsbasierte Systemdiagnose für die automatische Reparatur von VMs in einer verwalteten Instanzgruppe (MIG) einrichten. Außerdem wird erläutert, wie eine Systemdiagnose ohne automatische Reparatur verwendet, eine Systemdiagnose entfernt, die Richtlinie für die automatische Reparatur aufgerufen und der Systemstatus jeder VM geprüft werden kann.

Sie können eine anwendungsbasierte Systemdiagnose konfigurieren, um zu prüfen, ob Ihre Anwendung auf einer VM wie erwartet reagiert. Wenn mit der von Ihnen konfigurierten Systemdiagnose festgestellt wird, dass Ihre Anwendung auf einer VM nicht reagiert, markiert die MIG diese VM als fehlerhaft und repariert sie standardmäßig. Die Reparatur einer VM, die auf einer anwendungsbasierten Systemdiagnose beruht, wird als automatische Reparatur bezeichnet.

Sie können die automatische Reparatur in einer MIG auch deaktivieren und dann eine Systemdiagnose verwenden, ohne die Reparaturen für fehlerhafte VMs auszulösen.

Weitere Informationen zu Reparaturen in einer MIG finden Sie unter VMs für Hochverfügbarkeit reparieren.

Hinweise

Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben. Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud -Dienste und APIs überprüft. Zum Ausführen von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei Compute Engine authentifizieren:
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:
  gcloud init
  Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
  
  Hinweis: Wenn Sie die gcloud CLI zuvor installiert haben, prüfen Sie, ob Sie die aktuelle Version haben, indem Sie gcloud components update ausführen.
2. Set a default region and zone.
Terraform

Wenn Sie die Terraform-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, installieren und initialisieren Sie die gcloud CLI und richten Sie dann die Standardanmeldedaten für Anwendungen mit Ihren Nutzeranmeldedaten ein.
Weitere Informationen finden Sie unter Set up authentication for a local development environment.
REST

Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.
Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.

Preise

Wenn Sie eine anwendungsbasierte Systemdiagnose einrichten, schreibt Compute Engine standardmäßig immer dann einen Logeintrag in Cloud Logging, wenn sich der Systemzustand einer VM ändert. In Cloud Logging steht ein kostenloses Kontingent pro Monat zur Verfügung. Ist es aufgebraucht, wird das Logging nach Datenvolumen abgerechnet. Sie können Kosten vermeiden, indem Sie die Änderungslogs des Systemzustands deaktivieren.

Anwendungsbasierte Systemdiagnose und automatische Reparatur einrichten

So richten Sie eine anwendungsbasierte Systemdiagnose und die automatische Reparatur in einer MIG ein:

Erstellen Sie eine Systemdiagnose, falls noch nicht geschehen.
Konfigurieren Sie eine Richtlinie für die automatische Reparatur in der MIG, um die Systemdiagnose anzuwenden.

Systemdiagnose erstellen

Eine Systemdiagnose kann auf maximal 50 MIGs angewendet werden. Wenn Sie mehr als 50 Gruppen haben, erstellen Sie mehrere Systemdiagnosen.

Das folgende Beispiel zeigt, wie eine Systemdiagnose für die automatische Reparatur erstellt wird. Sie können entweder eine regionale oder eine globale Systemdiagnose für die automatische Reparatur in MIGs erstellen. In diesem Beispiel erstellen Sie eine globale Systemdiagnose, die nach einer Antwort des Webservers auf Port 80 sucht. Damit die Systemdiagnoseprüfungen den Webserver erreichen können, müssen Sie eine Firewallregel einrichten.

Erforderliche Berechtigungen für diese Aufgabe

Zum Ausführen dieser Aufgabe benötigen Sie die folgenden Berechtigungen:

compute.healthChecks.create für das Projekt, wenn Sie eine Systemdiagnose erstellen.
compute.healthChecks.use für die zu verwendende Systemdiagnose
compute.firewalls.create für das Projekt, wenn Sie eine Firewall erstellen
compute.networks.updatePolicy für das Netzwerk, wenn Sie eine Firewall erstellen

Die Berechtigungen sind in folgenden vorkonfigurierten Rollen verfügbar.

compute.networkAdmin zum Erstellen von Systemdiagnosen
compute.securityAdmin zum Konfigurieren von Firewallregeln, damit die Systemdiagnose eine Verbindung herstellen kann

Console

Erstellen Sie eine Systemdiagnose für die automatische Reparatur, die konservativer ist als eine Load-Balancing-Systemdiagnose.

Beispielsweise können Sie eine Systemdiagnose erstellen, die Port 80 auf eine Antwort prüft und VMs erst mit einer gewissen Fehlertoleranz als fehlerhaft (UNHEALTHY) markiert und deren Neuerstellung auslöst. In diesem Beispiel wird eine VM als fehlerfrei markiert, wenn die Systemdiagnose einmal erfolgreich für sie ausgeführt wird. Die VM wird als fehlerhaft markiert, wenn die Systemdiagnose 3-mal hintereinander erfolglos war.
1. Rufen Sie in der Google Cloud Console die Seite Systemdiagnose erstellen auf.
  
  Zur Seite "Systemdiagnose erstellen"
2. Geben Sie einen Namen für die Systemdiagnose ein, z. B. example-check.
3. Wählen Sie einen Bereich aus. Sie können entweder Regional oder Global auswählen. Wählen Sie für dieses Beispiel Global aus.
4. Prüfen Sie, ob unter Protokoll die Option HTTP ausgewählt ist.
5. Geben Sie für Port den Wert 80 ein.
6. Geben Sie im Abschnitt Diagnosekriterien die folgenden Werte an:
  1. Geben Sie für Überprüfungsintervall den Wert 5 ein.
  2. Geben Sie für Zeitlimit den Wert 5 ein.
  3. Legen Sie einen Schwellenwert für Intaktheit fest, um anzugeben, wie viele aufeinanderfolgende Systemdiagnosen erfolgreich sein müssen, bevor eine fehlerhafte VM als fehlerfrei markiert wird. Geben Sie in diesem Beispiel 1 ein.
  4. Legen Sie einen Fehlerschwellenwert fest, um anzugeben, wie viele aufeinanderfolgende Systemdiagnosen fehlschlagen müssen, bevor eine fehlerfreie VM als fehlerhaft markiert wird. Geben Sie in diesem Beispiel 3 ein.
7. Klicken Sie auf Erstellen, um die Systemdiagnose zu erstellen.
Richten Sie die Firewallregel so ein, dass die Systemdiagnosetests eine Verbindung zu Ihrer Anwendung herstellen können.
Achtung: Wenn die Systemdiagnoseprüfungen durch Firewallregeln blockiert sind, werden Ihre VMs als UNHEALTHY markiert, weil sie keine Verbindung zur Anwendung herstellen können. Das kann dazu führen, dass VMs neu erstellt werden, die eigentlich intakt sind.
Die Systemdiagnosetests stammen von Adressen in den Bereichen 130.211.0.0/22 und 35.191.0.0/16. Stellen Sie deshalb sicher, dass Ihre Netzwerk-Firewallregeln die Verbindung zulassen. In diesem Beispiel nutzt die MIG das Netzwerk default. Deren VMs überwachen Port 80. Wenn Port 80 im Netzwerk "default" noch nicht offen ist, erstellen Sie eine entsprechende Firewallregel.
1. Rufen Sie in der Google Cloud Console die Seite Firewallrichtlinien auf.
  
  Zu den Firewall-Richtlinien
2. Klicken Sie auf Firewallregel erstellen.
3. Geben Sie einen Namen für die Firewallregel ein. Beispiel: allow-health-check
4. Wählen Sie unter Netzwerk das Netzwerk default aus.
5. Wählen Sie für Ziele die Option All instances in the network aus.
6. Wählen Sie für Quellfilter die Option IPv4 ranges aus.
7. Geben Sie unter Quell-IPv4-Bereiche die Werte 130.211.0.0/22 und 35.191.0.0/16 ein.
8. Wählen Sie unter Protokolle und Ports die Option Angegebene Protokolle und Ports aus und gehen Sie so vor:
  1. Wählen Sie TCP aus.
  2. Geben Sie in das Feld Ports den Wert 80 ein.
9. Klicken Sie auf Erstellen.

gcloud

Erstellen Sie eine Systemdiagnose für die automatische Reparatur, die konservativer ist als eine Load-Balancing-Systemdiagnose.

Erstellen Sie beispielsweise eine Systemdiagnose, die eine Antwort von Port 80 erwartet und eine gewisse Fehlertoleranz hat, bevor sie VMs als fehlerhaft (UNHEALTHY) markiert und dafür sorgt, dass sie neu erstellt werden. In diesem Beispiel wird eine VM als fehlerfrei markiert, wenn die Systemdiagnose einmal erfolgreich für sie ausgeführt wird. Die VM wird als fehlerhaft markiert, wenn die Systemdiagnose 3-mal hintereinander erfolglos war. Mit dem folgenden Befehl wird eine globale Systemdiagnose erstellt.
```
gcloud compute health-checks create http example-check --port 80 \
   --check-interval 30s \
   --healthy-threshold 1 \
   --timeout 10s \
   --unhealthy-threshold 3 \
   --global
```
Hinweis: Verwenden Sie neuere Systemdiagnosen, die die HTTP, HTTPS, TCP, and SSL (TLS) Protokolle unterstützen. Legacy-Systemdiagnosen von Compute Engine für HTTP/HTTPS funktionieren weiterhin.
Richten Sie die Firewallregel so ein, dass die Systemdiagnosetests eine Verbindung zu Ihrer Anwendung herstellen können.
Achtung: Wenn die Systemdiagnoseprüfungen durch Firewallregeln blockiert sind, werden Ihre VMs als UNHEALTHY markiert, weil sie keine Verbindung zur Anwendung herstellen können. Das kann dazu führen, dass VMs neu erstellt werden, die eigentlich intakt sind.
Die Systemdiagnosetests stammen von Adressen in den Bereichen 130.211.0.0/22 und 35.191.0.0/16. Sorgen Sie dafür, dass Ihre Firewallregeln die Verbindung zulassen. In diesem Beispiel verwendet die MIG das Netzwerk default. Deren VMs überwachen Port 80. Wenn Port 80 im Netzwerk "default" noch nicht offen ist, erstellen Sie eine entsprechende Firewallregel.
```
gcloud compute firewall-rules create allow-health-check \
    --allow tcp:80 \
    --source-ranges 130.211.0.0/22,35.191.0.0/16 \
    --network default
```

Terraform

Erstellen Sie mit der Ressource google_compute_http_health_check eine Systemdiagnose.

Beispielsweise können Sie eine Systemdiagnose erstellen, die Port 80 auf eine Antwort prüft und VMs erst mit einer gewissen Fehlertoleranz als fehlerhaft (UNHEALTHY) markiert und deren Neuerstellung auslöst. In diesem Beispiel wird eine VM als fehlerfrei markiert, wenn die Systemdiagnose einmal erfolgreich für sie ausgeführt wird. Die VM wird als fehlerhaft markiert, wenn die Systemdiagnose 3-mal hintereinander erfolglos war. Die folgende Anfrage erstellt eine globale Systemdiagnose.
```
resource "google_compute_http_health_check" "default" {
  name                = "example-check"
  timeout_sec         = 10
  check_interval_sec  = 30
  healthy_threshold   = 1
  unhealthy_threshold = 3
  port                = 80
}
```
Erstellen Sie eine Firewall mit der google_compute_firewall-Ressource.
Achtung: Wenn die Systemdiagnoseprüfungen durch Firewallregeln blockiert sind, werden Ihre VMs als UNHEALTHY markiert, weil sie keine Verbindung zur Anwendung herstellen können. Das kann dazu führen, dass VMs neu erstellt werden, die eigentlich intakt sind.
Die Systemdiagnosetests stammen von Adressen in den Bereichen 130.211.0.0/22 und 35.191.0.0/16. Sorgen Sie dafür, dass Ihre Firewallregeln die Verbindung zulassen. In diesem Beispiel nutzt die MIG das Netzwerk default. Deren VMs überwachen Port 80. Wenn Port 80 im Netzwerk "default" noch nicht offen ist, erstellen Sie eine entsprechende Firewallregel.
```
resource "google_compute_firewall" "default" {
  name          = "allow-health-check"
  network       = "default"
  source_ranges = ["130.211.0.0/22", "35.191.0.0/16"]
  allow {
    protocol = "tcp"
    ports    = [80]
  }
}
```

Informationen zum Anwenden oder Entfernen einer Terraform-Konfiguration finden Sie unter Grundlegende Terraform-Befehle.

REST

Erstellen Sie eine Systemdiagnose für die automatische Reparatur, die konservativer ist als eine Load-Balancing-Systemdiagnose.

Beispielsweise können Sie eine Systemdiagnose erstellen, die Port 80 auf eine Antwort prüft und VMs erst mit einer gewissen Fehlertoleranz als fehlerhaft (UNHEALTHY) markiert und deren Neuerstellung auslöst. In diesem Beispiel wird eine VM als fehlerfrei markiert, wenn die Systemdiagnose einmal erfolgreich für sie ausgeführt wird. Die VM wird als fehlerhaft markiert, wenn die Systemdiagnose 3-mal hintereinander erfolglos war. Die folgende Anfrage erstellt eine globale Systemdiagnose.
```
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/global/healthChecks

{
 "name": "example-check",
 "type": "http",
 "port": 80,
 "checkIntervalSec": 30,
 "healthyThreshold": 1,
 "timeoutSec": 10,
 "unhealthyThreshold": 3
}
```
Hinweis: Verwenden Sie neuere Systemdiagnosen, die die HTTP, HTTPS, TCP, and SSL (TLS) Protokolle unterstützen. Legacy-Systemdiagnosen von Compute Engine für HTTP/HTTPS funktionieren weiterhin.
Richten Sie die Firewallregel so ein, dass die Systemdiagnosetests eine Verbindung zu Ihrer Anwendung herstellen können.
Achtung: Wenn die Systemdiagnoseprüfungen durch Firewallregeln blockiert sind, werden Ihre VMs als UNHEALTHY markiert, weil sie keine Verbindung zur Anwendung herstellen können. Das kann dazu führen, dass VMs neu erstellt werden, die eigentlich intakt sind.
Die Systemdiagnosetests stammen von Adressen in den Bereichen 130.211.0.0/22 und 35.191.0.0/16. Sorgen Sie dafür, dass Ihre Firewallregeln die Verbindung zulassen. In diesem Beispiel nutzt die MIG das Netzwerk default. Deren VMs überwachen Port 80. Wenn Port 80 im Netzwerk "default" noch nicht offen ist, erstellen Sie eine entsprechende Firewallregel.
```
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/global/firewalls

{
 "name": "allow-health-check",
 "network": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/global/networks/default",
 "sourceRanges": [
  "130.211.0.0/22",
  "35.191.0.0/16"
 ],
 "allowed": [
  {
   "ports": [
    "80"
   ],
   "IPProtocol": "tcp"
  }
 ]
}
```
Ersetzen Sie dabei PROJECT_ID durch Ihre Projekt-ID.

Richtlinie für die automatische Reparatur in einer MIG konfigurieren

In einer MIG können Sie nur eine Richtlinie für die automatische Reparatur einrichten, um eine Systemdiagnose anzuwenden.

Bevor Sie eine Richtlinie für die automatische Reparatur konfigurieren, erstellen Sie eine Systemdiagnose, falls noch nicht geschehen. Sie können entweder eine regionale oder eine globale Systemdiagnose für die automatische Reparatur in MIGs verwenden. Eine regionale Systemdiagnose reduziert regionenübergreifende Abhängigkeiten und hilft dabei, den Datenstandort zu erreichen. Eine globale Systemdiagnose ist praktisch, wenn Sie dieselbe Systemdiagnose für MIGs in mehreren Regionen verwenden möchten.

Wenn Sie verhindern möchten, dass die automatische Reparatur versehentlich ausgelöst wird, während Sie eine neue Systemdiagnose einrichten, oder wenn Sie eine Systemdiagnose ohne automatische Reparatur verwenden möchten, lesen Sie den Abschnitt Systemdiagnose ohne automatische Reparatur konfigurieren. Sie können die automatische Reparatur auch deaktivieren, nachdem Sie eine Systemdiagnose in der MIG konfiguriert haben.

Wählen Sie eine der folgenden Optionen aus, um eine Richtlinie für die automatische Reparatur zu konfigurieren:

Erforderliche Berechtigungen für diese Aufgabe

Zum Ausführen dieser Aufgabe benötigen Sie die folgenden Berechtigungen:

compute.instanceGroupManagers.update in der MIG

Die Berechtigungen sind in folgenden vorkonfigurierten Rollen verfügbar.

compute.instanceAdmin.v1 zum Erstellen und Aktualisieren von Richtlinien zur automatischen Reparatur in MIGs

Console

Rufen Sie in der Google Cloud Console die Seite Instanzgruppen auf.

Zu den Instanzgruppen
Klicken Sie in der Spalte Name der Liste auf den Namen der MIG, für die Sie die Systemdiagnose anwenden möchten.
Klicken Sie auf Bearbeiten, um diese MIG zu ändern.
Klicken Sie auf Instance-Lebenszyklus und Autohealing, um den Bereich zu maximieren.
1. Wählen Sie im Abschnitt Automatische Reparatur für die Systemdiagnose eine globale oder regionale Systemdiagnose aus.
2. Verwenden Sie für Initial delay (Anfangsverzögerung) den Standardwert oder ändern Sie ihn nach Bedarf.
  Die anfängliche Verzögerung ist die Anzahl von Sekunden, die eine neue VM zum Initialisieren und Ausführen des Startskripts benötigt. Während des anfänglichen Verzögerungszeitraums einer VM ignoriert die MIG fehlgeschlagene Systemdiagnosen, da sich die VM möglicherweise im Startvorgang befindet. Dadurch wird verhindert, dass die MIG eine VM vorzeitig neu erstellt. Wenn die Systemdiagnose während der anfänglichen Verzögerung eine fehlerfreie Antwort empfängt, gibt dies an, dass der Startvorgang abgeschlossen ist und die VM bereit ist. Der Timer für die anfängliche Verzögerung startet, wenn sich das Feld currentAction der VM in VERIFYING ändert. Der Wert der anfänglichen Verzögerung muss zwischen 0 und 3.600 Sekunden liegen. In der Console beträgt der Standardwert 300 Sekunden.

Klicken Sie auf Speichern, um die Änderungen zu übernehmen.

gcloud

Verwenden Sie zum Konfigurieren der Richtlinie für die automatische Reparatur in einer vorhandenen MIG den Befehl update. Verwenden Sie beispielsweise den folgenden Befehl, um die Richtlinie für die automatische Reparatur in einer vorhandenen zonalen MIG zu konfigurieren:

gcloud compute instance-groups managed update MIG_NAME \
    --health-check HEALTH_CHECK_URL \
    --initial-delay INITIAL_DELAY \
    --zone ZONE

Zum Konfigurieren der automatischen Reparaturrichtlinie beim Erstellen einer MIG verwenden Sie den Befehl create. Verwenden Sie beispielsweise den folgenden Befehl, um beim Erstellen einer zonalen MIG die Richtlinie für die automatische Reparatur zu konfigurieren:

gcloud compute instance-groups managed create MIG_NAME \
    --size SIZE \
    --template INSTANCE_TEMPLATE_URL \
    --health-check HEALTH_CHECK_URL \
    --initial-delay INITIAL_DELAY \
    --zone ZONE

Ersetzen Sie Folgendes:

MIG_NAME: Name der MIG, in der Sie die automatische Reparatur einrichten möchten.
SIZE: Anzahl der VMs in der Gruppe.
INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:
- Für eine regionale Instanzvorlage: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
- Für eine globale Instanzvorlage: INSTANCE_TEMPLATE_ID
HEALTH_CHECK_URL: Die teilweise URL der Systemdiagnose, die Sie für die automatische Reparatur einrichten möchten. Beispiel:
- Regionale Systemdiagnose: projects/example-project/regions/us-central1/healthChecks/example-health-check.
- Globale Systemdiagnose: projects/example-project/global/healthChecks/example-health-check.
INITIAL_DELAY: Die Anzahl der Sekunden, die eine neue VM zum Initialisieren und Ausführen des Startskripts benötigt. Während des anfänglichen Verzögerungszeitraums einer VM ignoriert die MIG fehlgeschlagene Systemdiagnosen, da sich die VM möglicherweise im Startvorgang befindet. Dadurch wird verhindert, dass die MIG eine VM vorzeitig neu erstellt. Wenn die Systemdiagnose während der anfänglichen Verzögerung eine fehlerfreie Antwort empfängt, gibt dies an, dass der Startvorgang abgeschlossen ist und die VM bereit ist. Der Timer für die anfängliche Verzögerung startet, wenn sich das Feld currentAction der VM in VERIFYING ändert. Der Wert der anfänglichen Verzögerung muss zwischen 0 und 3600 Sekunden liegen. Der Standardwert ist 0.
ZONE: Die Zone, in der sich die MIG befindet. Verwenden Sie bei einer regionalen MIG das Flag --region.

Terraform

Verwenden Sie den Block auto_healing_policies, um eine Richtlinie für die automatische Reparatur in einer MIG zu konfigurieren.

Im folgenden Beispiel wird die Richtlinie für die automatische Reparatur in einer zonalen MIG konfiguriert. Weitere Informationen zu der im Beispiel verwendeten Ressource finden Sie unter google_compute_instance_group_manager. Verwenden Sie für eine regionale MIG die google_compute_region_instance_group_manager-Ressource.

resource "google_compute_instance_group_manager" "default" {
  name               = "igm-with-hc"
  base_instance_name = "test"
  target_size        = 3
  zone               = "us-central1-f"
  version {
    instance_template = google_compute_instance_template.default.id
    name              = "primary"
  }
  auto_healing_policies {
    health_check      = google_compute_http_health_check.default.id
    initial_delay_sec = 30
  }
}

Informationen zum Anwenden oder Entfernen einer Terraform-Konfiguration finden Sie unter Grundlegende Terraform-Befehle.

REST

So konfigurieren Sie die Richtlinie für die automatische Reparatur in einer vorhandenen MIG mit der Methode patch:

Verwenden Sie für eine zonale MIG die Methode instanceGroupManager.patch.
Verwenden Sie für eine regionale MIG die Methode regionInstanceGroupManager.patch.

Mit dem folgenden Aufruf können Sie beispielsweise die automatische Reparatur in einer vorhandenen zonalen MIG einrichten:

  PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME
  {
    "autoHealingPolicies": [
      {
        "healthCheck": "HEALTH_CHECK_URL",
        "initialDelaySec": INITIAL_DELAY
      }
    ]
  }

So konfigurieren Sie die Richtlinie für die automatische Reparatur beim Erstellen einer MIG mit der Methode insert:

Verwenden Sie für eine zonale MIG die Methode instanceGroupManager.insert.
Verwenden Sie für eine regionale MIG die Methode regionInstanceGroupManager.insert.

Mit dem folgenden Aufruf können Sie beispielsweise beim Erstellen einer zonalen MIG die Richtlinie für die automatische Reparatur konfigurieren:

  POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers
  {
    "name": "MIG_NAME",
    "targetSize": SIZE,
    "instanceTemplate": "INSTANCE_TEMPLATE_URL",
    "autoHealingPolicies": [
      {
        "healthCheck": "HEALTH_CHECK_URL",
        "initialDelaySec": INITIAL_DELAY
      }
    ]
  }

Ersetzen Sie Folgendes:

PROJECT_ID: Ihre Projekt-ID.
MIG_NAME: Name der MIG, in der Sie die automatische Reparatur einrichten möchten.
SIZE: Anzahl der VMs in der Gruppe.
INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:
- Für eine regionale Instanzvorlage: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
- Für eine globale Instanzvorlage: INSTANCE_TEMPLATE_ID
HEALTH_CHECK_URL: Die teilweise URL der Systemdiagnose, die Sie für die automatische Reparatur einrichten möchten. Beispiel:
- Regionale Systemdiagnose: projects/example-project/regions/us-central1/healthChecks/example-health-check.
- Globale Systemdiagnose: projects/example-project/global/healthChecks/example-health-check.
INITIAL_DELAY: Die Anzahl der Sekunden, die eine neue VM zum Initialisieren und Ausführen des Startskripts benötigt. Während des anfänglichen Verzögerungszeitraums einer VM ignoriert die MIG fehlgeschlagene Systemdiagnosen, da sich die VM möglicherweise im Startvorgang befindet. Dadurch wird verhindert, dass die MIG eine VM vorzeitig neu erstellt. Wenn die Systemdiagnose während der anfänglichen Verzögerung eine fehlerfreie Antwort empfängt, gibt dies an, dass der Startvorgang abgeschlossen ist und die VM bereit ist. Der Timer für die anfängliche Verzögerung startet, wenn sich das Feld currentAction der VM in VERIFYING ändert. Der Wert der anfänglichen Verzögerung muss zwischen 0 und 3600 Sekunden liegen. Der Standardwert ist 0.
ZONE: Die Zone, in der sich die MIG befindet. Verwenden Sie bei einer regionalen MIG regions/REGION in der URL.

Nach Abschluss der Einrichtung der automatischen Reparatur kann es 10 Minuten dauern, bis die automatische Reparatur mit dem Monitoring der VMs in der Gruppe beginnt. Nach Beginn des Monitorings startet Compute Engine, VMs basierend auf Ihrer Konfiguration der automatischen Reparatur als fehlerfrei zu kennzeichnen oder neu zu erstellen. Wenn Sie beispielsweise eine anfängliche Verzögerung von 5 Minuten, ein Systemdiagnoseintervall von 1 Minute und einen intakten Schwellenwert von 1 Prüfung konfigurieren, sieht die Zeitachse so aus:

10 Minuten Verzögerung, bevor die automatische Reparatur mit dem Monitoring von VMs in der Gruppe beginnt
+5 Minuten für die konfigurierte anfängliche Verzögerung
+ 1 Minute für das Überprüfungsintervall * Schwellenwert für Intaktheit (60 s * 1)
= 16 Minuten, bevor die VM als fehlerfrei markiert oder neu erstellt wird

Systemdiagnose ohne automatische Reparatur konfigurieren

Sie können die automatische Reparatur in einer MIG deaktivieren und die konfigurierte Systemdiagnose zur Überwachung des Anwendungsstatus verwenden oder eine eigene Reparaturlogik implementieren. Das Deaktivieren der automatischen Reparatur in einer MIG hat keine Auswirkungen auf die Funktion der Systemdiagnose. Die Systemdiagnose prüft weiterhin die Anwendung und liefert die Zustandsdaten der VM. Die MIG repariert jedoch keine fehlerhaften VMs mehr.

Wenn Sie eine Systemdiagnose ohne automatische Reparatur konfigurieren möchten, wählen Sie eine der folgenden Optionen aus.

Erforderliche Berechtigungen für diese Aufgabe

Zum Ausführen dieser Aufgabe benötigen Sie die folgenden Berechtigungen:

compute.instanceGroupManagers.update in der MIG

Die Berechtigungen sind in folgenden vorkonfigurierten Rollen verfügbar.

compute.instanceAdmin.v1 zum Erstellen und Aktualisieren von Richtlinien zur automatischen Reparatur in MIGs

Console

Rufen Sie in der Google Cloud Console die Seite Instanzgruppen auf.

Zu den Instanzgruppen
Klicken Sie in der Spalte Name der Liste auf den Namen der MIG, für die Sie die Systemdiagnose anwenden möchten.
Klicken Sie auf Bearbeiten, um diese MIG zu ändern.
Klicken Sie auf Instance-Lebenszyklus und Autohealing, um den Bereich zu maximieren.
1. Wählen Sie im Abschnitt Automatische Reparatur für die Systemdiagnose eine globale oder regionale Systemdiagnose aus.
2. Verwenden Sie für Initial delay (Anfangsverzögerung) den Standardwert oder ändern Sie ihn nach Bedarf.
  Die anfängliche Verzögerung ist die Anzahl von Sekunden, die eine neue VM zum Initialisieren und Ausführen des Startskripts benötigt. Während des anfänglichen Verzögerungszeitraums einer VM ignoriert die MIG fehlgeschlagene Systemdiagnosen, da sich die VM möglicherweise im Startvorgang befindet. Dadurch wird verhindert, dass die MIG eine VM vorzeitig neu erstellt. Wenn die Systemdiagnose während der anfänglichen Verzögerung eine fehlerfreie Antwort empfängt, gibt dies an, dass der Startvorgang abgeschlossen ist und die VM bereit ist. Der Timer für die anfängliche Verzögerung startet, wenn sich das Feld currentAction der VM in VERIFYING ändert. Der Wert der anfänglichen Verzögerung muss zwischen 0 und 3.600 Sekunden liegen. In der Console beträgt der Standardwert 300 Sekunden.

Wählen Sie in der Liste Bei fehlgeschlagener Systemdiagnose die Option Keine Aktion aus.

Klicken Sie auf Speichern, um die Änderungen zu übernehmen.

gcloud

Wenn Sie eine Systemdiagnose ohne automatische Reparatur konfigurieren, müssen Sie beim Angeben der Konfiguration der Systemdiagnose auch das Flag --action-on-vm-failed-health-check auf do-nothing setzen:

Verwenden Sie in einer vorhandenen MIG den Betabefehl update.

Verwenden Sie beispielsweise den folgenden Befehl in einer vorhandenen zonalen MIG:

gcloud beta compute instance-groups managed update MIG_NAME \
    --health-check HEALTH_CHECK_URL \
    --initial-delay INITIAL_DELAY \
    --action-on-vm-failed-health-check do-nothing \
    --zone ZONE

Verwenden Sie beim Erstellen einer MIG den Betabefehl create.

Verwenden Sie beispielsweise den folgenden Befehl, wenn Sie eine zonale MIG erstellen:

gcloud beta compute instance-groups managed create MIG_NAME \
    --size SIZE \
    --template INSTANCE_TEMPLATE_URL \
    --health-check HEALTH_CHECK_URL \
    --initial-delay INITIAL_DELAY \
    --action-on-vm-failed-health-check do-nothing \
    --zone ZONE

Ersetzen Sie Folgendes:

MIG_NAME: Name der MIG, in der Sie die automatische Reparatur einrichten möchten.
SIZE: Anzahl der VMs in der Gruppe.
INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:
- Für eine regionale Instanzvorlage: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
- Für eine globale Instanzvorlage: INSTANCE_TEMPLATE_ID
HEALTH_CHECK_URL: Die teilweise URL der Systemdiagnose, die Sie für die automatische Reparatur einrichten möchten. Beispiel:
- Regionale Systemdiagnose: projects/example-project/regions/us-central1/healthChecks/example-health-check.
- Globale Systemdiagnose: projects/example-project/global/healthChecks/example-health-check.
INITIAL_DELAY: Die Anzahl der Sekunden, die eine neue VM zum Initialisieren und Ausführen des Startskripts benötigt. Während des anfänglichen Verzögerungszeitraums einer VM ignoriert die MIG fehlgeschlagene Systemdiagnosen, da sich die VM möglicherweise im Startvorgang befindet. Dadurch wird verhindert, dass die MIG eine VM vorzeitig neu erstellt. Wenn die Systemdiagnose während der anfänglichen Verzögerung eine fehlerfreie Antwort empfängt, gibt dies an, dass der Startvorgang abgeschlossen ist und die VM bereit ist. Der Timer für die anfängliche Verzögerung startet, wenn sich das Feld currentAction der VM in VERIFYING ändert. Der Wert der anfänglichen Verzögerung muss zwischen 0 und 3600 Sekunden liegen. Der Standardwert ist 0.
ZONE: Die Zone, in der sich die MIG befindet. Verwenden Sie bei einer regionalen MIG das Flag --region.

REST

Wenn Sie eine Systemdiagnose ohne automatische Reparatur konfigurieren möchten, müssen Sie beim Angeben der Konfiguration der Systemdiagnose das Feld onFailedHealthCheck auf DO_NOTHING setzen:

Verwenden Sie in einer vorhandenen MIG die Betaversion der Methode patch so:

Verwenden Sie für eine zonale MIG die Betamethode instanceGroupManager.patch.
Verwenden Sie für eine regionale MIG die Betamethode regionInstanceGroupManager.patch.

Führen Sie beispielsweise den folgenden Aufruf in einer vorhandenen zonalen MIG aus:

PATCH https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME
{
  "autoHealingPolicies": [
    {
      "healthCheck": "HEALTH_CHECK_URL",
      "initialDelaySec": INITIAL_DELAY
    }
  ],
  "instanceLifecyclePolicy": {
    "onFailedHealthCheck": "DO_NOTHING"
  }
}

So verwenden Sie die Beta-Methode insert beim Erstellen einer MIG:

Verwenden Sie für eine zonale MIG die Betamethode instanceGroupManager.insert.
Verwenden Sie für eine regionale MIG die Betamethode regionInstanceGroupManager.insert.

Führen Sie beim Erstellen einer zonalen MIG beispielsweise den folgenden Aufruf aus:

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers
{
  "name": "MIG_NAME",
  "targetSize": SIZE,
  "instanceTemplate": "INSTANCE_TEMPLATE_URL",
  "autoHealingPolicies": [
    {
      "healthCheck": "HEALTH_CHECK_URL",
      "initialDelaySec": INITIAL_DELAY
    }
  ],
  "instanceLifecyclePolicy": {
    "onFailedHealthCheck": "DO_NOTHING"
  }
}

Ersetzen Sie Folgendes:

PROJECT_ID: Ihre Projekt-ID.
MIG_NAME: Name der MIG, in der Sie die automatische Reparatur einrichten möchten.
SIZE: Anzahl der VMs in der Gruppe.
INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:
- Für eine regionale Instanzvorlage: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
- Für eine globale Instanzvorlage: INSTANCE_TEMPLATE_ID
HEALTH_CHECK_URL: Die teilweise URL der Systemdiagnose, die Sie für die automatische Reparatur einrichten möchten. Beispiel:
- Regionale Systemdiagnose: projects/example-project/regions/us-central1/healthChecks/example-health-check.
- Globale Systemdiagnose: projects/example-project/global/healthChecks/example-health-check.
INITIAL_DELAY: Die Anzahl der Sekunden, die eine neue VM zum Initialisieren und Ausführen des Startskripts benötigt. Während des anfänglichen Verzögerungszeitraums einer VM ignoriert die MIG fehlgeschlagene Systemdiagnosen, da sich die VM möglicherweise im Startvorgang befindet. Dadurch wird verhindert, dass die MIG eine VM vorzeitig neu erstellt. Wenn die Systemdiagnose während der anfänglichen Verzögerung eine fehlerfreie Antwort empfängt, gibt dies an, dass der Startvorgang abgeschlossen ist und die VM bereit ist. Der Timer für die anfängliche Verzögerung startet, wenn sich das Feld currentAction der VM in VERIFYING ändert. Der Wert der anfänglichen Verzögerung muss zwischen 0 und 3600 Sekunden liegen. Der Standardwert ist 0.
ZONE: Die Zone, in der sich die MIG befindet. Verwenden Sie bei einer regionalen MIG regions/REGION in der URL.

Nachdem Sie die Systemdiagnose konfiguriert haben, können Sie den VM-Systemstatus überwachen, um zu prüfen, ob die Systemdiagnose wie erwartet funktioniert. Wenn Sie möchten, dass die MIG fehlerhafte VMs repariert, können Sie die automatische Reparatur aktivieren.

Systemdiagnose entfernen

So entfernen Sie eine in einer Richtlinie für die automatische Reparatur konfigurierte Systemdiagnose:

Console

Rufen Sie in der Google Cloud Console die Seite Instanzgruppen auf.

Zu den Instanzgruppen
Klicken Sie auf den Namen der MIG, aus der Sie die Systemdiagnose entfernen möchten.
Klicken Sie auf Bearbeiten, um diese MIG zu ändern.
Klicken Sie auf Instance-Lebenszyklus und Autohealing, um den Bereich zu maximieren.
Wählen Sie im Abschnitt Automatische Reparatur für Systemdiagnose die Option Keine Systemdiagnose aus.
Klicken Sie auf Speichern, um die Änderungen zu übernehmen.

gcloud

Wenn Sie die Konfiguration der Systemdiagnose in einer Richtlinie für die automatische Reparatur entfernen möchten, verwenden Sie mit dem Befehl update das Flag --clear-autohealing:

gcloud compute instance-groups managed update MIG_NAME \
    --clear-autohealing

Ersetzen Sie dabei MIG_NAME durch den Namen einer MIG.

REST

Wenn Sie die Konfiguration der Systemdiagnose in einer Richtlinie für die automatische Reparatur entfernen möchten, geben Sie für die Richtlinie zur automatischen Reparatur einen leeren Wert an.

Verwenden Sie für eine zonale MIG die Methode instanceGroupManagers.patch.
Verwenden Sie für eine eine regionale MIG die Methode regionInstanceGroupManagers.patch.

Wenn Sie beispielsweise die Systemdiagnose in einer zonalen MIG entfernen möchten, stellen Sie folgende Anfrage:

PATCH https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME

{
  "autoHealingPolicies": [
    {}
  ]
}

Ersetzen Sie Folgendes:

PROJECT_ID: Ihre Projekt-ID.
MIG_NAME: Name der MIG, in der Sie die automatische Reparatur einrichten möchten.
ZONE: Die Zone, in der sich die MIG befindet. Verwenden Sie für eine regionale MIG regions/REGION.

Richtlinie für die automatische Reparatur in einer MIG aufrufen

So können Sie die Richtlinie für die automatische Reparatur einer MIG aufrufen:

Console

Rufen Sie in der Google Cloud Console die Seite Instanzgruppen auf.

Zu den Instanzgruppen
Klicken Sie auf den Namen der MIG, für die Sie die Richtlinie zur automatischen Reparatur aufrufen möchten.
Wechseln Sie zum Tab Details.

Im Abschnitt Lebenszyklus von VM-Instanzen werden die Systemdiagnose und die anfängliche Verzögerung angezeigt, die in der Richtlinie für die automatische Reparatur konfiguriert sind.

gcloud

Verwenden Sie den folgenden Befehl, um die Richtlinie für die automatische Reparatur in einer MIG aufzurufen:

gcloud compute instance-groups managed describe MIG_NAME \
    --format="(autoHealingPolicies)"

Ersetzen Sie dabei MIG_NAME durch den Namen einer MIG.

Hier ein Beispiel für eine Ausgabe:

autoHealingPolicies:
  healthCheck: https://www.googleapis.com/compute/v1/projects/example-project/global/healthChecks/example-health-check
  initialDelaySec: 300

REST

Verwenden Sie die REST-Methoden wie im Folgenden dargestellt, um die Richtlinie für die automatische Reparatur in einer MIG aufzurufen:

Verwenden Sie für eine zonale MIG die Methode instanceGroupManagers.get.
Verwenden Sie für eine regionale MIG die Methode regionInstanceGroupManagers.get.

Mit der folgenden Anfrage können Sie beispielsweise die Richtlinie zur automatischen Reparatur in einer zonalen MIG aufrufen:

GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME

Suchen Sie im Antworttext nach dem Objekt autoHealingPolicies[].

Hier ist eine Beispielantwort:

{
  ...
  "autoHealingPolicies": [
    {
      "healthCheck": "https://www.googleapis.com/compute/v1/projects/example-project/global/healthChecks/example-health-check",
      "initialDelaySec": 300
    }
  ],
  ...
}

Ersetzen Sie Folgendes:

PROJECT_ID: Ihre Projekt-ID.
MIG_NAME: Name der MIG, in der Sie die automatische Reparatur einrichten möchten.
ZONE: Die Zone, in der sich die MIG befindet. Verwenden Sie für eine regionale MIG regions/REGION.

Prüfen Sie den Status

Nachdem Sie eine anwendungsbasierte Systemdiagnose in einer MIG eingerichtet haben, können Sie mit den folgenden Aktionen prüfen, ob eine VM ausgeführt wird und ihre Anwendung reagiert:

VMs auf fehlerfreien Status prüfen
Aktuelle Aktionen für VMs prüfen
MIG auf Stabilität prüfen

VMs auf fehlerfreien Status prüfen

Wenn Sie eine anwendungsbasierte Systemdiagnose für Ihre MIG konfiguriert haben, können Sie den Systemzustand jeder einzelnen verwalteten Instanz prüfen.

Bei dieser Prüfung werden die folgenden Fehler erkannt:

Fehlerhafte VMs, die nicht repariert wurden. In den folgenden Situationen kann es vorkommen, dass als fehlerhaft erkannte VMs nicht sofort repariert werden:
- Die VM befindet sich noch im Boot-Vorgang und der Zeitraum der anfänglichen Verzögerung ist noch nicht verstrichen.
- Ein großer Anteil an fehlerhaften Instanzen wird repariert. Die MIG Reparatur verzögert weitere automatische Reparaturen, um sicherzustellen, dass eine Teilmenge der Instanzen weiterhin in der Gruppe ausgeführt wird.
Konfigurationsfehler der Systemdiagnose. Wenn die Instanz den Integritätszustand TIMEOUT meldet, ist dies beispielsweise ein Hinweis auf falsch konfigurierte Firewallregeln oder ungültige Endpunkte für die Systemdiagnose von Anwendungen.
Der zu konfigurierende anfängliche Verzögerungswert. Dafür wird die Zeit gemessen, die die VM für den Übergang zum Status RUNNING und für den Übergang zum Integritätszustand HEALTHY benötigt. Zum Messen dieser Lücke können Sie die Methode list-instances abfragen oder die Zeit zwischen dem instances.insert-Vorgang und dem ersten empfangenen fehlerfreies Signal überwachen.

Verwenden Sie die Console, das gcloud-Befehlszeilentool oder REST, um den Systemzustand aufzurufen.

Erforderliche Berechtigungen für diese Aufgabe

Zum Ausführen dieser Aufgabe benötigen Sie die folgenden Berechtigungen:

compute.instanceGroupManagers.get in der MIG

Console

Rufen Sie in der Google Cloud Console die Seite Instanzgruppen auf.

Zu den Instanzgruppen.
Klicken Sie in der Spalte Name der Liste auf den Namen der MIG, die Sie prüfen möchten. Es wird eine Seite mit den Attributen der Instanzgruppe und einer Liste der in der Gruppe enthaltenen VMs geöffnet.
Wenn eine VM fehlerhaft ist, können Sie den Systemstatus in der Spalte Systemdiagnosestatus feststellen.

gcloud

Verwenden Sie den Unterbefehl list-instances.

gcloud compute instance-groups managed list-instances MIG_NAME
    --zone ZONE

Die Befehlsausgabe sieht in etwa so aus: Im Feld HEALTH_STATE wird der Zustand der einzelnen VMs angezeigt.

NAME: igm-with-hc-fvz6
ZONE: europe-west1-b
STATUS: RUNNING
HEALTH_STATE: HEALTHY
ACTION: NONE
INSTANCE_TEMPLATE: my-template
VERSION_NAME:
LAST_ERROR:

NAME: igm-with-hc-gtz3
ZONE: europe-west1-b
STATUS: RUNNING
HEALTH_STATE: HEALTHY
ACTION: NONE
INSTANCE_TEMPLATE: my-template
VERSION_NAME:
LAST_ERROR:

Ersetzen Sie Folgendes:

MIG_NAME: Name der MIG.
ZONE: Die Zone, in der sich die MIG befindet. Verwenden Sie für eine regionale MIG --region REGION.

REST

Erstellen Sie für eine regionale MIG eine POST-Anfrage an die Methode listManagedInstances:

POST https://compute.googleapis.com/compute/v1/projects/project-id/regions/region/instanceGroupManagers/MIG_NAME/listManagedInstances

Verwenden Sie für eine zonale MIG die zonale MIG-Methode listManagedInstances:

POST https://compute.googleapis.com/compute/v1/projects/project-id/zones/zone/instanceGroupManagers/MIG_NAME/listManagedInstances

Die Anfrage gibt eine Antwort ähnlich der folgenden zurück. Sie enthält ein instanceHealth-Feld für die einzelnen verwalteten Instanzen.

{
  "managedInstances": [
    {
      "instance": "https://www.googleapis.com/compute/v1/projects/sproject-id/zones/zone/instances/igm-with-hc-fvz6",
      "instanceStatus": "RUNNING",
      "currentAction": "NONE",
      "id": "6159431761228150698",
      "version": {
        "instanceTemplate": "https://www.googleapis.com/compute/v1/projects/project-id/global/instanceTemplates/my-template"
      },
      "instanceHealth": [
        {
          "healthCheck": "https://www.googleapis.com/compute/v1/projects/project-id/global/healthChecks/example-check-01",
          "detailedHealthState": "HEALTHY"
        }
      ],
      "name": "igm-with-hc-fvz6"
    },
    {
      "instance": "https://www.googleapis.com/compute/v1/projects/project-id/zones/zone/instances/igm-with-hc-gtz3",
      "instanceStatus": "RUNNING",
      "currentAction": "NONE",
      "id": "6622324799312181783",
      "version": {
        "instanceTemplate": "https://www.googleapis.com/compute/v1/projects/project-id/global/instanceTemplates/my-template"
      },
      "instanceHealth": [
        {
          "healthCheck": "https://www.googleapis.com/compute/v1/projects/project-id/global/healthChecks/example-check-01",
          "detailedHealthState": "HEALTHY"
        }
      ],
      "name": "igm-with-hc-gtz3"
    }
  ]
}

Systemstatus

Für VMs sind die folgenden Systemstatus möglich:

HEALTHY: Die VM ist erreichbar, zum Endpunkt der Systemdiagnose der Anwendung kann eine Verbindung hergestellt werden und die Antwort entspricht den in der Systemdiagnose definierten Anforderungen.
DRAINING: Die VM wird per Drain beendet. Vorhandene Verbindungen zur VM können noch beendet werden, neue Verbindungen werden aber abgelehnt.
UNHEALTHY: Die VM ist erreichbar, entspricht aber nicht den in der Systemdiagnose definierten Anforderungen.
TIMEOUT: Die VW ist nicht erreichbar, zum Endpunkt der Systemdiagnose der Anwendung kann keine Verbindung hergestellt werden oder der Server einer VM antwortet nicht innerhalb des angegebenen Zeitlimits. Das kann beispielsweise auf eine falsche Konfiguration von Firewallregeln oder eine überlastete Serveranwendung einer VM zurückzuführen sein.
UNKNOWN: Die VM wird von der Systemdiagnose nicht erkannt oder ihr Status ist im Moment nicht bekannt. Es kann 10 Minuten dauern, bis das Monitoring von neuen VMs in einer MIG beginnt.

Neue VMs geben UNHEALTHY zurück, bis sie von der Systemdiagnose geprüft wurden.

Ob eine VM repariert wird, hängt von ihrem Systemstatus ab:

VMs im Status UNHEALTHY oder TIMEOUT, deren Initialisierungsphase abgelaufen ist, werden von der MIG, wenn möglich, sofort repariert.
Wenn eine VM den Systemstatus UNKNOWN hat, wird sie von der MIG nicht sofort repariert. Damit soll eine unnötige Reparatur von VMs vermieden werden, für die vorübergehend kein Systemdiagnosesignal verfügbar ist.

Die automatische Reparatur kann sich in folgenden Fällen verzögern:

Eine VM bleibt nach mehreren aufeinanderfolgenden Reparaturen fehlerhaft.
In der Gruppe ist ein großer Anteil der VMs fehlerhaft.

Wir möchten mehr über Ihre Anwendungsfälle und Probleme erfahren. Wir freuen uns auch über Feedback zu den verschiedenen Systemstatus von VMs. Senden Sie Ihr Feedback an unser Team unter mig-discuss@google.com.

Aktuelle Aktionen für VMs prüfen

Wenn eine MIG eine VM-Instanz erstellt, setzt die MIG das schreibgeschützte Feld currentAction dieser Instanz auf CREATING. Wenn die Gruppe mit einer Richtlinie zur automatischen Reparatur verknüpft ist, setzt die MIG die aktuelle Aktion der Instanz auf VERIFYING, nachdem die VM erstellt wurde und ausgeführt wird. Die Systemdiagnose beginnt dann mit der Prüfung der Anwendung der VM. Besteht die Anwendung diese erste Systemdiagnose innerhalb ihrer Startdauer, wird die VM bestätigt und die MIG ändert das Feld currentAction der VM in NONE.

Informationen zum Prüfen der aktuellen Aktionen auf VMs finden Sie unter Aktuelle Aktionen für VMs aufrufen.

MIG auf Stabilität prüfen

Compute Engine füllt auf Gruppenebene das schreibgeschütztes Feld status aus, das ein isStable-Flag enthält.

Wenn alle VMs in der Gruppe ausgeführt werden und fehlerfrei sind, d. h. im Feld currentAction für jede verwaltete Instanz auf NONE gesetzt ist, dann setzt die MIG das Feld status.isStable auf true fest. Beachten Sie, dass die Stabilität einer MIG von Gruppenkonfigurationen abhängt, die nicht mit der Richtlinie für die automatische Reparatur zusammenhängen. Wenn Ihre Gruppe beispielsweise automatisch skaliert und herunter- oder hochskaliert wird, wird das Feld status.isStable aufgrund des Autoscaling-Vorgangs auf false gesetzt.

Informationen zum Prüfen der Werte des Felds status.isStable Ihrer MIG finden Sie unter MIG auf Stabilität prüfen.

Frühere automatische Reparaturvorgänge ansehen

Mit der gcloud CLI oder REST können Sie frühere automatische Reparaturereignisse aufrufen.

gcloud

Verwenden Sie den Befehl gcloud compute operations list mit einem Filter, um nur die automatischen Reparaturereignisse in Ihrem Projekt aufzurufen.

gcloud compute operations list --filter='operationType~compute.instances.repair.*'

Weitere Informationen zu einem bestimmten Reparaturvorgang erhalten Sie mit dem Befehl describe. Beispiele:

gcloud compute operations describe repair-1539070348818-577c6bd6cf650-9752b3f3-1d6945e5 --zone us-east1-b

REST

Senden Sie für regionale MIGs eine GET-Anfrage an die Ressource regionOperations und geben Sie dabei einen Filter an, durch den die Ausgabeliste auf Ereignisse des Vorgangstyps compute.instances.repair.* beschränkt wird.

GET https://compute.googleapis.com/compute/v1/projects/project-id/region/region/operations?filter=operationType+%3D+%22compute.instances.repair.*%22

Verwenden Sie für zonale MIGs die Ressource zoneOperations.

GET https://compute.googleapis.com/compute/v1/projects/project-id/zones/zone/operations?filter=operationType+%3D+%22compute.instances.repair.*%22

Für weitere Informationen zu einem bestimmten Reparaturvorgang senden Sie eine GET-Anfrage für diesen Vorgang. Beispiel:

GET https://compute.googleapis.com/compute/v1/projects/project-id/zones/zone/operations/repair-1539070348818-577c6bd6cf650-9752b3f3-1d6945e5

Grundlagen einer guten Systemdiagnose für die automatische Reparatur

Die für die automatische Reparatur verwendeten Systemdiagnosen sollten konservativ sein, damit Instanzen nicht vorzeitig gelöscht und neu erstellt werden. Wenn eine Systemdiagnose für die automatische Reparatur zu aggressiv ist, kann die automatische Reparatur ausgelastete Instanzen fälschlicherweise als fehlerhaft interpretieren und unnötigerweise neu starten, wodurch die Verfügbarkeit reduziert wird.

unhealthy-threshold: Sollte größer als 1 sein. Setzen Sie diesen Wert idealerweise auf 3 oder höher. Dies schützt vor seltenen Fehlern wie einem Netzwerkpaketverlust.
healthy-threshold: Ein Wert von 2 ist für die meisten Anwendungen ausreichend.
timeout: Legen Sie hierfür einen großzügigen Wert fest. Der Zeitwert sollte fünfmal so hoch sein wie die erwartete Antwortzeit oder noch höher. Das sorgt für Schutz bei unerwarteten Verzögerungen wie ausgelasteten Instanzen oder langsamen Netzwerkverbindungen.
check-interval: Dieser Wert sollte zwischen 1 Sekunde und dem Zweifachen des Zeitlimits liegen (nicht zu lang oder zu kurz). Bei einem zu langen Intervall wird eine Instanz mit Fehlern nicht rechtzeitig erkannt. Ein zu kurzes Intervall kann zu einer merklichen Auslastung der Instanzen und des Netzwerks führen, da jede Sekunde eine hohe Anzahl von Systemdiagnoseprüfungen gesendet wird.

Weitere Informationen

Die Anleitung Automatische Reparatur für hochverfügbare Anwendungen verwenden durcharbeiten
Änderungen des VM-Systemzustands beobachten.
Konfigurationsupdates während der Reparatur anwenden.
Aktivieren Sie Reparaturen oder Autohealing, wenn Sie Autohealing deaktiviert haben.