Regionale Cluster

Auf dieser Seite wird erläutert, wie regionale Cluster in Google Kubernetes Engine (GKE) funktionieren.

Regionale Cluster erhöhen die Verfügbarkeit eines Clusters, indem die Steuerungsebene und die Knoten über mehrere Zonen in einer Region hinweg repliziert werden.

Regionale Cluster bieten alle Vorteile von multizonalen Clustern mit den folgenden zusätzlichen Vorteilen:

Stabilität beim Ausfall einer einzelnen Zone: Regionale Cluster sind in einer Region statt in einer einzelnen Zone innerhalb einer Region verfügbar. Wenn eine einzelne Zone ausfällt, sind die Steuerungsebene und die Ressourcen nicht betroffen.
Kontinuierliche Upgrades der Steuerungsebene, Größenänderung der Steuerungsebene und reduzierte Ausfallzeiten durch Ausfälle der Steuerungsebene. Mit redundanten Replikaten der Steuerungsebene bieten regionale Cluster eine höhere Verfügbarkeit der Kubernetes API, sodass Sie auch während Upgrades auf Ihre Steuerungsebene zugreifen können.

Autopilot-Cluster von GKE sind immer regional. Wenn Sie GKE Standard verwenden, können Sie regionale, zonale oder multizonale Cluster erstellen. Weitere Informationen zu den verschiedenen Clusterverfügbarkeitstypen finden Sie unter Clusterkonfigurationsoptionen.

In regionalen Clustern, einschließlich Autopilot-Clustern, wird die Steuerungsebene in drei Zonen einer Region repliziert. GKE repliziert Knoten automatisch zonenübergreifend in derselben Region. In Standardclustern und -knotenpools können Sie optional die Zonen angeben, in denen die Knoten ausgeführt werden. Alle Zonen müssen sich in der Region der Steuerungsebene befinden.

Nachdem Sie einen regionalen Cluster erstellt haben, ist es nicht mehr möglich, ihn in einen zonalen Cluster umzuwandeln.

So funktionieren regionale Cluster

Regionale Cluster replizieren die Steuerungsebene des Clusters und die Knoten in mehreren Zonen innerhalb einer Region. Bei der Standardkonfiguration erstellt ein regionaler Cluster in der Region us-east1 beispielsweise Replikate der Steuerungsebene und der Knoten in den drei us-east1-Zonen: us-east1-b, us-east1-c. und us-east1-d. Bei einem Infrastrukturausfall werden die Autopilot-Arbeitslasten weiterhin ausgeführt und GKE gleicht die Knoten automatisch neu aus. Wenn Sie Standardcluster verwenden, müssen Sie Knoten manuell oder mit dem Cluster Autoscaler neu ausgleichen.

Beschränkungen

Der für regionale Standardcluster erstellte Standardknotenpool besteht aus neun Knoten (drei pro Zone), die gleichmäßig auf drei Zonen in einer Region verteilt sind. Bei öffentlichen Clustern erfordert dies neun IP-Adressen. Bei Bedarf können Sie die Anzahl der Knoten auf einen Knoten pro Zone reduzieren. Neu erstellten Cloud-Rechnungskonten werden pro Region nur acht IP-Adressen zugeteilt. Daher müssen Sie unter Umständen je nach Größe Ihres regionalen Clusters eine Erhöhung Ihrer Kontingente für regionale verwendete IP-Adressen anfordern. Wenn die Anzahl der verwendbaren IP-Adressen zu niedrig ist, schlägt die Clustererstellung fehl.
Wählen Sie zum Ausführen von GPUs in Ihrem regionalen Cluster eine Region mit mindestens einer Zone aus, in der die angeforderten GPUs verfügbar sind. Sie müssen beim Erstellen des Knotenpools das Flag --node-locations verwenden, um die Zone oder die Zonen anzugeben, die die angeforderten GPUs enthalten.

Wenn die von Ihnen ausgewählte Region nicht mindestens eine Zone hat, in der die angeforderten GPUs verfügbar sind, wird möglicherweise ein Fehler wie der folgende angezeigt:
```
ERROR: (gcloud.container.clusters.create) ResponseError: code=400, message=
    Accelerator type "nvidia-l4" does not exist in zone europe-west3-a.
```
Eine vollständige Liste der Regionen und Zonen, in denen GPUs verfügbar sind, finden Sie unter GPUs in Compute Engine.
Zonen für Knotenpools im Standardmodus müssen sich in derselben Region wie die Steuerungsebene des Clusters befinden. Bei Bedarf können Sie die Zonen eines Clusters ändern. Dadurch erstrecken sich alle neuen und vorhandenen Knoten über diese Zonen.

Preise

Alle Autopilot-Cluster sind regional und unterliegen dem Autopilot-Preismodell.

Im Standardmodus benötigen regionale Cluster mehr regionale Kontingente Ihres Projekts als ein ähnlicher zonaler oder multizonaler Cluster. Machen Sie sich daher mit Ihren Kontingenten und den Standard-Preisen vertraut, bevor Sie regionale Cluster einsetzen. Wenn die Fehlermeldung Insufficient regional quota to satisfy request for resource auftritt, überschreitet Ihre Anfrage das in der aktuellen Region verfügbare Kontingent.

Außerdem wird Ihnen zonenübergreifender Knoten-zu-Knoten-Traffic in Rechnung gestellt. Wenn beispielsweise eine Arbeitslast, die in einer Zone ausgeführt wird, mit einer Arbeitslast in einer anderen Zone kommunizieren muss, entstehen für den zonenübergreifenden Traffic Kosten. Weitere Informationen finden Sie in der Compute Engine-Preisübersicht unter Ausgehend zonenübergreifend in derselben Region (pro GB) im Abschnitt "Allgemeine Netzwerkpreise".

Nichtflüchtiger Speicher in regionalen Clustern

Zonale nichtflüchtige Speicher sind zonale Ressourcen und regionale nichtflüchtige Speicher sind multizonale Ressourcen. Wenn Sie einen nichtflüchtigen Speicher hinzufügen, sofern keine Zone angegeben ist, weist GKE das Laufwerk einer einzelnen zufälligen Zone zu. Informationen zum Steuern der Zonen finden Sie unter Zonen in nichtflüchtigen Speichern.

Regionale Cluster automatisch skalieren

Beachten Sie bei der automatischen Skalierung von Knotenpools in regionalen Clustern im Standardmodus mit Cluster Autoscaler die im Folgenden aufgeführten Hinweise.

Weitere Informationen erhalten Sie unter Limits für die automatische Skalierung für regionale Cluster und Zonenübergreifender Ausgleich für Cluster Autoscaler.

Diese Überlegungen gelten nur für Cluster im Standardmodus mit Cluster Autoscaler.

Skalierungslimits überdimensionieren

Damit im unwahrscheinlichen Fall eines zonalen Ausfalls die Kapazität aufrechterhalten wird, können Sie Ihre Skalierungslimits mit GKE überdimensionieren. So ist die Mindestverfügbarkeit auch dann gewährleistet, wenn einige Zonen nicht verfügbar sind.

Wenn Sie beispielsweise einen Cluster mit drei Zonen auf 150 % (50 % Überschusskapazität) überdimensionieren, können Sie dafür sorgen, dass 100 % des Traffics an verfügbare Zonen weitergeleitet wird, wenn ein Drittel der Clusterkapazität verloren geht. Im vorherigen Beispiel würden Sie dies erreichen, indem Sie anstelle von vier maximal sechs Knoten pro Zone angeben. Wenn eine Zone ausfällt, wird der Cluster auf 12 Knoten in den verbleibenden Zonen skaliert.

Wenn Sie einen Zwei-Zonen-Cluster auf 200 % überdimensionieren, werden 100 % des Traffics in jedem Fall weitergeleitet, auch wenn die Hälfte der Clusterkapazität verloren geht.

Weitere Informationen zum Cluster Autoscaler oder über FAQ für Autoscaling finden Sie in der Kubernetes-Dokumentation.