Diese Seite wurde von der Cloud Translation API übersetzt.

Best Practices für das Upgrade von Clustern

Auf dieser Seite finden Sie Best Practices, um Ihre GKE-Cluster (Google Kubernetes Engine) nahtlos auf dem neuesten Stand zu halten, sowie Empfehlungen zur Erstellung einer Upgradestrategie, die Ihren Anforderungen entspricht und die Verfügbarkeit und Zuverlässigkeit Ihrer Umgebungen erhöht. Mithilfe dieser Informationen können Sie Ihre Cluster bei minimalen Unterbrechungen auf dem aktuellen Stand halten, sodass sie stabil und sicher laufen.

Informationen zum Verwalten automatischer Clusterupgrades in Produktionsumgebungen, die mit Flotten organisiert sind, finden Sie unter Clusterupgrades mit Roll-out-Sequenzierung.

Mehrere Umgebungen einrichten

Im Rahmen Ihres Workflows zur Bereitstellung von Softwareupdates empfehlen wir die Verwendung mehrerer Umgebungen. In mehreren Umgebungen können Sie Risiken und unerwünschte Ausfallzeiten minimieren, indem Sie Software- und Infrastrukturupdates getrennt von Ihrer Produktionsumgebung testen. Sie sollten zumindest eine Produktionsumgebung und eine Vor- oder Testumgebung haben.

Folgende Umgebungen werden empfohlen:

Umgebung	Beschreibung
Produktion	Dient zur Bereitstellung von Live-Traffic für Endnutzer geschäftskritischer Geschäftsanwendungen.
Staging	Wird verwendet, um sicherzustellen, dass alle neuen Änderungen aus vorherigen Umgebungen wie vorgesehen funktionieren, bevor die Änderungen in der Produktion bereitgestellt werden.
Test	Wird für die Leistungsbenchmark, Test- und QA-Arbeitslasten mit dem GKE-Release verwendet, den Sie in der Produktion verwenden. In dieser Umgebung können Sie das Upgrade der Steuerungsebene und der Knoten testen, bevor Sie dies in der Produktion tun.
Entwicklung	Wird für die aktive Entwicklung verwendet, die auf der in der Produktion ausgeführten Version basiert. In dieser Umgebung erstellen Sie Fehlerkorrekturen und inkrementelle Änderungen, die in der Produktion bereitgestellt werden.
Canary	Wird als sekundäre Entwicklungsumgebung verwendet, um neuere Kubernetes-Versionen zu testen. Mit GKE-Features und APIs können Sie die Produkteinführungszeit verkürzen, sobald diese Releases als Standardversion übernommen wurden und automatische Upgradeziele sind.

Cluster in Releasekanälen registrieren

Kubernetes veröffentlicht häufig Releaseupdates, um Sicherheitsupdates bereitzustellen, bekannte Probleme zu beheben und neue Features einzuführen. Mit GKE-Releasekanälen können Sie einen Ausgleich zwischen Stabilität und Feature-Set der im Cluster bereitgestellten Version erzielen. Wenn Sie einen neuen Cluster in einem Releasekanal registrieren, verwaltet Google automatisch die Version und aktualisiert den Rhythmus des Clusters und seiner Knotenpools.

Im Folgenden finden Sie einige empfohlene Umgebungen und die zugehörigen Releasekanäle, in denen Cluster registriert werden sollten, um sie mit den neuesten GKE- und Kubernetes-Updates auf dem neuesten Stand zu halten:

Umgebung	Release-Version	Beschreibung
Produktion	Stable- oder Regular-Kanal	Um Stabilität und Versionsreife zu erhalten, verwenden Sie den Stable- oder den Regular-Kanal für Produktionsarbeitslasten.
Staging	Wie Produktion	Verwenden Sie denselben Releasekanal wie die Produktion, damit Ihre Tests erkennen können, auf welche Version die Produktion aktualisiert wird.
Test
Entwicklung
Canary	Rapid	Verwenden Sie den Rapid Channel, um die neuesten Kubernetes-Versionen zu testen und der Kurve einen Schritt voraus zu sein, indem Sie neue GKE-Features oder APIs testen. Sie können die Produkteinführungszeit verkürzen, wenn die Version im Rapid Channel auf die Version aktualisiert wird, die Sie für die Produktion verwenden.
–	Erweitert	Wenn Sie Ihren Cluster länger auf einer Nebenversion belassen und nach dem Ende des Standardsupports weiterhin Sicherheitspatches erhalten möchten, verwenden Sie den Extended Channel. Weitere Informationen finden Sie unter Erweiterten Kanal für Langzeitsupport verwenden.

Cluster-Steuerungsebenen werden immer regelmäßig aktualisiert, unabhängig davon, ob Ihr Cluster in einer Release-Version registriert ist oder nicht.

Kontinuierliche Upgradestrategie erstellen

Nachdem Sie Ihren Cluster in einem Release-Kanal registriert haben, wird dieser Cluster regelmäßig auf die Version aktualisiert, die die Qualitäts- und Stabilitätsleiste des Kanals erfüllt. Diese Aktualisierungen umfassen Sicherheits- und Fehlerkorrekturen, die auf jedem Kanal mit zunehmender Genauigkeit angewendet werden:

Patches werden nach und nach auf die Steuerungsebene und die Knoten in allen Channels übertragen, wodurch die Zeit bis zur Inbetriebnahme des Stable Channel für Rapid und Regular Channels aufgewendet wird.
Die Steuerungsebene wird zuerst aktualisiert, gefolgt von Knoten zur Einhaltung der Kubernetes OSS-Richtlinie, wonach kubelet nicht neuer als kube-apiserver sein darf.
GKE führt automatisch Patches für Kanäle basierend darauf ein, wie wichtig oder kritisch sie sind.
Der Stable Channel erhält nur kritische Patches.

Updates zu neuen GKE-Versionen erhalten

Informationen zu neuen Versionen werden auf der Hauptseite der GKE-Versionshinweise sowie in einem RSS-Feed veröffentlicht. Jede Version hat eine vereinfachte und dedizierte Seite mit Versionshinweisen (z. B. Versionshinweise für den Stable Channel) mit Informationen zur empfohlenen GKE-Version für diesen Kanal.

Verwenden Sie Pub/Sub und abonnieren Sie Benachrichtigungen, um proaktiv Updates zu GKE-Upgrades zu erhalten, bevor die Upgrades erfolgen.

Sobald eine neue Version verfügbar ist, sollten Sie ein Upgrade planen, bevor die Version zum Ziel für automatische Upgrades für den Cluster wird. Dieser Ansatz ermöglicht bei Bedarf eine bessere Kontrolle und Planbarkeit, da GKE das automatische Upgrade für einen Cluster überspringen kann, wenn das verfügbare Ziel für automatische Upgrades früher als die Version ist, auf die Sie den Cluster bereits manuell aktualisiert haben, oder mit dieser Version identisch ist. Informationen zu automatischen Upgradezielen für einen bestimmten Cluster finden Sie unter Informationen zu Clusterupgrades abrufen.

Neue Patch- und Nebenversionen testen und prüfen

Alle Versionen durchlaufen interne Tests, unabhängig vom Kanal, in dem sie veröffentlicht wurden. Wir empfehlen jedoch dringend, häufige Aktualisierungen und Patches aus vorgelagerten Kubernetes-Releases und GKE zu testen, bevor Sie die Releases in Ihre Produktionsumgebung einführen, insbesondere Upgrades von Kubernetes-Nebenversionen.

Jede Release-Version bietet mehrere verfügbare Versionen, darunter eine Standardversion für die Clustererstellung und Ziele für automatische Upgrades:

Neue Patchreleases sind eine Woche vor dem Start der automatischen Upgrades verfügbar.
Neue Kubernetes-Nebenreleases sind vier Wochen vor der Standardeinstellung verfügbar.

GKE aktualisiert Cluster automatisch auf neuere Versionen. Wenn Sie mehr Kontrolle über den Upgradeprozess haben möchten, empfehlen wir, ein Upgrade auf eine verfügbare Version durchzuführen. GKE führt für manuell aktualisierte Cluster kein automatisches Upgrade auf dasselbe Ziel für automatische Upgrades durch.

Ein empfohlener Ansatz zur Automatisierung und Optimierung von Upgrades würde Folgendes umfassen:

Eine Vorproduktionsumgebung, in der die verfügbare Version verwendet wird.
Upgrade-Benachrichtigungen, die im Cluster eingerichtet werden, um Ihr Team über neue verfügbare Versionen zum Testen und Zertifizieren zu informieren.
Eine Produktionsumgebung, die über eine Version, die Sie bereits in Ihrer Vorproduktionsumgebung getestet haben, für einen Releasekanal abonniert wurde.
Graduelle Einführung neuer verfügbarer Versionen für Produktionscluster. Wenn z. B. mehrere Produktionscluster vorhanden sind, beginnt ein gradueller Upgradeplan, bei dem ein Teil dieser Cluster auf die verfügbare Version aktualisiert wird, während die anderen in der vorhandenen Version bleiben, gefolgt von zusätzlichen Teilupgrades, bis das Upgrade zu 100% abgeschlossen ist.

In der folgenden Tabelle sind die Releaseereignisse und die empfohlenen Aktionen zusammengefasst:

Ereignis	Empfohlene Maßnahmen
Die neue Version X wird in einem Kanal verfügbar gemacht.	Führen Sie ein manuelles Upgrade des Testclusters durch und qualifizieren und testen Sie die neue Version.
Version X wird zum Ziel für automatische Upgrades für die Nebenversion des Clusters.	GKE startet automatische Upgrades auf das Ziel für automatische Upgrades. Erwägen Sie ein Upgrade der Produktion vor dem Gerätepool.
GKE startet das automatische Upgrade der Cluster.	Erlauben Sie Clustern den Erhalt automatischer Upgrades oder verschieben Sie das Upgrade mithilfe von Wartungsfenstern.

Upgradestrategie für Patchreleases

Dies ist eine empfohlene Upgradestrategie für Patchreleases unter Verwendung eines Szenarios, bei dem Folgendes gilt:

Alle Cluster haben den Stable Channel abonniert.
Neue verfügbare Versionen werden zuerst für den Staging-Cluster eingeführt.
Für den Produktionscluster wird automatisch ein Upgrade auf das neue Ziel für die automatische Aktualisierung durchgeführt.
Neue verfügbare Versionen für GKE regelmäßig überwachen.

Zeit	Ereignis	Was soll ich tun?
T – 1 Woche	Eine neue Patchversion ist verfügbar.	Aktualisieren Sie die Staging-Umgebung.
T	Die Patchversion wird zum Ziel für das automatische Upgrade.	Eventuell sollten Sie die Produktionssteuerungsebene im Voraus aktualisieren, um bessere Vorhersagen zu treffen.
T	GKE beginnt mit dem Upgrade der Steuerungsebenen auf das Ziel des automatischen Upgrades.	Wir empfehlen Ihnen, schon bald die Produktionsknotenpools zu aktualisieren, um bessere Vorhersagen zu treffen.
T + 1 Woche	GKE beginnt mit dem Upgrade von Clusterknotenpools auf das Ziel für automatische Upgrades.	GKE führt automatisch Upgrades für Cluster aus, wobei die manuell aktualisierten Cluster übersprungen werden.

Upgradestrategie für neue Nebenversionen

Dies ist eine empfohlene Upgradestrategie für neue Nebenversionen:

Zeit	Ereignis	Was soll ich tun?
T – 3 Wochen	Neue Nebenversion verfügbar	Upgrade der Teststeuerungsebene
T – 2 Wochen		Wenn das Upgrade der Steuerungsebene erfolgreich war, sollten Sie die Produktionssteuerungsebene im Voraus aktualisieren. Upgrade der Testknotenpools.
T – 1 Woche		Führen Sie bei einem erfolgreichen Upgrade ein Upgrade der Produktionsknotenpools im Voraus aus.
T	Die Nebenversion wird zum Ziel für das automatische Upgrade.
T	GKE beginnt mit dem Upgrade der Clustersteuerungsebenen auf das Ziel des automatischen Upgrades.	Erstellen Sie ein Ausschlussfenster, wenn vor der Produktionseinführung mehr Tests oder Maßnahmen zur Reduzierung erforderlich sind.
T + 1 Woche	GKE beginnt mit dem Upgrade von Clusterknotenpools auf das Ziel für automatische Upgrades.	GKE führt automatisch Upgrades für Cluster aus, wobei die manuell aktualisierten Cluster übersprungen werden.

Unterbrechungen bestehender Arbeitslasten während eines Upgrades reduzieren

Es ist wichtig, dass Sie Ihre Cluster mithilfe von Sicherheitspatches und Fehlerkorrekturen aktualisieren, um die Integrität Ihrer Cluster und die Geschäftskontinuität zu gewährleisten. Regelmäßige Updates schützen Ihre Arbeitslasten vor Sicherheitslücken und Fehlern.

Wartungsfenster und Ausschlüsse planen

Um die Zuverlässigkeit Ihrer Upgrades zu verbessern und Upgrades an Außendienstzeiten anzupassen, können Sie automatische Upgrades sowohl der Steuerungsebene als auch der Knoten durch Erstellen eines Wartungsfensters steuern. GKE berücksichtigt Wartungsfenster. Wenn der Upgradeprozess über das festgelegte Wartungsfenster hinaus ausgeführt wird, versucht GKE, den Vorgang zu unterbrechen und während des nächsten Wartungsfensters fortzusetzen.

GKE folgt einem mehrtägigen Rolloutzeitplan, um neue Versionen zur Verfügung zu stellen sowie automatische Steuerungsebenen und Knoten für Cluster in verschiedenen Regionen zu aktualisieren. Der Rollout geht in der Regel über vier oder mehr Tage und umfasst einen Zeitpuffer, um Probleme zu beobachten und zu überwachen. In einer Multi-Cluster-Umgebung können Sie für jeden Cluster ein separates Wartungsfenster verwenden, um das Rollout in allen Clustern zu sequenzieren. Sie können beispielsweise steuern, wann Cluster in verschiedenen Regionen Wartungsarbeiten erhalten, indem Sie für jeden Cluster unterschiedliche Wartungsfenster festlegen.

Ein weiteres Tool zur Reduzierung von Störungen, insbesondere in Zeiten hoher Nachfrage, sind Wartungsausschlüsse. Verwenden Sie Wartungsausschlüsse, um eine automatische Wartung während dieser Zeiträume zu verhindern. Wartungsausschlüsse können für neue oder vorhandene Cluster festgelegt werden. Sie können Ausschlüsse auch zusammen mit Ihrer Upgradestrategie verwenden. Beispielsweise kann es sinnvoll sein, ein Upgrade auf einen Produktionscluster zu verschieben, wenn eine Test- oder Staging-Umgebung aufgrund eines Upgrades fehlschlägt.

Toleranz für Unterbrechungen festlegen

Möglicherweise kennen Sie das Konzept der Replikate in Kubernetes. Replikate sorgen für Redundanz Ihrer Arbeitslasten, um Leistung und Reaktionsfähigkeit zu verbessern. Wenn dieses Flag festgelegt ist, wird die Anzahl der Pod-Replikate gesteuert, die zu einem bestimmten Zeitpunkt ausgeführt werden. Bei der Wartung entfernt Kubernetes jedoch die zugrunde liegenden Knoten-VMs, wodurch die Anzahl der Replikate reduziert werden kann. Damit Ihre Arbeitslasten auch während der Wartung eine ausreichende Anzahl von Replikaten haben, sollten Sie ein Budget für Pod-Störungen (PDB) verwenden.

In einem Budget für Pod-Störungen können Sie eine Anzahl (oder einen Prozentsatz) von Pods definieren, die beendet werden können, selbst wenn durch das Beenden der Pods die aktuelle Anzahl an Replikaten unter dem gewünschten Wert liegt. Durch diesen Vorgang kann das Entfernen von Knoten beschleunigt werden, da nicht mehr gewartet werden muss, bis die migrierten Pods voll funktionsfähig sind. Stattdessen werden Pods gemäß der PDB-Konfiguration von einem Knoten entfernt, damit durch das Deployment fehlende Pods auf anderen verfügbaren Knoten bereitgestellt werden können. Sobald das PDB festgelegt ist, fährt GKE keine Pods in der Anwendung herunter, wenn die Anzahl der Pods gleich oder unter einem konfigurierten Limit liegt. GKE folgt einem PDB bis zu 60 Minuten.

Upgrades von Knotenpools steuern

In GKE können Sie eine Strategie für das Upgrade des Knotens auswählen, um festzustellen, wie die Knoten in Ihren Knotenpools aktualisiert werden. Knotenpools verwenden standardmäßig Surge-Upgrades. Bei Surge-Upgrades muss für den Upgradeprozess für GKE-Knotenpools jede VM im Knotenpool neu erstellt werden. Bei einem Rolling Update wird eine neue VM mit der neuen Version erstellt. Dafür müssen Sie alle Pods, die auf dem alten Knoten ausgeführt werden, herunterfahren und die Pods auf den neuen Knoten verschieben. Ihre Arbeitslasten können mit ausreichender Redundanz (Replikaten) ausgeführt werden. Sie können sich auf Kubernetes verlassen, um Pods nach Bedarf zu verschieben und neu zu starten. Eine vorübergehend reduzierte Anzahl von Replikaten kann jedoch weiterhin zu Störungen für Ihr Unternehmen führen und die Leistung der Arbeitslast verlangsamen, bis Kubernetes wieder den gewünschten Zustand erreicht hat (d. h. die minimale Anzahl der benötigten Replikate erfüllt). Eine solche Unterbrechung können Sie mit Surge-Upgrades vermeiden.

Während eines Upgrades mit aktiviertem Surge-Upgrade sichert GKE zuerst die für das Upgrade erforderlichen Ressourcen (Maschinen), erstellt dann einen neuen aktualisierten Knoten und drosselt erst dann den alten Knoten und schaltet ihn schließlich ab. So bleibt die erwartete Kapazität während des Upgrades erhalten.

Bei großen Clustern, für die das Upgrade länger dauern kann, können Sie die Ausführungszeit für das Upgrade verkürzen. Aktualisieren Sie dazu jeweils mehrere Knoten gleichzeitig. Verwenden Sie Surge-Upgrade mit maxSurge=20, maxUnavailable=0, um GKE anzuweisen, 20 Knoten gleichzeitig zu aktualisieren, ohne vorhandene Kapazitäten zu verwenden.

Erweiterten Kanal für Langzeitsupport verwenden

Wenn Sie für Ihren Cluster eine Nebenversion länger beibehalten möchten, sollten Sie Ihren Cluster im erweiterten Kanal registrieren. In diesem Channel wird eine Nebenversion von GKE etwa 24 Monate lang unterstützt. Weitere Informationen finden Sie unter Langzeitsupport mit dem Extended Channel erhalten.

Damit Sie den größtmöglichen Nutzen aus dem Channel ziehen, empfehlen wir Ihnen, die folgenden Best Practices zu beachten. Einige dieser Best Practices erfordern einige manuelle Maßnahmen, einschließlich des manuellen Upgrades eines Clusters und des Änderns des Release-Kanals. eines Clusters. Prüfen Sie die folgenden unterstützten Szenarien sowie Wann der erweiterte Kanal nicht verwendet werden sollte.

Nebenversion vorübergehend länger beibehalten

Wenn Sie einen Cluster vorübergehend länger als den standardmäßigen 14-monatigen Supportzeitraum auf einer Nebenversion belassen müssen, um beispielsweise die Verwendung verworfener APIs zu minimieren, die in der nächsten Nebenversion entfernt werden, gehen Sie so vor. Sie können den Cluster vorübergehend von einem anderen Release-Kanal in einen erweiterten Kanal verschieben, um weiterhin Sicherheitspatches zu erhalten, während Sie das Upgrade auf die nächste Nebenversion vorbereiten. Wenn Sie bereit sind, ein Upgrade auf die nächste Nebenversion durchzuführen, führen Sie ein Upgrade des Clusters manuell durch und verschieben Sie dann den Cluster zurück in den ursprünglichen Release-Kanal.

1- bis 2-mal pro Jahr Upgrades von Nebenversionen

Wenn Sie beim Upgrade auf eine neue Nebenversion nur eine minimale Unterbrechung des Cluster wünschen, aber weiterhin einige neue Features erhalten möchten, gehen Sie so vor:

Registrieren Sie einen Cluster im erweiterten Kanal.
Führen Sie ein- bis zweimal pro Jahr zwei aufeinanderfolgende Upgrades von Nebenversionen durch. Führen Sie beispielsweise ein Upgrade von 1.30 auf 1.31 und dann auf 1.32 durch.

Dadurch wird sichergestellt, dass der Cluster auf einer verfügbaren Nebenversion bleibt, Funktionen von neuen Nebenversionen erhält, die Upgrades von Nebenversionen aber nur ausgeführt werden, wenn Sie entscheiden, dass der Cluster bereit ist.

Wann sollte der erweiterte Kanal nicht verwendet werden?

Wenn Sie den erweiterten Kanal für den vorgesehenen Zweck verwenden möchten, sind manuelle Maßnahmen erforderlich. Im folgenden Szenario werden die Folgen der Verwendung des Extended Channel ohne aktive Verwaltung der Nebenversion Ihres Clusters veranschaulicht.

Nichts unternehmen und weiterhin kleinere Upgrades in derselben Häufigkeit erhalten

Wenn Sie für Ihren Cluster dauerhaft die Nebenversion beibehalten möchten, registrieren Sie Ihren Cluster für den erweiterten Kanal und ergreifen Sie keine weiteren Maßnahmen. Alle Nebenversionen werden irgendwann nicht mehr unterstützt und GKE führt automatisch Upgrades von Clustern mit nicht unterstützten Nebenversionen durch. GKE führt also für diesen Cluster Upgrades von einer nicht unterstützten Nebenversion auf eine bald nicht mehr unterstützte Nebenversion durch, was im Durchschnitt etwa alle 4 Monate geschieht. Das bedeutet, dass der Cluster genauso häufig Upgrades von Nebenversionen wie bei anderen Release-Versionen erhält, neue Funktionen aber später.

Zusammenfassung der Checkliste

In der folgenden Tabelle sind die Aufgaben zusammengefasst, die für eine Upgradestrategie empfohlen werden, um Ihre GKE-Cluster nahtlos auf dem neuesten Stand zu halten:

Best Practice	Aufgaben
Mehrere Umgebungen einrichten	Mindestens eine Produktions- und Vorproduktionsumgebung einrichten.
Cluster in Releasekanälen registrieren	Produktionscluster für den Stable oder Regular Kanal registrieren. Vorproduktionscluster in denselben Kanälen registrieren wie die Produktion. Entwicklungscluster (z. B. Canary) im Rapid Kanal früh registrieren. Für Cluster, bei denen Sie eine Nebenversion länger ausführen müssen, registrieren Sie Cluster im erweiterten Kanal.
Kontinuierliche Upgradestrategie erstellen	Proaktiv Updates zu GKE-Upgrades und GKE-Versionen erhalten. Neue Patch- und Nebenversionen testen und prüfen.
Unterbrechungen bestehender Arbeitslasten reduzieren	Zeit automatischer Upgrades durch Erstellen eines Wartungsfensters steuern. Mit Wartungsausschlüssen verhindern, dass zu Zeiten hoher Nachfrage automatische Wartungsmaßnahmen ausgeführt werden. Das richtige Budget für Pod-Störungen für Ihre Arbeitslasten festlegen. Strategie zur Steuerung von Knotenpools verwenden.

Nächste Schritte

Sehen Sie sich das Google Cloud Next 2020-Video zum Thema Geschäftskontinuität in Zeiten von Unsicherheiten und rein digitalen Geschäftsmodellen mit GKE an.
Best Practices für das GKE-Upgrade
Weitere Informationen zu Releasekanälen.
Versionsverwaltung und automatische Upgrades in GKE.