Questa pagina è stata tradotta dall'API Cloud Translation.

Upgrade di un cluster

Questo documento spiega come eseguire l'upgrade dei cluster in Google Distributed Cloud (solo software) per VMware. Questo documento fornisce i passaggi per eseguire l'upgrade della workstation di amministrazione, dei cluster utente e dei cluster di amministrazione. I passaggi per l'upgrade di un cluster utente mostrano come eseguire l'upgrade del piano di controllo e di tutti i pool di nodi. Se vuoi eseguire l'upgrade del control plane e dei node pool del cluster utente separatamente, consulta Eseguire l'upgrade dei node pool.

Questa pagina è rivolta agli amministratori IT e agli operatori che gestiscono il ciclo di vita dell'infrastruttura tecnologica sottostante. Per scoprire di più sui ruoli comuni e sulle attività di esempio a cui facciamo riferimento nei contenuti, consulta Ruoli e attività comuni degli utenti GKE. Google Cloud

Prima di procedere, ti consigliamo di consultare la seguente documentazione:

Panoramica dell'upgrade
Questo documento descrive, tra le altre cose, la differenza di versione supportata e le regole di versione per gli upgrade, che sono cambiate per la versione 1.28 e successive.
Best practice per l'upgrade
Questo documento fornisce elenchi di controllo e best practice per l'upgrade dei cluster.

Differenze tra i cluster avanzati

Quando i cluster avanzati sono abilitati, ci sono alcune differenze con gli upgrade, in particolare nell'anteprima dei cluster avanzati nella versione 1.31. Per visualizzare le differenze tra gli upgrade, cerca la parola advanced in questo documento. Per una tabella di tutte le differenze, consulta Differenze durante l'esecuzione di cluster avanzati.

Upgrade automatico ai cluster avanzati nella versione 1.33

Assicurati che la versione di gkectl: la versione di gkectl deve essere la stessa della versione di destinazione. Ad esempio, se esegui l'upgrade di un cluster non avanzato 1.32 a un cluster avanzato 1.33.0-gke.799, la versione di gkectl deve essere 1.33.0-gke.799. Questo requisito di versione rigoroso si applica solo durante la transizione a un cluster avanzato. Per tutti gli upgrade successivi del cluster avanzato, sono in vigore le regole standard di distorsione della versione.
Disallineamento delle versioni non consentito: quando esegui l'upgrade da un cluster non avanzato a uno avanzato, non puoi eseguire l'upgrade del control plane e dei node pool separatamente. Devi eseguire l'upgrade del control plane e di tutti i node pool alla versione 1.33 contemporaneamente.

Requisiti

Questa sezione fornisce informazioni sui requisiti relativi alla versione e sui requisiti per l'utilizzo dei client API GKE On-Prem (la console Google Cloud , Google Cloud CLI e Terraform) per gli upgrade.

Regole per le versioni

Le regole per gli upgrade dipendono dalla versione secondaria del cluster.

Per le versioni 1.30 e precedenti, la versione secondaria del cluster utente deve essere maggiore o uguale a quella del cluster di amministrazione. La versione patch non è importante. Ad esempio, se un cluster utente ha la versione 1.30.1, il cluster di amministrazione può essere aggiornato a una versione patch superiore, ad esempio 1.30.3.
Per le versioni 1.31 e successive, la versione del cluster di amministrazione, inclusa la versione della patch, deve essere maggiore o uguale alla versione del cluster utente. Ad esempio, se un cluster di amministrazione ha la versione 1.31.1, la versione più recente a cui è possibile eseguire l'upgrade del cluster utente è la 1.31.1.

Quando vuoi eseguire l'upgrade dei cluster alla versione 1.31, devi prima portare tutti i cluster alla versione 1.30. Dopo che tutti i cluster sono alla versione 1.30, esegui l'upgrade del cluster di amministrazione alla versione 1.31. Dopodiché, puoi eseguire l'upgrade dei cluster utente alla stessa versione patch 1.31 del cluster di amministrazione.

Regole di versione per `gkectl`

La versione di gkectl che puoi utilizzare per l'upgrade dipende dalla versione del cluster di destinazione (ovvero la versione del cluster di cui stai eseguendo l'upgrade). In genere, utilizzi la stessa versione di gkectl della versione di destinazione del cluster. Durante l'upgrade vengono applicate le seguenti regole:

La versione gkectl non può essere una versione secondaria precedente a quella del cluster secondario di destinazione. Ad esempio, se esegui l'upgrade di un cluster 1.29 alla versione 1.30, non puoi utilizzare gkectl 1.29 perché è inferiore alla versione del cluster di destinazione. Le versioni patch non sono importanti. Ad esempio, puoi utilizzare gkectl versione 1.29.0-gke.1456 per eseguire l'upgrade a una versione patch successiva, ad esempio 1.29.1000-gke.94.
La versione di gkectl non può essere superiore di più di due versioni secondarie rispetto alla versione attuale del cluster. Ad esempio, se esegui l'upgrade di un cluster 1.28 alla versione 1.29, la versione di gkectl può essere 1.29 o 1.30. Tuttavia, non puoi utilizzare la versione 1.31 perché è tre versioni secondarie successive alla versione del cluster.gkectl
Se esegui l'upgrade del cluster a un cluster avanzato, la versione gkectl deve essere uguale alla versione di destinazione. Ad esempio, se esegui l'upgrade di un cluster non avanzato 1.32 a un cluster avanzato 1.33.0-gke.799, la versione di gkectl deve essere 1.33.0-gke.799.
- Per impostazione predefinita, il cluster verrà eseguito l'upgrade al cluster avanzato nella versione 1.33. Ciò significa che per gli upgrade da 1.32 a 1.33, la versione gkectl deve essere uguale alla versione aggiornata.
- Questo requisito di versione rigoroso si applica solo durante la transizione a un cluster avanzato. Per tutti gli upgrade successivi sul cluster avanzato, sono in vigore le regole standard di distorsione della versione.

Se necessario, consulta la sezione Scaricare gkectl per ottenere una versione supportata di gkectl.

Esamina le regole firewall

Nella versione 1.29 e successive, i controlli preliminari lato server sono abilitati per impostazione predefinita. I controlli preliminari lato server richiedono regole firewall aggiuntive. In Regole firewall per i cluster di amministrazione, cerca "Controlli preliminari" e assicurati che tutte le regole firewall richieste siano configurate.

Con i controlli preliminari lato server, quando esegui l'upgrade di un cluster utente utilizzando gkectl, i controlli preliminari vengono eseguiti sul cluster di amministrazione anziché localmente sulla workstation di amministrazione. I controlli preliminari lato server vengono eseguiti anche sul cluster di amministrazione quando utilizzi la console Google Cloud , Google Cloud CLI o Terraform per eseguire l'upgrade di un cluster.

Quando esegui l'upgrade di un cluster di amministrazione, Google Distributed Cloud esegue il deployment di un cluster Kubernetes in Docker (kind) per ospitare temporaneamente i controller Kubernetes necessari per l'upgrade del cluster di amministrazione. Questo cluster temporaneo è chiamato cluster di bootstrap. I controlli preflight lato server vengono eseguiti sul cluster di bootstrap quando esegui l'upgrade di un cluster di amministrazione.

Abilita `stackdriver`

Se hai creato il cluster utente utilizzando gkectl, prima di eseguire l'upgrade, assicurati che la sezione stackdriver nel file di configurazione del cluster utente sia compilata, in modo da attivare stackdriver (necessario per la registrazione e il monitoraggio). Se stackdriver non è attivato, compila la sezione stackdriver nel file di configurazione del cluster utente e aggiorna il cluster prima di eseguire l'upgrade.

Se hai creato il cluster utilizzando Terraform, la console Google Cloud o gcloud CLI, stackdriver viene attivato automaticamente.

Abilita Dataplane V2

A partire dalla versione 1.31, Dataplane V2 deve essere abilitato su tutti i cluster utente. Prima di eseguire l'upgrade di un cluster utente alla versione 1.31, esegui i seguenti passaggi. Se hai dubbi in merito alla rimozione temporanea della specifica NetworkPolicy, contatta l'Assistenza Google.

Imposta enableDataplaneV2 su true nel file di configurazione del cluster utente.

Se il cluster utilizza un NetworkPolicy, rimuovi temporaneamente la relativa specifica dal cluster nel seguente modo:

Controlla se al tuo cluster è applicato un NetworkPolicy non di sistema:

kubectl --kubeconfig USER_CLUSTER_KUBECONFIG get networkpolicy -A -o wide | grep -v kube-system

Se l'output del passaggio precedente non era vuoto, salva ogni specifica NetworkPolicy in un file in modo da poterla riapplicare dopo l'upgrade del cluster.
```
kubectl --kubeconfig USER_CLUSTER_KUBECONFIG get networkpolicy NETWORK_POLICY_NAME -n NETWORK_POLICY_NAMESPACE -o yaml > NETWORK_POLICY_NAME.yaml
```
Sostituisci quanto segue:
- NETWORK_POLICY_NAME: il nome di NetworkPolicy che stai salvando.
- NETWORK_POLICY_NAMESPACE: lo spazio dei nomi di NetworkPolicy.

Elimina NetworkPolicy utilizzando il seguente comando:

kubectl --kubeconfig USER_CLUSTER_KUBECONFIG delete networkpolicy NETWORK_POLICY_NAME -n NETWORK_POLICY_NAMESPACE

Continua con l'upgrade.
Al termine dell'upgrade, se hai rimosso specifiche NetworkPolicy non di sistema, riapplicale con questo comando:
```
kubectl --kubeconfig USER_CLUSTER_KUBECONFIG apply -f NETWORK_POLICY_NAME.yaml
```

Requisiti di Google API e IAM

Per eseguire l'upgrade di un cluster alla versione 1.28 e successive, devi attivare kubernetesmetadata.googleapis.com e concedere il ruolo IAM kubernetesmetadata.publisher al service account logging-monitoring. Queste modifiche sono necessarie per utilizzare Cloud Monitoring.

Attiva kubernetesmetadata.googleapis.com:
```
gcloud services enable --project PROJECT_ID  \
    kubernetesmetadata.googleapis.com
```
Sostituisci PROJECT_ID con l'ID del progetto host del parco di cui il cluster utente è membro. Questo è il progetto che hai specificato al momento della creazione del cluster. Se hai creato il cluster utilizzando gkectl, questo è l'ID progetto nel campo gkeConnect.projectID del file di configurazione del cluster.
Se la tua organizzazione ha configurato una lista consentita che consente al traffico delle API di Google e di altri indirizzi di passare attraverso il server proxy, aggiungi kubernetesmetadata.googleapis.com alla lista consentita.
Concedi il ruolo kubernetesmetadata.publisher all'account di servizio logging-monitoring:
```
gcloud projects add-iam-policy-binding PROJECT_ID \
    --member "serviceAccount:SERVICE_ACCOUNT_EMAIL" \
    --role "roles/kubernetesmetadata.publisher"
```
Sostituisci SERVICE_ACCOUNT_EMAIL con l'indirizzo email del tuoaccount di serviziot di logging e monitoraggio.

Funzionalità legacy bloccate negli upgrade

Le seguenti funzionalità legacy sono bloccate durante l'upgrade del cluster alla versione 1.32:

Dataplane V1 (Calico)
Configurazione del bilanciatore del carico F5 Big IP integrato
Cluster di amministrazione non HA
Cluster utente Kubeception
Bilanciatore del carico Seesaw

Prima di eseguire l'upgrade alla versione 1.32, devi eseguire la migrazione dei cluster alle funzionalità consigliate.

Requisiti IAM per l'upgrade dei cluster utente

Ignora questa sezione se prevedi di utilizzare gkectl per l'upgrade del cluster utente.

Se vuoi utilizzare la console Google Cloud , Google Cloud CLI o Terraform per eseguire l'upgrade di un cluster utente e non sei il proprietario del progetto, devi disporre del ruolo Identity and Access Management roles/gkeonprem.admin nel progetto Google Cloud in cui è stato creato il cluster. Per informazioni dettagliate sulle autorizzazioni incluse in questo ruolo, consulta Ruoli GKE On-Prem nella documentazione IAM.

Per utilizzare la console per eseguire l'upgrade del cluster, devi disporre almeno di quanto segue:

roles/container.viewer. Questo ruolo consente agli utenti di visualizzare la pagina Cluster GKE e altre risorse container nella console. Per informazioni dettagliate sulle autorizzazioni incluse in questo ruolo o per concedere un ruolo con autorizzazioni di lettura/scrittura, consulta Ruoli Kubernetes Engine nella documentazione IAM.
roles/gkehub.viewer. Questo ruolo consente agli utenti di visualizzare i cluster nella console. Per informazioni dettagliate sulle autorizzazioni incluse in questo ruolo o per concedere un ruolo con autorizzazioni di lettura/scrittura, consulta Ruoli GKE Hub nella documentazione IAM.

Limitazioni relative ai cluster avanzati

Tieni presenti le seguenti limitazioni se hai attivato i cluster avanzati:

Per eseguire l'upgrade dei cluster devi utilizzare gkectl. I client API GKE On-Prem (la console, gcloud CLI e Terraform) non sono supportati.
Sono supportati solo gli upgrade sincroni.

Apportare modifiche alla configurazione prima o dopo un upgrade

Se devi apportare modifiche alla configurazione dei cluster, esegui l'aggiornamento del cluster prima o dopo l'upgrade. L'unica modifica alla configurazione del cluster per un upgrade deve essere la versione. A seconda della versione e del tipo di cluster, altre modifiche alla configurazione vengono ignorate automaticamente o causano l'esito negativo dell'upgrade. Per ulteriori informazioni, vedi Rimuovere le modifiche non supportate per sbloccare l'upgrade.

Controllare le versioni disponibili per gli upgrade del cluster

Esegui questo comando per vedere quali versioni sono disponibili per l'upgrade:

gkectl version --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Sostituisci ADMIN_CLUSTER_KUBECONFIG con il percorso del file kubeconfig del cluster di amministrazione.

L'output mostra la versione attuale e le versioni disponibili per l'upgrade.

Se prevedi di utilizzare la console, gcloud CLI o Terraform per l'upgrade, sono necessari circa 7-14 giorni dopo il rilascio prima che la versione sia disponibile nell'API GKE On-Prem in tutte le regioni Google Cloud . La console elenca solo le versioni disponibili per l'upgrade del cluster utente. I passaggi per l'upgrade di un cluster utente utilizzando gcloud CLI o Terraform includono un passaggio per eseguire gcloud container vmware clusters query-version-config per ottenere le versioni disponibili per l'upgrade.

Esegui l'upgrade della workstation di amministrazione

Il modo in cui esegui l'upgrade della workstation di amministrazione dipende da come l'hai creata: gkeadm o gestita dall'utente.

gkeadm

Individuare i file richiesti

Prima di creare la workstation di amministrazione, hai compilato un file di configurazione della workstation di amministrazione generato da gkeadm create config. Il nome predefinito di questo file è admin-ws-config.yaml.

Inoltre, la workstation ha un file di informazioni. Il nome predefinito di questo file corrisponde al nome della tua workstation di amministrazione.

Individua il file di configurazione della workstation amministrativa e il file di informazioni. Devi chiedere loro di eseguire i passaggi di upgrade. Se questi file si trovano nella directory corrente e hanno i nomi predefiniti, non devi specificarli quando esegui i comandi di upgrade. Se questi file si trovano in un'altra directory o se hai modificato i nomi dei file, specificali utilizzando i flag --config e --info-file.

Se il file di informazioni sull'output non è presente, puoi ricrearlo. Consulta Ricreare un file di informazioni se mancante.

Esegui l'upgrade

Per eseguire l'upgrade della workstation di amministrazione:

Controlla il campo adminWorkstation.diskGB nel file di configurazione della workstation amministrativa e assicurati che la dimensione specificata sia almeno 100, ad esempio:
```
adminWorkstation:
  diskGB: 100
```
Quando esegui l'upgrade alla versione 1.28 e successive, sono necessari 100 GB e l'upgrade del cluster non riesce se la workstation amministrativa non dispone di spazio su disco sufficiente.
Dal jump server, scarica gkeadm:
```
gkeadm upgrade gkeadm --target-version TARGET_VERSION
```
Sostituisci TARGET_VERSION con la versione a cui stai eseguendo l'upgrade. Devi specificare un numero di versione completo nel formato X.Y.Z-gke.N.. Per un elenco delle versioni di Google Distributed Cloud, consulta Controllo delle versioni.
Esegui l'upgrade della workstation di amministrazione:
```
gkeadm upgrade admin-workstation --config AW_CONFIG_FILE \
    --info-file INFO_FILE
```
Sostituisci quanto segue:
- AW_CONFIG_FILE: il percorso del file di configurazione della workstation amministrativa. Puoi omettere questo flag se il file si trova nella directory attuale ed è denominato admin-ws-config.yaml.
- INFO_FILE: il percorso del file delle informazioni. Puoi omettere questo flag se il file si trova nella directory attuale. Il nome predefinito di questo file corrisponde al nome della tua workstation di amministrazione.

Gestita dall'utente

Nella workstation di amministrazione, vai a una directory in cui vuoi installare una nuova versione digkectl.

Scarica gkectl:
```
gcloud storage cp gs://gke-on-prem-release/gkectl/TARGET_VERSION/gkectl ./
chmod +x gkectl
```
Sostituisci TARGET_VERSION con la versione a cui stai eseguendo l'upgrade. Devi specificare un numero di versione completo nel formato X.Y.Z-gke.N.. Per un elenco delle versioni di Google Distributed Cloud, consulta Controllo delle versioni.
Scarica il bundle Google Distributed Cloud. Assicurati che la versione corrisponda a quella utilizzata per scaricare gkectl:
```
gcloud storage cp gs://gke-on-prem-release/gke-onprem-bundle/TARGET_VERSION/gke-onprem-vsphere-TARGET_VERSION.tgz ./
```

Esegui l'upgrade del cluster di amministrazione

I passaggi per l'upgrade del cluster di amministrazione variano leggermente a seconda della versione secondaria a cui esegui l'upgrade (la versione di destinazione):

1.31 e successive

Se la versione di destinazione è 1.31 o successive, prima di eseguire l'upgrade dei cluster utente alla versione secondaria successiva, devi eseguire l'upgrade del cluster di amministrazione. Nelle versioni 1.31 e successive, la versione del cluster di amministrazione, inclusa la versione della patch, deve essere maggiore o uguale alla versione del cluster utente. Ad esempio, se un cluster di amministrazione ha la versione 1.31.1, la versione più recente a cui è possibile eseguire l'upgrade del cluster utente è la 1.31.1.

Esegui questo comando sulla workstation di amministrazione per importare le immagini del sistema operativo in vSphere:

gkectl prepare \
    --bundle-path /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION.tgz \
    --kubeconfig ADMIN_CLUSTER_KUBECONFIG

Sostituisci ADMIN_CLUSTER_KUBECONFIG con il percorso del file kubeconfig del cluster di amministrazione.

1,30 e inferiore

Se la versione di destinazione è 1.30 o precedente, devi eseguire l'upgrade di tutti i cluster utente prima di eseguire l'upgrade del cluster di amministrazione. La versione secondaria del cluster di amministrazione deve essere inferiore o uguale a quella del cluster utente. La versione della patch non è importante. Ad esempio, se un cluster utente ha la versione 1.30.1, il cluster di amministrazione può essere aggiornato a una versione patch superiore, ad esempio 1.30.3.

Prima di iniziare:

Se esegui l'upgrade alla versione 1.13 o successive, devi prima registrare il cluster di amministrazione compilando la sezione gkeConnect nel file di configurazione del cluster di amministrazione. Esegui il comando gkectl update cluster con le modifiche al file di configurazione.
Assicurati che gkectl e i cluster siano della versione appropriata per un upgrade e di aver scaricato il bundle appropriato. La differenza di versione tra i cluster di amministrazione e utente dipende dalla versione di Google Distributed Cloud. Per assicurarti di poter eseguire l'upgrade del cluster di amministrazione, consulta la sezione Differenza di versione tra cluster di amministrazione e cluster utente.
Assicurati che il campo bundlepath nel file di configurazione del cluster di amministrazione corrisponda al percorso del bundle a cui vuoi eseguire l'upgrade.

Se apporti altre modifiche ai campi nel file di configurazione del cluster di amministrazione, queste modifiche vengono ignorate durante l'upgrade. Per applicare queste modifiche, devi prima eseguire l'upgrade del cluster e poi eseguire un comando update cluster con le modifiche al file di configurazione per apportare altre modifiche al cluster.

Esegui l'upgrade

Esegui i passaggi di questa sezione sulla workstation di amministrazione. Esistono due varianti del comando gkectl upgrade admin:

Asincrono:
Con la variante asincrona, il comando avvia l'upgrade e poi lo completa. Non è necessario monitorare l'output del comando per l'intera durata dell'upgrade. In alternativa, puoi controllare periodicamente l'avanzamento dell'upgrade eseguendo gkectl list admin e gkectl describe admin. Per utilizzare la variante asincrona, includi il flag --async nel comando.

Requisiti per l'upgrade asincrono:
- Supportato solo per i cluster di amministrazione HA con versione 1.29 o successive.
- In tutti i cluster utente deve essere abilitato Controlplane V2.
- Versione 1.31: non supportata nei cluster avanzati.
- Versione 1.32 e successive: disponibile sui cluster avanzati.
Sincrono:
Con la variante sincrona, il comando gkectl upgrade admin restituisce messaggi di stato alla workstation di amministrazione man mano che l'upgrade procede.

Upgrade asincrono

Sulla workstation di amministrazione, avvia un upgrade asincrono:
```
gkectl upgrade admin \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
  --config ADMIN_CLUSTER_CONFIG_FILE \
  --async
```
Sostituisci quanto segue:
- ADMIN_CLUSTER_KUBECONFIG: il percorso del file kubeconfig del cluster di amministrazione.
- ADMIN_CLUSTER_CONFIG_FILE: il percorso del file di configurazione del cluster di amministrazione.
Il comando precedente viene completato e puoi continuare a utilizzare la workstation di amministrazione mentre l'upgrade è in corso.
Per visualizzare lo stato dell'upgrade:
```
gkectl list admin --kubeconfig ADMIN_CLUSTER_KUBECONFIG
```
L'output mostra un valore per il cluster STATE. Se il cluster è ancora in fase di upgrade, il valore di STATE è UPGRADING. Ad esempio:
```
NAME              STATE         AGE    VERSION
gke-admin-test    UPGRADING     9h     1.33.100-gke.89
```
I valori possibili per STATE sono RUNNING, UPGRADING, RECONCILING, ERROR e UNKNOWN.

Per ulteriori dettagli sull'avanzamento dell'upgrade e sugli eventi del cluster:

gkectl describe admin --kubeconfig ADMIN_CLUSTER_KUBECONFIG

L'output mostra la risorsa personalizzata OnPremAdminCluster per il cluster di amministrazione specificato, che include lo stato, le condizioni e gli eventi del cluster.

Registriamo gli eventi per l'inizio e la fine di ogni fase di upgrade critica.

Output di esempio:

Events:
Type    Reason                             Age   From                             Message
----       ------                                  ----     ----                                -------
Normal  ControlPlaneUpgradeStarted         40m   onprem-admin-cluster-controller  Creating or updating admin cluster API Controller
Normal  ControlPlaneMachineUpgradeStarted  40m   onprem-admin-cluster-controller  Creating or updating control plane machine
Normal  StatusChanged                      40m   onprem-admin-cluster-controller  OnPremAdminCluster status changed:
- New ClusterState condition: UPGRADING
- New Ready condition: False, CreateOrUpdateControlPlaneMachine, Creating or updating control plane machine
Normal   StatusChanged      2m                onprem-admin-cluster-controller  OnPremAdminCluster status changed:
- New ClusterState condition: RUNNING
- New Ready condition: True, ClusterRunning, Cluster is running

Al termine dell'upgrade, gkectl list admin mostra un STATUS di RUNNING:

NAME              STATE         AGE    VERSION
gke-admin-test    RUNNING       9h     1.33.100-gke.89

Inoltre, al termine dell'upgrade, gkectl describe admin mostra un campo Last GKE On Prem Version in Status. Ad esempio:

Status:
  Cluster State:  RUNNING
  Last GKE On Prem Version:  1.33.0-gke.1

Risolvere i problemi relativi all'upgrade asincrono

Per un upgrade asincrono, la durata del timeout si basa sul numero di nodi nel cluster. Se l'upgrade richiede più tempo della durata del timeout, lo stato del cluster cambia da UPGRADING a ERROR e viene visualizzato un evento che indica che l'operazione di upgrade è scaduta. Tieni presente che lo stato ERROR indica che l'upgrade sta richiedendo più tempo del previsto, ma non è stato interrotto. Il controller continua la riconciliazione e riprova l'operazione. Quando un upgrade viene bloccato o non riesce, puoi eseguire gkectl diagnose per verificare la presenza di problemi comuni del cluster. In base al risultato, puoi decidere se eseguire una correzione manuale o contattare l'Google Cloud assistenza per ulteriore supporto.

Upgrade sincrono

Esegui questo comando:
```
gkectl upgrade admin \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
  --config ADMIN_CLUSTER_CONFIG_FILE
```
Sostituisci quanto segue:
- ADMIN_CLUSTER_KUBECONFIG: il percorso del file kubeconfig del cluster di amministrazione.
- ADMIN_CLUSTER_CONFIG_FILE: il percorso del file di configurazione del cluster di amministrazione.
Il comando gkectl upgrade esegue i controlli preflight. Se i controlli preflight non vanno a buon fine, il comando viene bloccato. Devi correggere gli errori o utilizzare il flag --skip-preflight-check-blocking con il comando per sbloccarlo.
Se esegui l'upgrade alla versione 1.14.0 o successive, viene generato un nuovo file kubeconfig per il cluster di amministrazione che sovrascrive qualsiasi file esistente. Per visualizzare i dettagli del cluster nel file, esegui questo comando:
```
kubectl config view --kubeconfig ADMIN_CLUSTER_KUBECONFIG
```

Esegui l'upgrade di un cluster utente

Puoi utilizzare gkectl, la console, gcloud CLI o Terraform per eseguire l'upgrade di un cluster utente. Per informazioni su quale strumento utilizzare, consulta Scegliere uno strumento per eseguire l'upgrade dei cluster utente.

gkectl

Prepararsi all'upgrade di un cluster utente

Esegui i seguenti passaggi sulla workstation di amministrazione:

Esegui questo passaggio solo se TARGET_VERSION è 1.30 o inferiore oppure se esegui l'upgrade del cluster utente a una versione diversa rispetto al cluster di amministrazione. Esegui gkectl prepare per importare le immagini del sistema operativo in vSphere:
```
gkectl prepare \
  --bundle-path /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION.tgz \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG
```
Se il cluster ha un pool di nodi Windows, esegui gkectl prepare windows e aggiorna il campo osImage per il pool di nodi. Per istruzioni dettagliate, vedi Eseguire l'upgrade del cluster utente con i pool di nodi Windows.
Nel file di configurazione del cluster utente, imposta gkeOnPremVersion sulla versione di destinazione dell'upgrade.

Esecuzione di controlli preliminari

Quando esegui l'upgrade alla versione 1.29 e successive, puoi eseguire i controlli preflight prima di eseguire l'upgrade di un cluster utente:

gkectl upgrade cluster \
    --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
    --config USER_CLUSTER_CONFIG \
    --dry-run

Sostituisci USER_CLUSTER_CONFIG con il percorso del file di configurazione del cluster utente.

Con il flag --dry-run, gkectl upgrade cluster esegue i controlli preflight ma non avvia la procedura di upgrade. Sebbene le versioni precedenti di Google Distributed Cloud eseguano controlli preliminari, non possono essere eseguiti separatamente dall'upgrade. Aggiungendo il flag --dry-run, puoi trovare e risolvere eventuali problemi rilevati dai controlli preflight nel cluster utente prima dell'upgrade.

Esegui `gkectl upgrade cluster`

Esistono due varianti del comando gkectl upgrade cluster:

Asincrono: (consigliato)
Con la variante asincrona, il comando avvia l'upgrade e poi lo completa. Non è necessario monitorare l'output del comando per l'intera durata dell'upgrade. In alternativa, puoi controllare periodicamente l'avanzamento dell'upgrade eseguendo gkectl list clusters e gkectl describe clusters. Per utilizzare la variante asincrona, includi il flag --async nel comando.
- Versione 1.31: non disponibile sui cluster avanzati.
- Versione 1.32 e successive: disponibile sui cluster avanzati.
Sincrono:
Con la variante sincrona, il comando gkectl upgrade cluster restituisce messaggi di stato alla workstation di amministrazione man mano che l'upgrade procede.

Upgrade asincrono

Salta questo passaggio se esegui l'upgrade a una versione successiva alla 1.16.

Se utilizzi credenziali preparate e un registro privato per il cluster utente, assicurati che le credenziali del registro privato siano preparate prima di eseguire l'upgrade del cluster utente. Per informazioni su come preparare le credenziali del registro privato, vedi Configurare le credenziali preparate per i cluster utente.
Sulla workstation di amministrazione, avvia un upgrade asincrono:
```
gkectl upgrade cluster \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
  --config USER_CLUSTER_CONFIG \
  --async
```
Il comando precedente viene completato e puoi continuare a utilizzare la workstation di amministrazione mentre l'upgrade è in corso.
Per visualizzare lo stato dell'upgrade:
```
gkectl list clusters --kubeconfig ADMIN_CLUSTER_KUBECONFIG
```
L'output mostra un valore per il cluster STATE. Se il cluster è ancora in fase di upgrade, il valore di STATE è UPGRADING. Ad esempio:
```
NAMESPACE             NAME    READY   STATE       AGE   VERSION
my-uc-gkeonprem-mgmt  my-uc   False   UPGRADING   9h    1.33.0-gke.1
```
I valori possibili per STATE sono PROVISIONING, UPGRADING, DELETING, UPDATING, RUNNING, RECONCILING, ERROR e UNKNOWN.

Per ulteriori dettagli sull'avanzamento dell'upgrade e sugli eventi del cluster:

gkectl describe clusters --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
  --cluster USER_CLUSTER_NAME -v 5

L'output mostra la risorsa personalizzata OnPremUserCluster per il cluster utente specificato, che include lo stato, le condizioni e gli eventi del cluster.

Registriamo gli eventi per l'inizio e la fine di ogni fase di upgrade critica, tra cui:

ControlPlaneUpgrade
MasterNodeUpgrade
AddonsUpgrade
NodePoolsUpgrade

Output di esempio:

Events:
Type    Reason                      Age    From                            Message
----     ------                     ----   ----                            -------
Normal  NodePoolsUpgradeStarted     22m    onprem-user-cluster-controller  Creating or updating node pools: pool-2: Creating or updating node pool
Normal  AddonsUpgradeStarted        22m    onprem-user-cluster-controller  Creating or updating addon workloads
Normal  ControlPlaneUpgradeStarted  25m    onprem-user-cluster-controller  Creating or updating cluster control plane workloads: deploying user-kube-apiserver-base, ...: 14/15 pods are ready
Normal  ControlPlaneUpgradeFinished 23m    onprem-user-cluster-controller  Control plane is running

Al termine dell'upgrade, gkectl list clusters mostra un STATUS di RUNNING:

NAMESPACE             NAME    READY   STATE     AGE     VERSION
my-uc-gkeonprem-mgmt  my-uc   True    RUNNING   9h      1.33.0-gke.1

Inoltre, al termine dell'upgrade, gkectl describe clusters mostra un campo Last GKE On Prem Version in Status. Ad esempio:

Status:
Cluster State:  RUNNING
Last GKE On Prem Version:  1.33.0-gke.1

Risolvere i problemi relativi all'upgrade asincrono

Per un upgrade asincrono, la durata del timeout si basa sul numero di nodi nel cluster. Se l'upgrade richiede più tempo della durata del timeout, lo stato del cluster viene modificato da UPGRADING a ERROR, con un evento che indica che l'operazione di upgrade è scaduta. Tieni presente che lo stato ERROR indica che l'upgrade sta richiedendo più tempo del previsto, ma non è stato terminato. Il controller continua la riconciliazione e riprova l'operazione.

In genere, un timeout è il risultato di un deadlock causato da un PodDisruptionBudget (PDB). In questo caso, i pod non possono essere rimossi dai nodi precedenti e questi ultimi non possono essere svuotati. Se l'espulsione del pod richiede più di 10 minuti, scriviamo un evento nell'oggetto OnPremUserCluster. Puoi acquisire l'evento eseguendo gkectl describe clusters. A questo punto, puoi modificare il PDB per consentire lo svuotamento del nodo. Dopodiché, l'upgrade può procedere e alla fine completarsi.

Evento di esempio:

Warning  PodEvictionTooLong  96s (x2 over 4m7s)  onprem-user-cluster-controller
Waiting too long(>10m0.00000003s) for (kube-system/coredns-856d6dbfdf-dl6nz) eviction.

Inoltre, quando un upgrade viene bloccato o non va a buon fine, puoi eseguire gkectl diagnose per verificare la presenza di problemi comuni del cluster. In base al risultato, puoi decidere se eseguire una correzione manuale o contattare il team di assistenza Anthos per ulteriore assistenza.

Upgrade sincrono

Il comando gkectl upgrade esegue i controlli preflight. Se i controlli preflight non vanno a buon fine, il comando viene bloccato. Devi correggere gli errori o utilizzare il flag --skip-preflight-check-blocking. Dovresti saltare i controlli preliminari solo se hai la certezza che non si verificheranno errori critici.

Procedi con questi passaggi sulla workstation di amministrazione:

Salta questo passaggio se esegui l'upgrade a una versione successiva alla 1.16.

Se utilizzi credenziali preparate e un registro privato per il cluster utente, assicurati che le credenziali del registro privato siano preparate prima di eseguire l'upgrade del cluster utente. Per informazioni su come preparare le credenziali del registro privato, vedi Configurare le credenziali preparate per i cluster utente.

Esegui l'upgrade del cluster:

gkectl upgrade cluster \
  --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
  --config USER_CLUSTER_CONFIG

Se esegui l'upgrade alla versione 1.14.0 o successive, viene generato un nuovo file kubeconfig per il cluster utente che sovrascrive qualsiasi file esistente. Per visualizzare i dettagli del cluster nel file, esegui questo comando:
```
kubectl config view --kubeconfig USER_CLUSTER_KUBECONFIG
```

Riprendere un upgrade

Se l'upgrade di un cluster utente viene interrotto, puoi riprenderlo eseguendo lo stesso comando di upgrade con il flag --skip-validation-all:

gkectl upgrade cluster \
    --kubeconfig ADMIN_CLUSTER_KUBECONFIG \
    --config USER_CLUSTER_CONFIG_FILE \
    --skip-validation-all

Console

L'upgrade di un cluster utente richiede alcune modifiche al cluster di amministrazione. La console esegue automaticamente le seguenti operazioni:

Registra il cluster di amministrazione nell'API GKE On-Prem se non è già registrato.
Scarica ed esegue il deployment di un pacchetto di componenti nel cluster di amministrazione. La versione dei componenti corrisponde a quella specificata per l'upgrade. Questi componenti consentono al cluster di amministrazione di gestire i cluster utente in quella versione.

Per eseguire l'upgrade di un cluster utente:

Nella console, vai alla pagina Panoramica dei cluster Google Kubernetes Engine.

Vai ai cluster GKE
Seleziona il progetto Google Cloud e poi il cluster che vuoi aggiornare.
Nel riquadro Dettagli, fai clic su Altri dettagli.
Nella sezione Impostazioni di base del cluster, fai clic su Upgrade.
Nell'elenco Scegli la versione di destinazione, seleziona la versione a cui vuoi eseguire l'upgrade. L'elenco curato contiene solo le ultime release di patch.
Fai clic su Esegui upgrade.

Prima dell'upgrade del cluster, vengono eseguiti controlli preflight per convalidare lo stato del cluster e l'integrità del nodo. Se i controlli preflight vengono superati, viene eseguito l'upgrade del cluster utente. Il completamento dell'upgrade richiede circa 30 minuti.

Per visualizzare lo stato dell'upgrade, fai clic su Mostra dettagli nella scheda Dettagli cluster.

Interfaccia a riga di comando gcloud

L'upgrade di un cluster utente richiede alcune modifiche al cluster di amministrazione. Il comando gcloud container vmware clusters upgrade esegue automaticamente le seguenti operazioni:

Registra il cluster di amministrazione nell'API GKE On-Prem se non è già registrato.
Scarica ed esegue il deployment di un pacchetto di componenti nel cluster di amministrazione. La versione dei componenti corrisponde a quella specificata per l'upgrade. Questi componenti consentono al cluster di amministrazione di gestire i cluster utente in quella versione.

Per eseguire l'upgrade di un cluster utente:

Aggiorna i componenti di Google Cloud CLI:
```
gcloud components update
```

Per ottenere un elenco delle versioni disponibili per l'upgrade:

gcloud container vmware clusters query-version-config \
  --cluster=USER_CLUSTER_NAME \
  --project=PROJECT_ID \
  --location=REGION

L'output di questo comando è simile al seguente:

versions:
- version: 1.16.3-gke.45
- version: 1.16.2-gke.28
- version: 1.16.1-gke.45
- version: 1.16.0-gke.669
- version: 1.15.6-gke.25
- version: 1.15.5-gke.41

An Anthos version must be made available on the admin cluster ahead of the user
cluster creation or upgrade. Versions annotated with isInstalled=true are
installed on the admin cluster for the purpose of user cluster creation or
upgrade whereas other version are released and will be available for upgrade
once dependencies are resolved.

To install the version in the admin cluster, run:
$ gcloud container vmware admin-clusters update my-admin-cluster --required-platform-version=VERSION

Puoi ignorare il messaggio dopo l'elenco delle versioni. Non importa se la versione a cui esegui l'upgrade è installata sul cluster amministrativo. Il comando upgrade scarica e implementa un bundle dei componenti corrispondenti alla versione specificata nel comando upgrade.

Esegui l'upgrade del cluster.
```
gcloud container vmware clusters upgrade USER_CLUSTER_NAME \
  --project=PROJECT_ID \
  --location=REGION \
  --version=VERSION
```
Sostituisci VERSION con la versione di Google Distributed Cloud a cui vuoi eseguire l'upgrade. Specifica una versione dall'output del comando precedente. Ti consigliamo di eseguire l'upgrade alla versione patch più recente.

L'output del comando è simile al seguente:
```
Waiting for operation [projects/example-project-12345/locations/us-west1/operations/operation-1679543737105-5f7893fd5bae9-942b3f97-75e59179] to complete.
```
Nell'output di esempio, la stringa operation-1679543737105-5f7893fd5bae9-942b3f97-75e59179 è l'OPERATION_ID dell'operazione a lunga esecuzione. Puoi scoprire lo stato dell'operazione eseguendo questo comando in un'altra finestra del terminale:
```
gcloud container vmware operations describe OPERATION_ID \
  --project=PROJECT_ID \
  --location=REGION
```

Terraform

Aggiorna i componenti di Google Cloud CLI:
```
gcloud components update
```
Se non l'hai ancora fatto, registra il cluster di amministrazione nell'API GKE On-Prem. Una volta registrato il cluster nell'API GKE On-Prem, non è necessario ripetere questo passaggio.

Per ottenere un elenco delle versioni disponibili per l'upgrade:

gcloud container vmware clusters query-version-config \
  --cluster=USER_CLUSTER_NAME \
  --project=PROJECT_ID \
  --location=REGION

Sostituisci quanto segue:

USER_CLUSTER_NAME: il nome del cluster utente.
PROJECT_ID: L'ID del progetto fleet di cui fa parte il cluster utente. Questo è il progetto che hai specificato al momento della creazione del cluster. Se hai creato il cluster utilizzando gkectl, questo è l'ID progetto nel campo gkeConnect.projectID del file di configurazione del cluster.
REGION: la Google Cloud regione in cui l'API GKE On-Prem viene eseguita e archivia i relativi metadati. Nel file main.tf che hai utilizzato per creare il cluster utente, la regione si trova nel campo location della risorsa cluster.

L'output di questo comando è simile al seguente:

versions:
- version: 1.16.3-gke.45
- version: 1.16.2-gke.28
- version: 1.16.1-gke.45
- version: 1.16.0-gke.669
- version: 1.15.6-gke.25
- version: 1.15.5-gke.41

An Anthos version must be made available on the admin cluster ahead of the user
cluster creation or upgrade. Versions annotated with isInstalled=true are
installed on the admin cluster for the purpose of user cluster creation or
upgrade whereas other version are released and will be available for upgrade
once dependencies are resolved.

To install the version in the admin cluster, run:
$ gcloud container vmware admin-clusters update my-admin-cluster --required-platform-version=VERSION

Scarica la nuova versione dei componenti ed eseguine il deployment nel cluster di amministrazione:
```
gcloud container vmware admin-clusters update ADMIN_CLUSTER_NAME \
  --project=PROJECT_ID \
  --location=REGION \
  --required-platform-version=VERSION
```
Questo comando scarica la versione dei componenti specificata in --required-platform-version nel cluster di amministrazione, quindi esegue il deployment dei componenti. Questi componenti consentono al cluster di amministrazione di gestire i cluster utente in quella versione.
Nel file main.tf che hai utilizzato per creare il cluster utente, modifica on_prem_version nella risorsa cluster con la nuova versione.
Inizializza e crea il piano Terraform:
```
terraform init
```
Terraform installa tutte le librerie necessarie, ad esempio il provider Google Cloud.
Esamina la configurazione e apporta modifiche, se necessario:
```
terraform plan
```
Applica il piano Terraform per creare il cluster utente:
```
terraform apply
```

Rimuovere l'intero bundle

Se hai scaricato un bundle completo e hai eseguito correttamente gkectl prepare e hai eseguito l'upgrade del cluster di amministrazione e di tutti i cluster utente, devi eliminare il bundle completo per risparmiare spazio su disco nella workstation di amministrazione. Esegui questo comando per eliminare l'intero bundle:

rm /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION-full.tgz

Ripresa di un upgrade del cluster di amministrazione

Se l'upgrade di un cluster di amministrazione viene interrotto o non riesce, può essere ripreso se il checkpoint del cluster di amministrazione contiene lo stato necessario per ripristinare lo stato precedente all'interruzione.

Avviso: non riparare l'amministratore principale con gkectl repair admin-master dopo un tentativo di upgrade non riuscito. In questo modo, il cluster di amministrazione entrerà in uno stato anomalo.

Segui questi passaggi:

Verifica che il piano di controllo amministrativo sia integro prima di iniziare il primo tentativo di upgrade. Vedi Diagnostica dei problemi relativi ai cluster. Come descritto in questo argomento, esegui il comando gkectl diagnose cluster per il cluster di amministrazione.
Se il control plane amministrativo non è integro prima del tentativo di upgrade iniziale, riparalo con il comando gkectl repair admin-master.
Quando esegui di nuovo il comando di upgrade dopo che un upgrade è stato interrotto o non è andato a buon fine, utilizza lo stesso bundle e la stessa versione di destinazione del tentativo di upgrade precedente.

Quando esegui di nuovo il comando di upgrade, l'upgrade ripreso ricrea lo stato del cluster di amministrazione dal checkpoint e riesegue l'intero upgrade. A partire dalla versione 1.12.0, se il control plane amministrativo non è integro, la procedura di upgrade eseguirà direttamente l'upgrade alla versione di destinazione senza tentare di ripristinare il cluster di amministrazione alla versione di origine prima di procedere con l'upgrade.

L'upgrade riprenderà dal punto in cui non è riuscito o è stato interrotto se il checkpoint del cluster di amministrazione è disponibile. Se il checkpoint non è disponibile, l'upgrade si baserà sul control plane dell'amministratore, che deve essere integro per poter procedere con l'upgrade. Dopo un upgrade riuscito, il checkpoint viene rigenerato.

Se gkectl esce in modo imprevisto durante l'upgrade di un cluster di amministrazione, il cluster kind non viene pulito. Prima di eseguire di nuovo il comando di upgrade per riprendere l'upgrade, elimina il cluster kind:

docker stop gkectl-control-plane && docker rm gkectl-control-plane

Dopo aver eliminato il cluster kind, esegui di nuovo il comando di upgrade.

Eseguire il rollback di una workstation di amministrazione dopo un upgrade

Puoi eseguire il rollback della workstation di amministrazione alla versione utilizzata prima dell'upgrade.

Durante l'upgrade, gkeadm registra la versione precedente all'upgrade nel file di informazioni di output. Durante il rollback, gkeadm utilizza la versione elencata per scaricare il file precedente.

Per eseguire il rollback della workstation di amministrazione alla versione precedente:

gkeadm rollback admin-workstation --config=AW_CONFIG_FILE

Puoi omettere --config=AW_CONFIG_FILE se il file di configurazione della workstation amministrativa è quello predefinito admin-ws-config.yaml. In caso contrario, sostituisci AW_CONFIG_FILE con il percorso del file di configurazione della workstation amministrativa.

Il comando di rollback esegue questi passaggi:

Scarica la versione di rollback di gkeadm.
Esegue il backup della home directory della workstation di amministrazione corrente.
Crea una nuova workstation di amministrazione utilizzando la versione di rollback di gkeadm.
Elimina la workstation di amministrazione originale.

Installare il bundle con una versione diversa per l'upgrade

Se esegui l'upgrade della workstation, viene installato un bundle con una versione corrispondente per l'upgrade dei cluster. Se vuoi un'altra versione, segui questi passaggi per installare un bundle per TARGET_VERSION, ovvero la versione a cui vuoi eseguire l'upgrade.

Per controllare le versioni attuali di gkectl e del cluster, esegui questo comando. Utilizza il flag --details/-d per informazioni più dettagliate.
```
gkectl version --kubeconfig ADMIN_CLUSTER_KUBECONFIG --details
```
L'output fornisce informazioni sulle versioni del cluster.
In base all'output ottenuto, cerca i seguenti problemi e risolvili in base alle esigenze.
- Se la versione attuale del cluster di amministrazione è inferiore di più di una versione secondaria rispetto a TARGET_VERSION, esegui l'upgrade di tutti i cluster in modo che siano inferiori di una versione secondaria rispetto a TARGET_VERSION.
- Se la versione di gkectl è precedente alla 1.11 e vuoi eseguire l'upgrade alla versione 1.12.x, dovrai eseguire più upgrade. Esegui l'upgrade di una versione secondaria alla volta, fino a raggiungere la versione 1.11.x, quindi procedi con le istruzioni riportate in questo argomento.
- Se la versione di gkectl è precedente a TARGET_VERSION, esegui l'upgrade della workstation di amministrazione alla versione TARGET_VERSION.
Dopo aver stabilito che le versioni di gkectl e del cluster sono adatte a un upgrade, scarica il bundle.

Controlla se il file tar.gz del bundle esiste già sulla workstation di amministrazione.
```
stat /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION.tgz
```
Se il bundle non è sulla workstation amministrativa, scaricalo.
```
gcloud storage cp gs://gke-on-prem-release/gke-onprem-bundle/TARGET_VERSION/gke-onprem-vsphere-TARGET_VERSION.tgz /var/lib/gke/bundles/
```
Installa il bundle.
```
gkectl prepare --bundle-path /var/lib/gke/bundles/gke-onprem-vsphere-TARGET_VERSION.tgz --kubeconfig ADMIN_CLUSTER_KUBECONFIG
```
Sostituisci ADMIN_CLUSTER_KUBECONFIG con il percorso del file kubeconfig. Puoi omettere questo flag se il file si trova nella directory attuale ed è denominato kubeconfig.

Nota: per impostazione predefinita, viene scaricato il bundle normale anziché quello completo. Il bundle completo contiene tutte le immagini container e VM, mentre il bundle normale scarica le immagini container e VM da Google Cloud Platform sulla workstation amministrativa durante l'installazione. Per utilizzare invece l'intero bundle, il percorso del bundle nel comando di installazione è gke-onprem-vsphere-TARGET_VERSION-full.tgz.
Elenca le versioni del cluster disponibili e assicurati che la versione di destinazione sia inclusa nelle versioni del cluster utente disponibili.
```
gkectl version --kubeconfig ADMIN_CLUSTER_KUBECONFIG --details
```

Ora puoi creare un cluster utente nella versione di destinazione o eseguire l'upgrade di un cluster utente alla versione di destinazione.

Risoluzione dei problemi relativi al processo di upgrade

Se riscontri un problema durante la procedura di upgrade consigliata, segui questi suggerimenti per risolverlo. Questi suggerimenti presuppongono che tu abbia iniziato con una configurazione della versione 1.11.x e che tu stia procedendo con la procedura di upgrade consigliata.

Vedi anche: Risoluzione dei problemi relativi alla creazione e all'upgrade dei cluster

Risoluzione dei problemi relativi all'upgrade di un cluster utente

Supponiamo che tu riscontri un problema con la versione di upgrade durante l'upgrade di un cluster utente. Determini con l'assistenza Google che il problema verrà risolto in una release patch futura. Puoi procedere nel seguente modo:

Continua a utilizzare la versione attuale per la produzione.
Testa la release della patch in un cluster non di produzione quando viene rilasciata.
Esegui l'upgrade di tutti i cluster utente di produzione alla versione della patch quando sei sicuro.
Esegui l'upgrade del cluster di amministrazione alla versione di rilascio della patch.

Risoluzione dei problemi relativi all'upgrade di un cluster di amministrazione

Se riscontri un problema durante l'upgrade del cluster di amministrazione, devi contattare l'Assistenza Google per risolverlo.

Nel frattempo, con il nuovo flusso di upgrade, puoi comunque usufruire delle nuove funzionalità del cluster utente senza essere bloccato dall'upgrade del cluster di amministrazione, il che ti consente di ridurre la frequenza di upgrade del cluster di amministrazione, se vuoi. La procedura di upgrade può procedere come segue:

Esegui l'upgrade dei cluster utente di produzione alla versione 1.12.x.
Mantieni la versione precedente del cluster di amministrazione e continua a ricevere patch di sicurezza.
Esegui il test dell'upgrade del cluster di amministrazione dalla versione 1.11.x alla 1.12.x in un ambiente di test e segnala eventuali problemi.
Se il problema viene risolto con una release patch 1.12.x, puoi scegliere di eseguire l'upgrade del cluster di amministrazione di produzione a questa release patch, se vuoi.

Problemi noti per le versioni recenti

I seguenti problemi noti potrebbero influire sugli upgrade se esegui l'upgrade dalla versione 1.7 o successive.

Vedi anche: Problemi noti

L'upgrade della workstation di amministrazione potrebbe non riuscire se il disco di dati è quasi pieno

Se esegui l'upgrade della workstation di amministrazione con il comando gkectl upgrade admin-workstation, l'upgrade potrebbe non riuscire se il disco di dati è quasi pieno, perché il sistema tenta di eseguire il backup della workstation di amministrazione attuale in locale durante l'upgrade a una nuova workstation di amministrazione. Se non riesci a liberare spazio sufficiente sul disco dati, utilizza il comando gkectl upgrade admin-workstation con il flag aggiuntivo --backup-to-local=false per impedire la creazione di un backup locale della workstation amministrativa corrente.

Interruzione per i workload con PodDisruptionBudgets

L'upgrade dei cluster può causare interruzioni o tempi di inattività per i workload che utilizzano i PodDisruptionBudgets (PDB).

I nodi non riescono a completare la procedura di upgrade

Se hai configurato PodDisruptionBudget oggetti che non possono consentire ulteriori interruzioni, l'upgrade dei nodi potrebbe non riuscire a eseguire l'upgrade alla versione del control plane dopo ripetuti tentativi. Per evitare questo errore, ti consigliamo di aumentare le dimensioni di Deployment o HorizontalPodAutoscaler per consentire lo svuotamento del nodo rispettando comunque la configurazione PodDisruptionBudget.

Per visualizzare tutti gli oggetti PodDisruptionBudget che non consentono interruzioni:

kubectl get poddisruptionbudget --all-namespaces -o jsonpath='{range .items[?(@.status.disruptionsAllowed==0)]}{.metadata.name}/{.metadata.namespace}{"\n"}{end}'

Appendice

Informazioni sulle regole VMware DRS abilitate nella versione 1.1.0-gke.6

A partire dalla versione 1.1.0-gke.6, Google Distributed Cloud crea automaticamente regole anti-affinità Distributed Resource Scheduler (DRS) di VMware per i nodi del cluster utente, in modo da distribuirli in almeno tre host fisici del data center. A partire dalla versione 1.1.0-gke.6, questa funzionalità viene attivata automaticamente per i cluster nuovi ed esistenti.

Prima dell'upgrade, assicurati che l'ambiente vSphere soddisfi le seguenti condizioni:

VMware DRS è abilitato. VMware DRS richiede la licenza vSphere Enterprise Plus. Per scoprire come attivare DRS, consulta Attivazione di VMware DRS in un cluster
Il nome utente vSphere fornito nel file di configurazione delle credenziali dispone dell'autorizzazione Host.Inventory.EditCluster.
Sono disponibili almeno tre host fisici.

Se il tuo ambiente vSphere non soddisfa le condizioni precedenti, puoi comunque eseguire l'upgrade, ma per l'upgrade di un cluster utente dalla versione 1.3.x alla 1.4.x, devi disattivare i gruppi anti-affinità. Per saperne di più, consulta questo problema noto nelle note di rilascio di Google Distributed Cloud.

Informazioni sul tempo di inattività durante gli upgrade

Risorsa	Descrizione
Cluster di amministrazione	Quando un cluster di amministrazione non è attivo, i control plane dei cluster utente e i workload sui cluster utente continuano a essere eseguiti, a meno che non siano stati interessati da un errore che ha causato il tempo di inattività.
Control plane del cluster utente	In genere, non dovresti aspettarti tempi di inattività significativi per i piani di controllo dei cluster utente. Tuttavia, le connessioni di lunga durata al server API Kubernetes potrebbero interrompersi e dovrebbero essere ristabilite. In questi casi, il chiamante dell'API deve riprovare finché non stabilisce una connessione. Nel peggiore dei casi, durante un upgrade può verificarsi un tempo di inattività fino a un minuto. Nota:se i nodi del cluster utente non riescono a raggiungere il control plane utente durante l'upgrade, i nuovi carichi di lavoro non vengono pianificati per il cluster. I carichi di lavoro esistenti non sono interessati.
Nodi del cluster utente	Se un upgrade richiede una modifica ai nodi del cluster utente, Google Distributed Cloud ricrea i nodi in modo sequenziale e ripianifica i pod in esecuzione su questi nodi. Puoi evitare l'impatto sui tuoi carichi di lavoro configurando PodDisruptionBudgets e regole di anti-affinità appropriate.

Ricrea un file di informazioni se mancante

Se il file di informazioni di output per la workstation di amministrazione non è presente, devi ricrearlo per poter procedere con l'upgrade. Questo file è stato creato quando hai creato inizialmente la workstation e, se hai eseguito un upgrade, è stato aggiornato con nuove informazioni.

Il file di informazioni sull'output ha questo formato:

Admin workstation version: GKEADM_VERSION
Created using gkeadm version: GKEADM_VERSION
VM name: ADMIN_WS_NAME
IP: ADMIN_WS_IP
SSH key used: FULL_PATH_TO_ADMIN_WS_SSH_KEY
To access your admin workstation:
ssh -i FULL-PATH-TO-ADMIN-WS-SSH-KEY ubuntu@ADMIN-WS-IP

Ecco un file di informazioni sull'output di esempio:

Admin workstation version: v1.10.3-gke.49
Created using gkeadm version: v1.10.3-gke.49
VM name: admin-ws-janedoe
IP: 172.16.91.21
SSH key used: /usr/local/google/home/janedoe/.ssh/gke-admin-workstation
Upgraded from (rollback version): v1.10.0-gke.194
To access your admin workstation:
ssh -i /usr/local/google/home/janedoe/.ssh/gke-admin-workstation ubuntu@172.16.91.21

Crea il file in un editor, sostituendo i parametri appropriati. Salva il file con un nome file uguale al nome della VM nella directory da cui viene eseguito gkeadm. Ad esempio, se il nome della VM è admin-ws-janedoe, salva il file come admin-ws-janedoe.

Passaggi successivi

Documentazione di riferimento gcloud CLI
Documentazione di riferimento di Terraform
- google_gkeonprem_vmware_cluster
- google_gkeonprem_vmware_node_pool

Upgrade di un cluster

Differenze tra i cluster avanzati

Upgrade automatico ai cluster avanzati nella versione 1.33

Requisiti

Regole per le versioni

Regole di versione per gkectl

Esamina le regole firewall

Abilita stackdriver

Abilita Dataplane V2

Requisiti di Google API e IAM

Funzionalità legacy bloccate negli upgrade

Requisiti IAM per l'upgrade dei cluster utente

Limitazioni relative ai cluster avanzati

Apportare modifiche alla configurazione prima o dopo un upgrade

Controllare le versioni disponibili per gli upgrade del cluster

Esegui l'upgrade della workstation di amministrazione

gkeadm

Individuare i file richiesti

Esegui l'upgrade

Gestita dall'utente

Esegui l'upgrade del cluster di amministrazione

1.31 e successive

1,30 e inferiore

Prima di iniziare:

Esegui l'upgrade

Upgrade asincrono

Risolvere i problemi relativi all'upgrade asincrono

Upgrade sincrono

Esegui l'upgrade di un cluster utente

gkectl

Prepararsi all'upgrade di un cluster utente

Esecuzione di controlli preliminari

Esegui gkectl upgrade cluster

Upgrade asincrono

Risolvere i problemi relativi all'upgrade asincrono

Upgrade sincrono

Riprendere un upgrade

Console

Interfaccia a riga di comando gcloud

Terraform

Rimuovere l'intero bundle

Ripresa di un upgrade del cluster di amministrazione

Eseguire il rollback di una workstation di amministrazione dopo un upgrade

Installare il bundle con una versione diversa per l'upgrade

Risoluzione dei problemi relativi al processo di upgrade

Risoluzione dei problemi relativi all'upgrade di un cluster utente

Risoluzione dei problemi relativi all'upgrade di un cluster di amministrazione

Problemi noti per le versioni recenti

L'upgrade della workstation di amministrazione potrebbe non riuscire se il disco di dati è quasi pieno

Interruzione per i workload con PodDisruptionBudgets

I nodi non riescono a completare la procedura di upgrade

Appendice

Informazioni sulle regole VMware DRS abilitate nella versione 1.1.0-gke.6

Informazioni sul tempo di inattività durante gli upgrade

Ricrea un file di informazioni se mancante

Passaggi successivi

Regole di versione per `gkectl`

Abilita `stackdriver`

Esegui `gkectl upgrade cluster`