Risolvere i problemi di GKE


Questa pagina elenca le pagine di risoluzione dei problemi relativi ai problemi comuni che potresti incontrare quando utilizzi Google Kubernetes Engine (GKE). Questa pagina è rivolta ad amministratori e architetti, esperti di sicurezza, di networking o di archiviazione che risolvono i problemi di configurazione di GKE. Per scoprire di più sui ruoli GKE, consulta Ruoli e attività utente comuni di GKE Enterprise.

Utilizza questa pagina per diagnosticare e risolvere i problemi riscontrati nelle varie fasi di utilizzo della infrastruttura GKE:

Questa pagina fornisce anche l'accesso ad argomenti di risoluzione dei problemi più generali:

Configurazione del cluster

Argomento Descrizione
Creazione del cluster Risolvere i problemi relativi alla creazione di cluster.
Cluster Autopilot Diagnostica e risolvi i problemi relativi ai cluster GKE Autopilot, tra cui creazione del cluster, eliminazione dello spazio dei nomi, scalabilità e problemi di carico di lavoro.
Strumento a riga di comando Kubectl Risolvi i problemi relativi allo strumento a riga di comando kubectl in GKE, inclusi i problemi di autenticazione e autorizzazione. Questa pagina include anche consigli su come risolvere i problemi relativi al proxy Konnectivity per verificare se causa l'interruzione della risposta dei comandi kubectl logs, attach, exec o port-forward.
Pool di nodi standard Risolvi i problemi relativi ai node pool GKE Standard, inclusi i problemi di creazione dei node pool, il provisioning secondo il criterio del massimo impegno, i metadati dell'istanza corrotti e la migrazione dei carichi di lavoro a nuovi node pool.
Registrazione dei nodi Risolvi i problemi che si verificano durante l'aggiunta di nodi al tuo cluster GKE Standard, ad esempio errori di registrazione dei nodi e prerequisiti mancanti per la registrazione dei nodi.
Runtime del contenitore Risolvi i problemi relativi ai runtime dei container in GKE, inclusi i problemi relativi a containerd e dockershim e i registry privati.

Archiviazione

Argomento Descrizione
Spazio di archiviazione Risolvi i problemi di archiviazione, inclusi i problemi relativi a dischi permanenti a livello di area geografica, prestazioni dei dischi ed espansione dei volumi.

Sicurezza del cluster

Argomento Descrizione
Autenticazione Risolvi i problemi di autenticazione in GKE, inclusi i problemi relativi a RBAC, Workload Identity Federation for GKE e al server di metadati GKE.
Service account Risolvi i problemi relativi agli account di servizio, ad esempio il ripristino dell'account di servizio predefinito e l'attivazione dell'account di servizio predefinito Compute Engine.
Secret a livello di applicazione Risolvi i problemi che possono verificarsi durante la configurazione della crittografia dei secret di livello di applicazione, inclusi aggiornamenti non riusciti ed errori in cui non riesci a utilizzare una chiave Cloud KMS.

L'autorità di certificazione radice del cluster sta per scadere

Argomento Descrizione
Scadenza dell'autorità di certificazione (CA) principale Se l'autorità di certificazione (CA) principale del tuo cluster sta per scadere, scopri come eseguire una rotazione delle credenziali per evitare l'interruzione delle normali operazioni del cluster.

Carichi di lavoro

Argomento Descrizione
Carichi di lavoro di cui è stato eseguito il deployment Risolvi i problemi relativi ai carichi di lavoro in esecuzione in un cluster GKE, tra cui CrashLoopBackOff, ImagePullBackOff e PodUnschedulable. Leggi la sezione PodUnschedulable per ricevere consigli su errori come MatchNodeSelector e Non ha disponibilità minima.
Carichi di lavoro ARM Risolvi i problemi relativi ai workload ARM, inclusi i crash dei pod su nodi ARM.
TPU Risolvi i problemi relativi alle TPU, inclusi quelli relativi a quota, provisioning automatico dei nodi, configurazione e pianificazione dei workload.
GPU Risolvere i problemi relativi alle GPU, inclusi problemi di installazione dei driver GPU, errori dei plug-in dei dispositivi e immagini dei container.

Gestione dei cluster

Argomento Descrizione
Upgrade Risolvi i problemi relativi agli upgrade dei cluster GKE, ad esempio un kube-apiserver non integro dopo un upgrade del piano di controllo o i workload espulsi dopo un upgrade.
Webhook Scopri come risolvere i problemi e garantire la stabilità del piano di controllo del cluster quando utilizzi i webhook di ammissione.
Spazio dei nomi bloccato nello stato Terminating Risolvi i problemi relativi ai namespace bloccati nello stato Terminating identificando e rimuovendo i componenti non corretti che bloccano l'eliminazione.

Monitoraggio

Argomento Descrizione
Metriche di sistema Risolvi i problemi relativi alla mancata visualizzazione delle metriche di sistema in Cloud Monitoring.
Dashboard di monitoraggio Risolvi i problemi relativi alle dashboard di monitoraggio, inclusi i problemi di attivazione del monitoraggio, le risorse Kubernetes mancanti e le autorizzazioni.
Logging Risolvi i problemi di registrazione, inclusi i problemi di attivazione della registrazione, i log mancanti e le quote.

Errori 4xx

Argomento Descrizione
Errori 4xx Risolvi alcuni degli errori 400, 401, 403 e 404 che potresti riscontrare durante l'utilizzo di GKE. Questa pagina include anche informazioni su come risolvere i problemi relativi alle autorizzazioni di modifica mancanti nell'account.

Problemi noti

Argomento Descrizione
Problemi noti Identifica e risolvi i problemi noti che potrebbero influire sul tuo utilizzo di GKE.