Pagine per la risoluzione dei problemi


Questa pagina fornisce un elenco delle pagine per la risoluzione dei problemi in Google Kubernetes Engine (GKE), organizzate in base alle attività che in genere completi durante la creazione dell'ambiente GKE. Ad esempio, potresti iniziare impostando un cluster, quindi passare alla configurazione della rete, al provisioning dello spazio di archiviazione e alla definizione della sicurezza del cluster. Da qui, puoi eseguire il deployment dei carichi di lavoro e iniziare a gestire e monitorare il cluster.

Questa pagina fornisce anche l'accesso ad argomenti di risoluzione dei problemi più generali: problemi noti ed errori 4xx.

Configurazione del cluster

Argomento Descrizione
Creazione del cluster Risolvere i problemi relativi alla creazione di cluster.
Cluster Autopilot Diagnostica e risolvi i problemi relativi ai cluster GKE Autopilot, tra cui creazione del cluster, eliminazione dello spazio dei nomi, scalabilità e problemi di carico di lavoro.
Strumento a riga di comando Kubectl Risolvi i problemi relativi allo strumento a riga di comando kubectl in GKE, inclusi i problemi di autenticazione e autorizzazione. Questa pagina include anche consigli su come risolvere i problemi relativi al proxy Konnectivity per verificare se causa l'interruzione della risposta dei comandi kubectl logs, attach, exec o port-forward.
Pool di nodi standard Risolvi i problemi relativi ai node pool GKE Standard, inclusi i problemi di creazione dei pool di nodi, il provisioning secondo il criterio del massimo impegno, i metadati dell'istanza corrotti e la migrazione dei carichi di lavoro a nuovi node pool.
Registrazione dei nodi Risolvi i problemi che si verificano durante l'aggiunta di nodi al tuo cluster GKE Standard, ad esempio errori di registrazione dei nodi e prerequisiti mancanti per la registrazione dei nodi.
Runtime del contenitore Risolvi i problemi relativi ai runtime dei container in GKE, inclusi i problemi relativi a containerd e dockershim e i registry privati.

Networking

Argomento Descrizione
Connettività del cluster Risolvi i problemi di connettività di rete, inclusi i problemi relativi alla connettività di rete del pod.
Gestione degli indirizzi IP nei cluster VPC Risolvi i problemi di gestione degli indirizzi IP nei cluster VPC-native, inclusi i problemi di esaurimento delle subnet e di SNAT predefinito.
Kube-dns in GKE Scopri come identificare l'origine dei problemi di kube-dns esaminando elementi come il file /etc/resolv.conf e i criteri di rete. Inoltre, scopri come risolvere i problemi comuni come i timeout DNS intermittenti.
Cloud DNS in GKE Scopri come identificare l'origine dei problemi di Cloud DNS in GKE, ad esempio verificando le impostazioni di base e esaminando i log. Scopri anche come risolvere errori come limiti di frequenza API o quota insufficiente.
Isolamento della rete del cluster Risolvi i problemi di isolamento della rete del cluster, inclusi i problemi di creazione del cluster, accesso al piano di controllo, peering di rete VPC e connettività alle risorse pubbliche.
Bilanciamento del carico Risolvi i problemi di bilanciamento del carico, inclusi i problemi relativi a BackendConfig, ai criteri di sicurezza di Ingress, agli errori della serie 500 con i NEG e a Ingress interno.
Ingress multi-cluster Risolvi i problemi relativi alle risorse MultiClusterIngress e MultiClusterService, inclusi i problemi relativi ai VIP, alle risposte 502 e alla migrazione dei cluster di configurazione.
Perdita di pacchetti Cloud NAT da un cluster Risolvi i problemi di perdita di pacchetti da Cloud NAT nei cluster con nodi privati, tra cui come utilizzare Cloud Logging e Cloud Monitoring per identificare la causa della perdita di pacchetti.

Archiviazione

Argomento Descrizione
Spazio di archiviazione Risolvi i problemi di archiviazione, inclusi i problemi relativi a dischi permanenti a livello di area geografica, prestazioni dei dischi ed espansione dei volumi.

Sicurezza del cluster

Argomento Descrizione
Autenticazione Risolvi i problemi di autenticazione in GKE, inclusi i problemi relativi a RBAC, Workload Identity Federation for GKE e al server di metadati GKE.
Service account Risolvi i problemi relativi agli account di servizio, ad esempio il ripristino dell'account di servizio predefinito e l'attivazione dell'account di servizio predefinito Compute Engine.
Secret a livello di applicazione Risolvi i problemi che possono verificarsi durante la configurazione della crittografia dei secret di livello di applicazione, inclusi aggiornamenti non riusciti ed errori in cui non riesci a utilizzare una chiave Cloud KMS.

L'autorità di certificazione radice del cluster sta per scadere

Argomento Descrizione
Autorità di certificazione (CA) radice in scadenza Se l'autorità di certificazione (CA) principale del tuo cluster sta per scadere, scopri come eseguire una rotazione delle credenziali per evitare l'interruzione delle normali operazioni del cluster.

Carichi di lavoro

Argomento Descrizione
Carichi di lavoro di cui è stato eseguito il deployment Risolvi i problemi relativi ai carichi di lavoro in esecuzione in un cluster GKE, tra cui CrashLoopBackOff, ImagePullBackOff e PodUnschedulable. Leggi la sezione PodUnschedulable per ricevere consigli su errori come MatchNodeSelector e Non ha disponibilità minima.
Carichi di lavoro ARM Risolvi i problemi relativi ai workload ARM, inclusi i crash dei pod su nodi ARM.
TPU Risolvi i problemi relativi alle TPU, inclusi quelli relativi a quota, provisioning automatico dei nodi, configurazione e pianificazione dei workload.
GPU Risolvi i problemi relativi alle GPU, inclusi quelli relativi all'installazione dei driver GPU, agli errori dei plug-in dei dispositivi e alle immagini dei container.

Gestione dei cluster

Argomento Descrizione
Upgrade Risolvi i problemi relativi agli upgrade dei cluster GKE, ad esempio un kube-apiserver non integro dopo un upgrade del piano di controllo o i workload espulsi dopo un upgrade.
Webhook Scopri come risolvere i problemi e garantire la stabilità del piano di controllo del cluster quando utilizzi i webhook di ammissione.
Spazio dei nomi bloccato nello stato Terminating Risolvi i problemi relativi ai namespace bloccati nello stato Terminating identificando e rimuovendo i componenti non corretti che bloccano l'eliminazione.

Monitoraggio

Argomento Descrizione
Metriche di sistema Risolvi i problemi relativi alla mancata visualizzazione delle metriche di sistema in Cloud Monitoring.
Dashboard di monitoraggio Risolvi i problemi relativi alle dashboard di monitoraggio, inclusi i problemi di attivazione del monitoraggio, le risorse Kubernetes mancanti e le autorizzazioni.
Logging Risolvi i problemi di registrazione, inclusi i problemi di attivazione della registrazione, i log mancanti e le quote.

Errori 4xx

Argomento Descrizione
Errori 4xx Risolvi alcuni degli errori 400, 401, 403 e 404 che potresti riscontrare durante l'utilizzo di GKE. Questa pagina include anche informazioni su come risolvere i problemi relativi alle autorizzazioni di modifica mancanti nell'account.

Problemi noti

Argomento Descrizione
Problemi noti Identifica e risolvi i problemi noti che potrebbero influire sul tuo utilizzo di GKE.