Problemi noti di GKE su AWS

Questa pagina elenca i problemi noti selezionati di GKE su AWS e i passaggi che puoi seguire per ridurne l'impatto.

Se hai bisogno di ulteriore aiuto, contatta l'assistenza clienti Google Cloud.

Suite operativa

Il gestore della scalabilità automatica dei cluster potrebbe fare lo scale up non corretto da zero nodi

Le versioni interessate da questo problema sono le seguenti:

  • Tutte le versioni precedenti alla 1.27
  • Versioni della 1.27 da 1.27.0-gke.0 fino alla 1.27.12-gke.800 esclusa
  • Versioni della 1.28 da 1.28.0-gke.0 fino a, ma escluso, 1.28.8-gke.800

Il gestore della scalabilità automatica dei cluster non esegue correttamente lo scale up da zero nodi per i pool di nodi con etichette personalizzate o incompatibilità.

Questo problema si verifica perché il gestore della scalabilità automatica dei cluster GKE su AWS non ha configurato le etichette del pool di nodi e i tag di incompatibilità sul pool di nodi corrispondente, gruppo di scalabilità automatica durante il provisioning del pool di nodi. Per i pool di nodi con zero nodi, il gestore della scalabilità automatica dei cluster non può creare correttamente i modelli di nodi a causa di questi tag mancanti. Ciò potrebbe portare a decisioni di scalabilità errate, ad esempio la mancata pianificazione dei pod nei nodi applicabili o il provisioning di nodi in realtà non necessari. Per maggiori informazioni, consulta Configurazione del rilevamento automatico.

Networking

Timeout dell'applicazione causati da errori di inserimento della tabella Conntrack

Le versioni interessate da questo problema sono le seguenti:

  • Tutte le versioni della 1.23 a partire dalla versione 1.23.8-gke.1700.
  • Tutte le versioni della 1.24 a partire dalla versione 1.24.0-gke.0.
  • Versioni della versione 1.25 da 1.25.0-gke.0 fino a 1.25.10-gke.1200 escluso.
  • Versioni dalla 1.26.0-gke.0 fino alla 1.26.4-gke.2200 (esclusa).

I cluster in esecuzione su un sistema operativo Ubuntu che utilizza il kernel 5.15 o versioni successive sono soggetti a errori di inserimento della tabella del monitoraggio delle connessioni di netfilter (conntrack). Gli errori di inserimento possono verificarsi anche quando la tabella conntrack ha spazio per nuove voci. Gli errori sono causati da modifiche nel kernel 5.15 e nelle versioni successive che limitano gli inserti delle tabelle in base alla lunghezza della catena.

Per verificare se questo problema ti riguarda, controlla le statistiche del sistema di monitoraggio delle connessioni nel kernel con il seguente comando:

sudo conntrack -S

La risposta sarà simile alla seguente:

cpu=0       found=0 invalid=4 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=1       found=0 invalid=0 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=2       found=0 invalid=16 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=3       found=0 invalid=13 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=4       found=0 invalid=9 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=5       found=0 invalid=1 insert=0 insert_failed=0 drop=0 early_drop=0
error=519 search_restart=0 clash_resolve=126 chaintoolong=0

Se un valore chaintoolong nella risposta è un numero diverso da zero, questo problema ti riguarda.

Soluzione

Se utilizzi la versione 1.26.2-gke.1001, esegui l'upgrade alla versione 1.26.4-gke.2200 o successive.

Usabilità

È stato rilevato un errore nella UI di cluster non raggiungibili

Le versioni interessate da questo problema sono 1.25.5-gke.1500 e 1.25.4-gke.1300.

Alcune piattaforme UI nella console Google Cloud non possono autorizzare il cluster e potrebbero visualizzarlo come non raggiungibile.

Soluzione

Esegui l'upgrade del cluster all'ultima patch disponibile della versione 1.25. Questo problema è stato risolto nella versione 1.25.5-gke.2000.

Errori relativi all'API

Kubernetes 1.22 ritira e sostituisce diverse API. Se hai eseguito l'upgrade del cluster alla versione 1.22 o successiva, qualsiasi chiamata effettuata dall'applicazione a una delle API deprecate non andrà a buon fine.

Soluzione

Esegui l'upgrade dell'applicazione per sostituire le chiamate API deprecate con le controparti più recenti.