Questa pagina è stata tradotta dall'API Cloud Translation.

Risolvi i problemi relativi alla gestione degli indirizzi IP nei cluster VPC

Autopilot Standard

Questa pagina ti aiuta a risolvere i problemi relativi alla gestione degli indirizzi IP nei cluster VPC in Google Kubernetes Engine (GKE).

Questa pagina guida gli amministratori e gli operatori della piattaforma nella diagnosi e nella risoluzione di problemi come l'esaurimento degli indirizzi IP per nodi e pod, nella risoluzione dei problemi relativi agli errori di configurazione di rete che bloccano le operazioni del cluster (come i conflitti di intervallo), nella gestione degli intervalli CIDR degli indirizzi IP e nella configurazione corretta di funzionalità come SNAT predefinita, Cloud NAT e rete dual-stack.

Questa pagina aiuta anche gli sviluppatori di applicazioni a capire in che modo le limitazioni di rete sottostanti, come lo spazio IP esaurito, possono influire sui loro carichi di lavoro, causando problemi come la mancata pianificazione dei pod. Anche se gli sviluppatori potrebbero non configurare direttamente i VPC, la comprensione di questi problemi comuni li aiuta a collaborare meglio con gli amministratori e gli operatori della piattaforma per una risoluzione più rapida. Per ulteriori informazioni sui ruoli comuni e sulle attività di esempio a cui facciamo riferimento nei contenuti diGoogle Cloud , consulta Ruoli e attività comuni degli utenti GKE.

Diagnosticare l'esaurimento degli indirizzi IP

L'esaurimento degli indirizzi IP nel cluster può impedire lo scaling dei nodi e interrompere i carichi di lavoro. Questa sezione spiega come utilizzare il monitoraggio dell'utilizzo degli indirizzi IP in GKE per rilevare e risolvere potenziali problemi di esaurimento.

GKE calcola l'utilizzo degli indirizzi IP utilizzando i dati degli insight di Network Analyzer e di altre origini dati GKE. Questo monitoraggio è disponibile per tutti i cluster nativi di VPC.

Per visualizzare l'utilizzo dell'indirizzo IP di un cluster:

Nella console Google Cloud , vai alla pagina Cluster Kubernetes.

Vai ai cluster Kubernetes
Fai clic sul nome del cluster che vuoi esaminare. Questa azione apre la pagina Dettagli del cluster.
Vai alla pagina Utilizzo IP utilizzando uno dei seguenti metodi:
- Seleziona la scheda Osservabilità, quindi fai clic su Utilizzo IP nel menu di navigazione dell'osservabilità.
- Nella sezione Networking, trova la riga Intervallo IPv4 pod del cluster (predefinito) e fai clic su Visualizza utilizzo IP.
Controlla la colonna Stato dell'allocazione IP. Questa colonna mostra la percentuale di indirizzi IP allocati nell'intervallo di indirizzi IP del pod. GKE considera tutti gli indirizzi IP nell'intervallo CIDR assegnato di un nodo come allocati, indipendentemente dal fatto che i singoli indirizzi IP siano assegnati ai pod. Questo comportamento significa che la percentuale riflette l'intero intervallo di pod per un nodo, non solo gli indirizzi IP in uso. Se i cluster condividono gli stessi intervalli di indirizzi IP, la percentuale di utilizzo mostra il totale combinato.
Per una visualizzazione dettagliata dell'utilizzo degli indirizzi IP, inclusi intervalli CIDR, informazioni sulla subnet e consigli, fai clic su Mostra dettagli.

Se l'utilizzo degli indirizzi IP è elevato (si avvicina al 100%), valuta queste soluzioni per evitare l'esaurimento degli indirizzi IP:

Aggiungi altri intervalli di indirizzi IPv4 dei pod utilizzando il CIDR multi-pod discontinuo. Questa funzionalità ti consente di aggiungere altri indirizzi IPv4 per i tuoi pod senza dover ricreare il cluster o configurare nuove subnet.
Aggiungi altre subnet con intervalli di indirizzi IPv4 aggiuntivi nel cluster. Questa funzionalità consente ai nuovi node pool di utilizzare indirizzi IP delle subnet appena aggiunte.
Crea un nuovo cluster con un valore inferiore per il numero massimo di pod. Questo approccio riserva meno indirizzi IP per ogni nodo, il che può aiutarti a gestire il consumo complessivo di indirizzi IP nell'intervallo di rete del cluster. Per saperne di più, consulta Configura il numero massimo di pod per nodo.
Se non hai intervalli di indirizzi IP o spazio di indirizzi RFC 1918 sufficienti, valuta la possibilità di utilizzare intervalli non RFC 1918 (incluso lo spazio di indirizzi di classe E).

Risolvere problemi di rete specifici

Le sezioni seguenti forniscono indicazioni per risolvere i problemi relativi ai cluster VPC nativi. Puoi anche visualizzare gli insight sull'utilizzo degli indirizzi IP GKE.

La risorsa di rete predefinita non è pronta

Sintomi

Ricevi un messaggio di errore simile al seguente:

projects/[PROJECT_NAME]/regions/XXX/subnetworks/default

Possibili cause

Esistono operazioni parallele sulla stessa subnet. Ad esempio, viene creato un altro cluster nativo di VPC oppure viene aggiunto o eliminato un intervallo secondario nella subnet.

Risoluzione

Riprova a eseguire il comando.

Valore non valido per `IPCidrRange`

Sintomi

Ricevi un messaggio di errore simile al seguente:

resource.secondaryIpRanges[1].ipCidrRange': 'XXX'. Invalid IPCidrRange: XXX conflicts with existing subnetwork 'default' in region 'XXX'

Possibili cause

Un altro cluster nativo di VPC viene creato contemporaneamente e tenta di allocare gli stessi intervalli nella stessa rete VPC.

Lo stesso intervallo secondario viene aggiunto alla subnet nella stessa rete VPC.

Risoluzione

Se questo errore viene restituito durante la creazione del cluster quando non sono stati specificati intervalli secondari, riprova a eseguire il comando di creazione del cluster.

Spazio di indirizzi IP liberi insufficiente per i pod

Sintomi

Il cluster è bloccato in uno stato di provisioning per un periodo di tempo prolungato.

La creazione del cluster restituisce un errore del gruppo di istanze gestite (MIG).

Quando aggiungi uno o più nodi a un cluster, viene visualizzato il seguente errore:

[IP_SPACE_EXHAUSTED] Instance 'INSTANCE_NAME' creation failed: IP space of 'projects/PROJECT_ID/regions/REGION/subnetworks/[SUBNET_NAME]-[SECONDARY_RANGE_NAME]-[HASH_8BYTES]' is exhausted. The secondary range name is in the format of 'gke-[CLUSTER_NAME]-[HASH_8BYTES]'.

Possibili cause

Esaurimento degli indirizzi IP dei nodi:l'intervallo di indirizzi IP principale della subnet assegnata al cluster esaurisce gli indirizzi IP disponibili. Ciò si verifica in genere quando si scalano i node pool o si creano cluster di grandi dimensioni.

Esaurimento degli indirizzi IP dei pod: l'intervallo CIDR dei pod assegnato al cluster è pieno. Ciò si verifica quando il numero di pod supera la capacità del CIDR pod, soprattutto in caso di densità elevata di pod per nodo o deployment di grandi dimensioni.

Convenzioni di denominazione specifiche delle subnet:il modo in cui una subnet viene denominata in un messaggio di errore può aiutarti a capire se il problema riguarda l'intervallo di indirizzi IP dei nodi (da cui i nodi stessi ottengono il proprio indirizzo IP) o l'intervallo di indirizzi IP dei pod (da cui i container all'interno dei pod ottengono i propri indirizzi IP).

Esaurimento dell'intervallo secondario (Autopilot): nei cluster Autopilot, gli intervalli secondari assegnati per gli indirizzi IP del pod sono esauriti a causa dello scaling o dell'elevata densità di pod.

Soluzione

Raccogli le seguenti informazioni sul tuo cluster: nome, versione del control plane, modalità di funzionamento, nome VPC associato e nome e CIDR della subnet. Inoltre, annota gli intervalli IPv4 dei pod del cluster predefiniti e aggiuntivi (inclusi nomi e CIDR), se il routing del traffico VPC nativo è abilitato e l'impostazione del numero massimo di pod per nodo a livello di cluster e di pool di nodi (se applicabile). Prendi nota di tutti i node pool interessati e dei relativi intervalli di indirizzi IP pod IPv4 specifici e delle configurazioni del numero massimo di pod per nodo, se differiscono dalle impostazioni a livello di cluster. Inoltre, registra le configurazioni predefinite e personalizzate (se presenti) per il numero massimo di pod per nodo nella configurazione delpool di nodil.

Conferma il problema di esaurimento degli indirizzi IP

Network Intelligence Center: verifica la presenza di tassi di allocazione degli indirizzi IP elevati negli intervalli di indirizzi IP dei pod in Network Intelligence Center per il tuo cluster GKE.

Se osservi un'elevata percentuale di allocazione degli indirizzi IP negli intervalli di pod all'interno di Network Intelligence Center, l'intervallo di indirizzi IP dei pod è esaurito.

Se gli intervalli di indirizzi IP dei pod mostrano tassi di allocazione normali, ma continui a riscontrare esaurimento degli indirizzi IP, è probabile che l'intervallo di indirizzi IP dei nodi sia esaurito.
Audit log: esamina il campo resourceName nelle voci IP_SPACE_EXHAUSTED, confrontandolo con i nomi delle subnet o con i nomi dell'intervallo di indirizzi IP dei pod secondari.
Verifica se l'intervallo di indirizzi IP esaurito è l'intervallo di indirizzi IP del nodo o del pod.

Per verificare se l'intervallo di indirizzi IP esaurito è l'intervallo di indirizzi IP dei nodi o l'intervallo di indirizzi IP dei pod, controlla se il valore di resourceName nella parte ipSpaceExhausted di una voce di log IP_SPACE_EXHAUSTED è correlato al nome della subnet o al nome dell'intervallo di indirizzi IPv4 secondari per i pod utilizzati nel cluster GKE interessato.

Se il valore di resourceName è nel formato "[Subnet_name]", l'intervallo di indirizzi IP del nodo è esaurito. Se il valore di resourceName è nel formato "[Subnet_name]-[Name_of_Secondary_IPv4_range_for_pods]-[HASH_8BYTES]", l'intervallo di indirizzi IP dei pod è esaurito.

Nota: GKE tronca le stringhe lunghe utilizzate nel nome della subnet e nel nome dell'intervallo di indirizzi IPv4 secondario per i pod a 15 caratteri.

Risolvi l'esaurimento degli indirizzi IP del pod:

Ridimensiona il CIDR del pod esistente: aumenta le dimensioni dell'intervallo di indirizzi IP del pod attuale. Puoi aggiungere intervalli IP pod al cluster utilizzando il CIDR multi-pod non contiguo.
Crea subnet aggiuntive: aggiungi subnet con CIDR pod dedicati al cluster.

Riduci i pod per nodo per liberare indirizzi IP:

Crea un nuovo pool di nodi con un numero massimo di pod per nodo inferiore.
Esegui la migrazione dei carichi di lavoro a questo pool di nodi, quindi elimina il node pool precedente. La riduzione del numero massimo di pod per nodo consente di supportare più nodi in un intervallo di indirizzi IP secondari fisso per i pod. Per informazioni dettagliate sui calcoli coinvolti, consulta Intervallo di indirizzi IP secondari della subnet per i pod e Intervalli di limitazione dei nodi.

Esaurimento dell'indirizzo IP del nodo di indirizzo:

Rivedi la pianificazione degli indirizzi IP: assicurati che l'intervallo di indirizzi IP dei nodi sia in linea con i tuoi requisiti di scalabilità.
Crea un nuovo cluster (se necessario): se l'intervallo di indirizzi IP del nodo è molto limitato, crea un cluster di sostituzione con un dimensionamento appropriato dell'intervallo di indirizzi IP. Consulta Intervalli IP per cluster VPC nativi e Pianificazione dell'intervallo IP.

Esegui il debug dei problemi di esaurimento degli indirizzi IP con `gcpdiag`

gcpdiag è uno strumento open source. Non è un prodotto Google Cloud supportato ufficialmente. Puoi utilizzare lo strumento gcpdiag per identificare e risolvere Google Cloud i problemi del progetto. Per maggiori informazioni, consulta il progetto gcpdiag su GitHub.

Per esaminare le cause dell'esaurimento degli indirizzi IP nei cluster GKE Autopilot e Standard, considera quanto segue:

Stato del cluster: controlla lo stato del cluster se viene segnalato l'esaurimento degli indirizzi IP.
Analizzatore di rete: esegue query sui log di Stackdriver per i log dell'analizzatore di rete per verificare se si è verificato l'esaurimento dell'indirizzo IP del pod o del nodo.
Tipo di cluster:controlla il tipo di cluster e fornisce consigli pertinenti in base al tipo di cluster.

ConsoleGoogle Cloud

Completa e copia il seguente comando.

gcpdiag runbook gke/ip-exhaustion \
    --parameter project_id=PROJECT_ID \
    --parameter name=CLUSTER_NAME \
    --parameter location=ZONE|REGION \
    --parameter start_time=yyyy-mm-ddThh:mm:ssZ \
    --parameter end_time=yyyy-mm-ddThh:mm:ssZ \

Apri la console Google Cloud e attiva Cloud Shell.

Apri Cloud Console

Incolla il comando copiato.
Esegui il comando gcpdiag, che scarica l'immagine Docker gcpdiag e poi esegue controlli diagnostici. Se applicabile, segui le istruzioni di output per correggere i controlli non riusciti.

Docker

Puoi eseguire gcpdiag utilizzando un wrapper che avvia gcpdiag in un container Docker. Docker o Podman devono essere installati.

Copia ed esegui il seguente comando sulla workstation locale.

curl https://gcpdiag.dev/gcpdiag.sh >gcpdiag && chmod +x gcpdiag

Esegui il comando gcpdiag.

./gcpdiag runbook gke/ip-exhaustion \
    --parameter project_id=PROJECT_ID \
    --parameter name=CLUSTER_NAME \
    --parameter location=ZONE|REGION \
    --parameter start_time=yyyy-mm-ddThh:mm:ssZ \
    --parameter end_time=yyyy-mm-ddThh:mm:ssZ \

Visualizza i parametri disponibili per questo runbook.

Sostituisci quanto segue:

PROJECT_ID: l'ID del progetto che contiene la risorsa
CLUSTER_NAME: il nome del cluster GKE di destinazione all'interno del progetto.
LOCATION: la zona o la regione in cui si trova il cluster.
start_time: l'ora in cui è iniziato il problema.
end_time: l'ora in cui il problema è terminato. Imposta l'ora corrente se il problema persiste.

Flag utili:

--universe-domain: se applicabile, il dominio Trusted Partner Sovereign Cloud che ospita la risorsa
--parameter o -p: parametri del runbook

Per un elenco e una descrizione di tutti i flag dello strumento gcpdiag, consulta le istruzioni per l'utilizzo di gcpdiag.

Conferma se SNAT predefinita è disabilitata

Utilizza il seguente comando per controllare lo stato di SNAT predefinito:

gcloud container clusters describe CLUSTER_NAME

Sostituisci CLUSTER_NAME con il nome del cluster.

L'output è simile al seguente:

networkConfig:
  disableDefaultSnat: true
  network: ...

Impossibile utilizzare `--disable-default-snat` senza `--enable-ip-alias`

Questo messaggio di errore e must disable default sNAT (--disable-default-snat) before using public IP address privately in the cluster indicano che devi impostare esplicitamente il flag --disable-default-snat durante la creazione del cluster, poiché utilizzi indirizzi IP pubblici nel cluster privato.

Se visualizzi messaggi di errore come cannot disable default sNAT ... , significa che non è possibile disattivare SNAT predefinito nel cluster. Per risolvere il problema, rivedi la configurazione del cluster.

Debug di Cloud NAT con SNAT predefinita disabilitata

Se hai creato un cluster privato con il flag --disable-default-snat e hai configurato Cloud NAT per l'accesso a internet e non vedi traffico diretto a internet dai tuoi pod, assicurati che l'intervallo di pod sia incluso nella configurazione di Cloud NAT.

Se si verifica un problema con la comunicazione da pod a pod, esamina le regole iptables sui nodi per verificare che gli intervalli di pod non siano mascherati dalle regole iptables.

Per saperne di più, consulta la documentazione sul mascheramento IP di GKE.

Se non hai configurato un agente di mascheramento IP per il cluster, GKE garantisce automaticamente che la comunicazione da pod a pod non venga mascherata. Tuttavia, se è configurato un agente di mascheramento IP, questo sostituisce le regole di mascheramento IP predefinite. Verifica che siano configurate regole aggiuntive nell'agente di mascheramento IP per ignorare il mascheramento degli intervalli di pod.

La comunicazione di rete del cluster dual-stack non funziona come previsto

Possibili cause: Le regole firewall create dal cluster GKE non includono gli indirizzi IPv6 allocati.
Risoluzione: Puoi convalidare la regola firewall seguendo questi passaggi:

Verifica i contenuti della regola firewall:

gcloud compute firewall-rules describe FIREWALL_RULE_NAME

Sostituisci FIREWALL_RULE_NAME con il nome della regola firewall.

Ogni cluster dual-stack crea una regola firewall che consente ai nodi e ai pod di comunicare tra loro. I contenuti della regola firewall sono simili a quanto segue:

allowed:
- IPProtocol: esp
- IPProtocol: ah
- IPProtocol: sctp
- IPProtocol: tcp
- IPProtocol: udp
- IPProtocol: '58'
creationTimestamp: '2021-08-16T22:20:14.747-07:00'
description: ''
direction: INGRESS
disabled: false
enableLogging: false
id: '7326842601032055265'
kind: compute#firewall
logConfig:
  enable: false
name: gke-ipv6-4-3d8e9c78-ipv6-all
network: https://www.googleapis.com/compute/alpha/projects/my-project/global/networks/alphanet
priority: 1000
selfLink: https://www.googleapis.com/compute/alpha/projects/my-project/global/firewalls/gke-ipv6-4-3d8e9c78-ipv6-all
selfLinkWithId: https://www.googleapis.com/compute/alpha/projects/my-project/global/firewalls/7326842601032055265
sourceRanges:
- 2600:1900:4120:fabf::/64
targetTags:
- gke-ipv6-4-3d8e9c78-node

Il valore di sourceRanges deve essere uguale a quello di subnetIpv6CidrBlock. Il valore di targetTags deve corrispondere ai tag sui nodi GKE. Per risolvere il problema, aggiorna la regola firewall con le informazioni sul blocco ipAllocationPolicy del cluster.

Passaggi successivi

Per informazioni generali sulla diagnosi dei problemi DNS di Kubernetes, vedi Debug della risoluzione DNS.
Se non riesci a trovare una soluzione al tuo problema nella documentazione, consulta la sezione Richiedere assistenza per ulteriore aiuto, inclusi consigli sui seguenti argomenti:
- Aprire una richiesta di assistenza contattando l'assistenza clienti cloud.
- Ricevere assistenza dalla community ponendo domande su StackOverflow e utilizzando il tag google-kubernetes-engine per cercare problemi simili. Puoi anche unirti al canale Slack #kubernetes-engine per ulteriore assistenza della community.
- Apertura di bug o richieste di funzionalità utilizzando lo strumento di monitoraggio dei problemi pubblico.

Risolvi i problemi relativi alla gestione degli indirizzi IP nei cluster VPC

Diagnosticare l'esaurimento degli indirizzi IP

Risolvere problemi di rete specifici

La risorsa di rete predefinita non è pronta

Valore non valido per IPCidrRange

Spazio di indirizzi IP liberi insufficiente per i pod

Esegui il debug dei problemi di esaurimento degli indirizzi IP con gcpdiag

ConsoleGoogle Cloud

Docker

Conferma se SNAT predefinita è disabilitata

Impossibile utilizzare --disable-default-snat senza --enable-ip-alias

Debug di Cloud NAT con SNAT predefinita disabilitata

La comunicazione di rete del cluster dual-stack non funziona come previsto

Passaggi successivi

Valore non valido per `IPCidrRange`

Esegui il debug dei problemi di esaurimento degli indirizzi IP con `gcpdiag`

Impossibile utilizzare `--disable-default-snat` senza `--enable-ip-alias`