Questa pagina è stata tradotta dall'API Cloud Translation.

Bilanciamento del carico nativo del container tramite Ingress

Autopilot Standard

Questa pagina spiega come utilizzare il bilanciamento del carico nativo dei container in Google Kubernetes Engine (GKE). Il bilanciamento del carico nativo del container consente ai bilanciatori del carico di targetizzare direttamente i pod Kubernetes e di distribuire uniformemente il traffico ai pod.

Per ulteriori informazioni sui vantaggi, sui requisiti e sulle limitazioni del bilanciamento del carico nativo del container, consulta Bilanciamento del carico nativo del container.

Prima di iniziare

Prima di iniziare, assicurati di aver eseguito le seguenti operazioni:

Attiva l'API Google Kubernetes Engine.

Attiva l'API Google Kubernetes Engine

Se vuoi utilizzare Google Cloud CLI per questa attività, installala e poi inizializza gcloud CLI. Se hai già installato gcloud CLI, scarica l'ultima versione eseguendo gcloud components update.
Nota:per le installazioni esistenti di gcloud CLI, assicurati di impostare la compute/region proprietà. Se utilizzi principalmente cluster zonali, imposta compute/zone. Se imposti una località predefinita, puoi evitare errori in gcloud CLI come il seguente: One of [--zone, --region] must be supplied: Please specify location. Potresti dover specificare la posizione in determinati comandi se la posizione del cluster è diversa da quella predefinita che hai impostato.

Utilizza il bilanciamento del carico nativo del container

Le sezioni seguenti illustrano una configurazione del bilanciamento del carico nativo del container su GKE.

Crea un cluster nativo di VPC

Per utilizzare il bilanciamento del carico nativo del container, nel cluster GKE devono essere abilitati gli indirizzi IP alias.

Ad esempio, il seguente comando crea un cluster GKE, neg-demo-cluster, con una subnet di cui è stato eseguito il provisioning automatico:

Per la modalità Autopilot, gli indirizzi IP alias sono abilitati per impostazione predefinita:
```
gcloud container clusters create-auto neg-demo-cluster \
    --location=COMPUTE_LOCATION
```
Sostituisci COMPUTE_LOCATION con la posizione di Compute Engine per il cluster.

Per la modalità Standard, attiva gli indirizzi IP alias quando crei il cluster:

gcloud container clusters create neg-demo-cluster \
    --enable-ip-alias \
    --create-subnetwork="" \
    --network=default \
    --location=us-central1-a

Creazione di un deployment

Il seguente esempio di deployment, neg-demo-app, esegue una singola istanza di un server HTTP in container. Ti consigliamo di utilizzare carichi di lavoro che utilizzano il feedback sulla prontezza dei pod.

Utilizzare il feedback sul recupero del pod

apiVersion: apps/v1
kind: Deployment
metadata:
  labels:
    run: neg-demo-app # Label for the Deployment
  name: neg-demo-app # Name of Deployment
spec:
  selector:
    matchLabels:
      run: neg-demo-app
  template: # Pod template
    metadata:
      labels:
        run: neg-demo-app # Labels Pods from this Deployment
    spec: # Pod specification; each Pod created by this Deployment has this specification
      containers:
      - image: registry.k8s.io/serve_hostname:v1.4 # Application to run in Deployment's Pods
        name: hostname # Container name
        ports:
        - containerPort: 9376
          protocol: TCP

Utilizzare il ritardo hardcoded

apiVersion: apps/v1
kind: Deployment
metadata:
  labels:
    run: neg-demo-app # Label for the Deployment
  name: neg-demo-app # Name of Deployment
spec:
  minReadySeconds: 60 # Number of seconds to wait after a Pod is created and its status is Ready
  selector:
    matchLabels:
      run: neg-demo-app
  template: # Pod template
    metadata:
      labels:
        run: neg-demo-app # Labels Pods from this Deployment
    spec: # Pod specification; each Pod created by this Deployment has this specification
      containers:
      - image: registry.k8s.io/serve_hostname:v1.4 # Application to run in Deployment's Pods
        name: hostname # Container name
      # Note: The following line is necessary only on clusters running GKE v1.11 and lower.
      # For details, see https://cloud.google.com/kubernetes-engine/docs/how-to/container-native-load-balancing#align_rollouts
        ports:
        - containerPort: 9376
          protocol: TCP
      terminationGracePeriodSeconds: 60 # Number of seconds to wait for connections to terminate before shutting down Pods

In questo deployment, ogni container esegue un server HTTP. Il server HTTP restituisce il nome host del server delle applicazioni (il nome del pod su cui viene eseguito il server) come risposta.

Salva questo manifest come neg-demo-app.yaml, poi crea il deployment:

kubectl apply -f neg-demo-app.yaml

Crea un servizio per un bilanciatore del carico nativo del container

Dopo aver creato un deployment, devi raggruppare i relativi pod in un servizio.

Il seguente servizio di esempio, neg-demo-svc, ha come target il deployment di esempio che hai creato nella sezione precedente:

apiVersion: v1
kind: Service
metadata:
  name: neg-demo-svc # Name of Service
spec: # Service's specification
  type: ClusterIP
  selector:
    run: neg-demo-app # Selects Pods labelled run: neg-demo-app
  ports:
  - name: http
    port: 80 # Service's port
    protocol: TCP
    targetPort: 9376

Il bilanciatore del carico non viene creato finché non crei un Ingress per il servizio.

Salva questo manifest come neg-demo-svc.yaml, quindi crea il servizio:

kubectl apply -f neg-demo-svc.yaml

Crea un Ingress per il servizio

Il seguente esempio di Ingress, neg-demo-ing, ha come target il servizio che hai creato:

apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: neg-demo-ing
spec:
  defaultBackend:
    service:
      name: neg-demo-svc # Name of the Service targeted by the Ingress
      port:
        number: 80 # Should match the port used by the Service

Salva questo manifest come neg-demo-ing.yaml, poi crea l'ingresso:

kubectl apply -f neg-demo-ing.yaml

Al momento della creazione dell'ingresso, nel progetto viene creato un bilanciatore del carico delle applicazioni e in ogni zona in cui viene eseguito il cluster vengono creati gruppi di endpoint di rete(NEG). Gli endpoint nel NEG e gli endpoint del servizio vengono mantenuti sincronizzati.

Verifica l'ingresso

Dopo aver eseguito il deployment di un workload, raggruppato i relativi pod in un servizio e creato un Ingress per il servizio, devi verificare che l'Ingress abbia eseguito il provisioning del bilanciatore del carico nativo del container.

Recupera lo stato dell'ingresso:

kubectl describe ingress neg-demo-ing

L'output include gli eventi ADD e CREATE:

Events:
Type     Reason   Age                From                     Message
----     ------   ----               ----                     -------
Normal   ADD      16m                loadbalancer-controller  default/neg-demo-ing
Normal   Service  4s                 loadbalancer-controller  default backend set to neg-demo-svc:32524
Normal   CREATE   2s                 loadbalancer-controller  ip: 192.0.2.0

testa il bilanciatore del carico

Le sezioni seguenti spiegano come testare la funzionalità di un bilanciatore del carico nativo per i container.

Visita l'indirizzo IP in entrata

Attendi alcuni minuti che il bilanciatore del carico delle applicazioni venga configurato.

Puoi verificare che il bilanciatore del carico nativo del container funzioni visitando l'indirizzo IP di Ingress.

Per ottenere l'indirizzo IP di Ingress, esegui questo comando:

kubectl get ingress neg-demo-ing

Nell'output del comando, l'indirizzo IP di Ingress viene visualizzato nella colonna ADDRESS. Visita l'indirizzo IP in un browser web.

Controllare lo stato di integrità del servizio di backend

Puoi anche ottenere lo stato di integrità del servizio di backend del bilanciatore del carico.

Visualizza un elenco dei servizi di backend in esecuzione nel tuo progetto:
```
gcloud compute backend-services list
```
Registra il nome del servizio di backend che include il nome del servizio, ad esempio neg-demo-svc.
Ottieni lo stato di integrità del servizio di backend:
```
gcloud compute backend-services get-health BACKEND_SERVICE_NAME --global
```
Sostituisci BACKEND_SERVICE_NAME con il nome del servizio di backend.

Testa Ingress

Un altro modo per verificare che il bilanciatore del carico funzioni come previsto è scalare il deployment di esempio, inviare richieste di test all'ingresso e verificare che risponda il numero corretto di repliche.

Scala il deployment neg-demo-app da un'istanza a due istanze:
```
kubectl scale deployment neg-demo-app --replicas 2
```
Il completamento di questo comando potrebbe richiedere diversi minuti.

Verifica che l'implementazione sia completata:

kubectl get deployment neg-demo-app

L'output dovrebbe includere due repliche disponibili:

NAME           DESIRED   CURRENT   UP-TO-DATE   AVAILABLE   AGE
neg-demo-app   2         2         2            2           26m

Ottieni l'indirizzo IP in entrata:
```
kubectl describe ingress neg-demo-ing
```
Se questo comando restituisce un errore 404, attendi qualche minuto l'avvio del bilanciamento del carico, poi riprova.
Conta il numero di risposte distinte dal bilanciatore del carico:
```
for i in `seq 1 100`; do \
  curl --connect-timeout 1 -s IP_ADDRESS && echo; \
done  | sort | uniq -c
```
Sostituisci IP_ADDRESS con l'indirizzo IP Ingress.

L'output è simile al seguente:
```
44 neg-demo-app-7f7dfd7bc6-dcn95
56 neg-demo-app-7f7dfd7bc6-jrmzf
```
In questo output, il numero di risposte distinte è uguale al numero di repliche, il che indica che tutti i pod di backend gestiscono il traffico.

Esegui la pulizia

Dopo aver completato le attività in questa pagina, segui questi passaggi per rimuovere le risorse ed evitare addebiti indesiderati sul tuo account:

Elimina il cluster

gcloud

gcloud container clusters delete neg-demo-cluster

Console

Vai alla pagina Google Kubernetes Engine nella console Google Cloud .

Vai a Google Kubernetes Engine
Seleziona neg-demo-cluster e fai clic su Elimina.
Quando ti viene richiesto di confermare, fai clic su Elimina.

Risoluzione dei problemi

Utilizza le tecniche riportate di seguito per verificare la configurazione di rete. Le seguenti sezioni spiegano come risolvere problemi specifici relativi al bilanciamento del carico nativo dei container.

Consulta la documentazione sul bilanciamento del carico per informazioni su come elencare i gruppi di endpoint di rete.
Puoi trovare il nome e le zone del NEG corrispondente a un servizio nell'annotazione neg-status del servizio. Recupera la specifica del servizio con:
```
kubectl get svc SVC_NAME -o yaml
```
L'annotazione metadata:annotations:cloud.google.com/neg-status elenca il nome del NEG corrispondente del servizio e le zone del NEG.
Puoi controllare l'integrità del servizio di backend corrispondente a un NEG con il seguente comando:
```
gcloud compute backend-services --project PROJECT_NAME \
    get-health BACKEND_SERVICE_NAME --global
```
Il servizio di backend ha lo stesso nome del NEG.
Per stampare i log degli eventi di un servizio:
```
kubectl describe svc SERVICE_NAME
```
La stringa del nome del servizio include il nome e lo spazio dei nomi del servizio GKE corrispondente.

Impossibile creare un cluster con IP alias

Sintomi

Quando provi a creare un cluster con IP alias, potresti riscontrare il seguente errore:

ResponseError: code=400, message=IP aliases cannot be used with a legacy network.

Possibili cause

Si verifica questo errore se tenti di creare un cluster con indirizzi IP alias che utilizza anche una rete legacy.

Risoluzione

Assicurati di non creare un cluster con IP alias e una rete legacy abilitati contemporaneamente. Per ulteriori informazioni sull'utilizzo degli IP alias, consulta Crea un cluster nativo di VPC.

Il traffico non raggiunge gli endpoint

Sintomi

Errori 502/503 o connessioni rifiutate.

Possibili cause

I nuovi endpoint diventano generalmente raggiungibili dopo essere stati collegati al bilanciatore del carico, a condizione che rispondano ai controlli di integrità. Potresti riscontrare errori 502 o connessioni rifiutate se il traffico non riesce a raggiungere gli endpoint.

Gli errori 502 e le connessioni rifiutate possono anche essere causati da un container che non gestisce SIGTERM. Se un container non gestisce esplicitamente SIGTERM, viene terminato immediatamente e smette di gestire le richieste. Il bilanciatore del carico continua a inviare il traffico in entrata al container terminato, causando errori.

Il bilanciatore del carico nativo del container ha un solo endpoint di backend. Durante un aggiornamento in sequenza, il vecchio endpoint viene riprogrammato prima che venga programmato il nuovo endpoint.

I pod di backend vengono sottoposti a deployment in una nuova zona per la prima volta dopo il provisioning di un bilanciatore del carico nativo del container. L'infrastruttura del bilanciatore del carico viene programmata in una zona quando è presente almeno un endpoint nella zona. Quando viene aggiunto un nuovo endpoint a una zona, l'infrastruttura del bilanciatore del carico viene programmata e causa interruzioni del servizio.

Risoluzione

Configura i container per gestire SIGTERM e continuare a rispondere alle richieste durante il periodo di tolleranza per la terminazione (30 secondi per impostazione predefinita). Configura i pod in modo che inizino a non superare i controlli di integrità quando ricevono SIGTERM. Questo indica al bilanciatore del carico di interrompere l'invio di traffico al pod mentre è in corso la deprogrammazione dell'endpoint.

Se la tua applicazione non si arresta normalmente e smette di rispondere alle richieste quando riceve un SIGTERM, l'hook preStop può essere utilizzato per gestire SIGTERM e continuare a gestire il traffico mentre è in corso la riprogrammazione dell'endpoint.

lifecycle:
  preStop:
    exec:
      # if SIGTERM triggers a quick exit; keep serving traffic instead
      command: ["sleep","60"]

Consulta la documentazione sulla terminazione dei pod.

Se il backend del bilanciatore del carico ha una sola istanza, configura la strategia di roll out per evitare di eliminare l'unica istanza prima che la nuova istanza sia completamente programmata. Per i pod delle applicazioni gestiti dal workload Deployment, questo risultato può essere ottenuto configurando la strategia di rollout con il parametro maxUnavailable uguale a 0.

strategy:
  rollingUpdate:
    maxSurge: 1
    maxUnavailable: 0

Per risolvere i problemi relativi al traffico che non raggiunge gli endpoint, verifica che le regole firewall consentano il traffico TCP in entrata verso gli endpoint negli intervalli 130.211.0.0/22 e 35.191.0.0/16. Per saperne di più, consulta la sezione Aggiunta di controlli di integrità nella documentazione di Cloud Load Balancing.

Visualizza i servizi di backend nel tuo progetto. La stringa del nome del servizio di backend pertinente include il nome e lo spazio dei nomi del servizio GKE corrispondente:

gcloud compute backend-services list

Recupera lo stato di integrità del backend dal servizio di backend:

gcloud compute backend-services get-health BACKEND_SERVICE_NAME

Se tutti i backend non sono integri, il firewall, Ingress o il servizio potrebbero essere configurati in modo errato.

Se alcuni backend non sono integri per un breve periodo di tempo, la causa potrebbe essere la latenza della programmazione di rete.

Se alcuni backend non vengono visualizzati nell'elenco dei servizi di backend, la causa potrebbe essere la latenza di programmazione. Puoi verificarlo eseguendo questo comando, dove NEG_NAME è il nome del servizio di backend. (I NEG e i servizi di backend condividono lo stesso nome):

gcloud compute network-endpoint-groups list-network-endpoints NEG_NAME

Controlla se tutti gli endpoint previsti si trovano nel NEG.

Se hai selezionato un numero ridotto di backend (ad esempio, 1 pod) da un bilanciatore del carico nativo dei container, valuta la possibilità di aumentare il numero di repliche e distribuire i pod di backend in tutte le zone in cui si estende il cluster GKE. In questo modo, l'infrastruttura del bilanciatore del carico sottostante viene programmata completamente. In caso contrario, valuta la possibilità di limitare i pod di backend a una singola zona.

Se configuri una policy di rete per l'endpoint, assicurati che l'ingresso dalla subnet solo proxy sia consentito.

Implementazione bloccata

Sintomi

Il rollout di un deployment aggiornato si blocca e il numero di repliche aggiornate non corrisponde al numero di repliche desiderato.

Possibili cause

I controlli di integrità del deployment non riescono. L'immagine container potrebbe essere danneggiata o il controllo di integrità potrebbe essere configurato in modo errato. La sostituzione in sequenza dei pod attende che il pod appena avviato superi il gate di idoneità del pod. Ciò si verifica solo se il pod risponde ai controlli di integrità del bilanciatore del carico. Se il pod non risponde o se il controllo di integrità è configurato in modo errato, le condizioni del gate di idoneità non possono essere soddisfatte e l'implementazione non può continuare.

Se utilizzi kubectl 1.13 o versioni successive, puoi controllare lo stato dei readiness gate di un pod con il seguente comando:

kubectl get pod POD_NAME -o wide

Controlla la colonna READINESS GATES.

Questa colonna non esiste in kubectl 1.12 e versioni precedenti. Un pod contrassegnato come in stato READY potrebbe non aver superato il gate di idoneità. Per verificarlo, utilizza questo comando:

kubectl get pod POD_NAME -o yaml

Nell'output sono elencati i gate di preparazione e il relativo stato.

Risoluzione

Verifica che l'immagine container nella specifica del pod del deployment funzioni correttamente e sia in grado di rispondere ai controlli di integrità. Verifica che i controlli di integrità siano configurati correttamente.

Errori della modalità con funzionalità ridotte

Sintomi

A partire dalla versione 1.29.2-gke.1643000 di GKE, potresti ricevere i seguenti avvisi sul tuo servizio in Esplora log quando vengono aggiornati i NEG:

Entering degraded mode for NEG <service-namespace>/<service-name>-<neg-name>... due to sync err: endpoint has missing nodeName field

Possibili cause

Questi avvisi indicano che GKE ha rilevato errori di configurazione dell'endpoint durante un aggiornamento NEG basato su oggetti EndpointSlice, attivando un processo di calcolo più approfondito chiamato modalità degradata. GKE continua ad aggiornare i NEG in base al massimo impegno, correggendo la configurazione errata o escludendo gli endpoint non validi dagli aggiornamenti dei NEG.

Alcuni errori comuni sono:

endpoint has missing pod/nodeName field
endpoint corresponds to an non-existing pod/node
endpoint information for attach/detach operation is incorrect

Risoluzione

In genere, questi eventi sono causati da stati transitori e si risolvono da soli. Tuttavia, gli eventi causati da errori di configurazione negli oggetti EndpointSlice personalizzati rimangono irrisolti. Per comprendere l'errata configurazione, esamina gli oggetti EndpointSlice corrispondenti al servizio:

kubectl get endpointslice -l kubernetes.io/service-name=<service-name>

Convalida ogni endpoint in base all'errore nell'evento.

Per risolvere il problema, devi modificare manualmente gli oggetti EndpointSlice. L'aggiornamento attiva di nuovo l'aggiornamento dei NEGs. Una volta che l'errata configurazione non esiste più, l'output è simile al seguente:

NEG <service-namespace>/<service-name>-<neg-name>... is no longer in degraded mode

Problemi noti

Il bilanciamento del carico nativo del container su GKE presenta i seguenti problemi noti:

Race condition del gate di idoneità NEG

In determinate condizioni, i gate di idoneità potrebbero restituire uno stato di idoneità "falso positivo", prima che il controllo di integrità dell'ingresso riporti uno stato integro, generando eventi di errore come i seguenti sull'oggetto Ingress:

NEG is not attached to any BackendService with health checking. Marking condition "cloud.google.com/load-balancer-neg-ready" to True.

Sintomi

Questo problema fa sì che il bilanciatore del carico restituisca un errore 503 (failed_to_pick_backend) al traffico mentre GKE esegue l'aggiornamento in sequenza del workload di deployment.

Cause

Mentre il controller NEG di GKE si basa sulle informazioni del controllo di integrità NEG di Compute Engine per segnalare se l'endpoint è integro, considera la seguente sequenza di eventi:

Viene creato un nuovo pod da un aggiornamento in sequenza.
Il controller NEG di GKE aggiunge questo nuovo indirizzo IP del pod al gruppo di endpoint di rete.
Il controller NEG di GKE richiede lo stato di integrità dell'endpoint appena aggiunto.
Il servizio NEG di Compute Engine non dispone ancora di informazioni sullo stato di integrità e restituisce uno stato vuoto.
Il controller NEG di GKE presuppone che lo stato vuoto indichi che non è configurato alcun controllo di integrità e contrassegna il pod come pronto.
GKE rimuove il vecchio pod pensando che il nuovo sia pronto a gestire il traffico.
Se il nuovo pod è l'unico backend rimasto per il bilanciatore del carico, quest'ultimo restituisce una risposta 503 Service Unavailable.
Una volta che il pod inizia a superare il controllo di integrità, il bilanciatore del carico inizierà a restituire le risposte 200 OK come previsto.

Il controller NEG di GKE non può distinguere tra due stati di controllo di integrità diversi: missing-health-check-because-not-attached-to-backend, e missing-health-check-because-health-check-is-not-yet-programmed.

Poiché il controller NEG non può fare questa distinzione, il controller NEG GKE deve presupporre che, se nessuno degli endpoint del NEG dispone di informazioni sul controllo di integrità, questo NEG non deve appartenere a nessun BackendService.

Sebbene questo scenario sia improbabile, un numero relativamente piccolo di pod (ad es. 2) rispetto al numero di NEG aumenterà il rischio di questa condizione di competizione. Ricorda che i NEG vengono creati per ogni regione, con un NEG per zona, il che in genere comporta la creazione di tre NEG.

Il corollario è che se il numero di pod è relativamente maggiore, in modo che ogni NEG abbia sempre più pod prima dell'inizio dell'aggiornamento in sequenza, è molto improbabile che questa race conditionne venga attivata.

Risoluzioni:

Il modo migliore per evitare questa race condition (e in definitiva per evitare risposte 503 Service Unavailable durante gli aggiornamenti continui) è avere più backend nel gruppo di endpoint di rete.

Assicurati che la strategia di aggiornamento in sequenza sia configurata in modo da garantire che almeno un pod sia sempre in esecuzione.

Ad esempio, se solo due pod vengono eseguiti normalmente, una configurazione di esempio potrebbe essere simile a questa:

strategy:
   type: RollingUpdate
   rollingUpdate:
     maxUnavailable: 0
     maxSurge: 1

L'esempio precedente è un suggerimento. Devi aggiornare la strategia in base a diversi fattori, ad esempio il numero di repliche.

Garbage collection incompleta

GKE esegue la garbage collection dei bilanciatori del carico nativi del container ogni due minuti. Se un cluster viene eliminato prima che i bilanciatori del carico vengano rimossi completamente, devi eliminare manualmente i NEG del bilanciatore del carico.

Visualizza i NEG nel tuo progetto eseguendo questo comando:

gcloud compute network-endpoint-groups list

Nell'output del comando, cerca i NEG pertinenti.

Per eliminare un NEG, esegui questo comando, sostituendo NEG_NAME con il nome del NEG:

gcloud compute network-endpoint-groups delete NEG_NAME

Allineare i rollout dei carichi di lavoro con la propagazione degli endpoint

Quando esegui il deployment di un workload nel cluster o quando aggiorni un workload esistente, il bilanciatore del carico nativo del container può impiegare più tempo per propagare i nuovi endpoint rispetto al tempo necessario per completare l'implementazione del workload. Il Deployment di esempio che implementi in questa guida utilizza due campi per allineare l'implementazione con la propagazione degli endpoint: terminationGracePeriodSeconds e minReadySeconds.

terminationGracePeriodSeconds consente al pod di arrestarsi in modo controllato attendendo la chiusura delle connessioni dopo che un pod è pianificato per l'eliminazione.

minReadySeconds aggiunge un periodo di latenza dopo la creazione di un pod. Specifichi un numero minimo di secondi per cui un nuovo pod deve essere nello stato Ready, senza che si verifichi un arresto anomalo di nessuno dei suoi container, perché il pod sia considerato disponibile.

Devi configurare i valori minReadySeconds e terminationGracePeriodSeconds dei tuoi workload in modo che siano pari o superiori a 60 secondi per assicurarti che il servizio non venga interrotto a causa dei rollout dei workload.

terminationGracePeriodSeconds è disponibile in tutte le specifiche dei pod e minReadySeconds è disponibile per i deployment e i DaemonSet.

Per saperne di più sull'ottimizzazione delle implementazioni, consulta RollingUpdateStrategy.

`initialDelaySeconds` in Pod `readinessProbe` non rispettato

Potresti aspettarti che la configurazione initialDelaySeconds nel pod readinessProbe venga rispettata dal bilanciatore del carico nativo del container. Tuttavia, readinessProbe viene implementato da kubelet e la configurazione initialDelaySeconds controlla il controllo di integrità di kubelet, non il bilanciatore del carico nativo del container. Il bilanciamento del carico nativo del container ha un proprio controllo di integrità per il bilanciamento del carico.

Passaggi successivi

Scopri di più sui NEG.
Scopri di più sui cluster nativi di VPC.

Bilanciamento del carico nativo del container tramite Ingress Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Prima di iniziare

Utilizza il bilanciamento del carico nativo del container

Crea un cluster nativo di VPC

Creazione di un deployment

Utilizzare il feedback sul recupero del pod

Utilizzare il ritardo hardcoded

Crea un servizio per un bilanciatore del carico nativo del container

Crea un Ingress per il servizio

Verifica l'ingresso

testa il bilanciatore del carico

Visita l'indirizzo IP in entrata

Controllare lo stato di integrità del servizio di backend

Testa Ingress

Esegui la pulizia

Elimina il cluster

gcloud

Console

Risoluzione dei problemi

Impossibile creare un cluster con IP alias

Il traffico non raggiunge gli endpoint

Implementazione bloccata

Errori della modalità con funzionalità ridotte

Problemi noti

Race condition del gate di idoneità NEG

Sintomi

Cause

Risoluzioni:

Garbage collection incompleta

Allineare i rollout dei carichi di lavoro con la propagazione degli endpoint

initialDelaySeconds in Pod readinessProbe non rispettato

Passaggi successivi

Bilanciamento del carico nativo del container tramite Ingress

`initialDelaySeconds` in Pod `readinessProbe` non rispettato