Risoluzione dei problemi relativi ai limiti delle risorse in Anthos Service Mesh
Questa sezione illustra i problemi comuni di Anthos Service Mesh e come risolverli. Se hai bisogno di ulteriore assistenza, vedi Richiedere assistenza.
I problemi relativi ai limiti delle risorse di Anthos Service Mesh possono essere causati da:
- Oggetti
LimitRange
creati nello spazio dei nomiistio-system
o in qualsiasi spazio dei nomi in cui è abilitata l'inserimento automatico dei file collaterali. - Limiti definiti dall'utente troppo bassi.
- I nodi esauriscono la memoria o le altre risorse.
Potenziali sintomi di problemi delle risorse:
- Anthos Service Mesh non ha ricevuto ripetutamente la configurazione da
istiod
, indicata dall'errore,Envoy proxy NOT ready
. Vedere questo errore alcune volte all'avvio è normale, ma in caso contrario è preoccupante. - Problemi di networking con alcuni pod o nodi che non sono accessibili.
istioctl proxy-status
che mostraSTALE
stati nell'output.OOMKilled
messaggi nei log di un nodo.- Utilizzo memoria da parte dei container:
kubectl top pod POD_NAME --containers
. - Utilizzo della memoria da parte dei pod all'interno di un nodo:
kubectl top node my-node
. - Envoy fuori memoria:
kubectl get pods
mostra lo statoOOMKilled
nell'output.
La ricezione della configurazione dei sidecar Istio richiede molto tempo
Una propagazione della configurazione lenta può verificarsi a causa di risorse insufficienti allocate a istiod
o a una dimensione del cluster troppo grande.
Esistono diverse soluzioni a questo problema:
Se i tuoi strumenti di monitoraggio (prometheus, stackdriver e così via) mostrano un utilizzo elevato di una risorsa di
istiod
, aumenta l'allocazione della risorsa, ad esempio aumenta il limite di CPU o memoria del deployment diistiod
. Si tratta di una soluzione temporanea e ti consigliamo di esaminare metodi per ridurre il consumo di risorse.Se riscontri questo problema in un cluster o un deployment di grandi dimensioni, riduci la quantità di stato della configurazione push a ogni proxy configurando le risorse collaterali.
Se il problema persiste, prova a scalare in orizzontale
istiod
.Se tutti gli altri passaggi per la risoluzione dei problemi non risolvono il problema, segnala un bug che descrive in dettaglio il deployment e i problemi osservati. Se possibile, segui questi passaggi per includere un profilo CPU/memoria nella segnalazione di bug, insieme a una descrizione dettagliata delle dimensioni del cluster, del numero di pod, del numero di servizi e così via.