Risolvere i problemi relativi ai limiti delle risorse in Anthos Service Mesh

Questa sezione spiega i problemi comuni di Anthos Service Mesh e come risolverli. Se hai bisogno di ulteriore assistenza, vedi la sezione Richiedere assistenza.

I problemi relativi ai limiti delle risorse di Anthos Service Mesh possono essere causati da uno dei seguenti motivi:

  • Oggetti LimitRange creati nello spazio dei nomi istio-system o in qualsiasi spazio dei nomi in cui è abilitata l'inserimento automatico sidecar.
  • Limiti definiti dall'utente impostati su un valore troppo basso.
  • I nodi esauriscono la memoria o altre risorse.

Possibili sintomi di problemi relativi alle risorse:

  • Anthos Service Mesh ha ricevuto ripetutamente la configurazione da istiod indicata dall'errore, Envoy proxy NOT ready. Vedere questo errore più volte all'avvio è normale, ma altrimenti è una preoccupazione.
  • Problemi di rete con alcuni pod o nodi non raggiungibili.
  • istioctl proxy-status con STALE stati visualizzati nell'output.
  • OOMKilled messaggi nei log di un nodo.
  • Utilizzo della memoria da parte dei container: kubectl top pod POD_NAME --containers.
  • Utilizzo della memoria da parte dei pod all'interno di un nodo: kubectl top node my-node.
  • Invio esaurito dalla memoria: kubectl get pods mostra lo stato OOMKilled nell'output.

I file collaterali Istio richiedono molto tempo per la configurazione

Una bassa propagazione della configurazione può verificarsi a causa di risorse insufficienti assegnate a istiod o di dimensioni del cluster eccessive.

Esistono diverse possibili soluzioni a questo problema:

  1. Se i tuoi strumenti di monitoraggio (prometheus, stackdriver e così via) mostrano un'utilizzo elevato di una risorsa di istiod, aumenta l'allocazione della risorsa, ad esempio aumenta il limite di CPU o memoria del deployment di istiod. Si tratta di una soluzione temporanea e ti consigliamo di esaminare i metodi per ridurre il consumo di risorse.

  2. Se riscontri questo problema in un cluster/un deployment di grandi dimensioni, riduci la quantità di stato della configurazione di cui viene eseguito il push a ciascun proxy configurando le risorse collaterali.

  3. Se il problema persiste, prova a ridimensionare orizzontalmente istiod.

  4. Se tutti gli altri passaggi per la risoluzione dei problemi non risolvono il problema, segnala un bug che descrive in dettaglio il deployment e i problemi osservati. Se possibile, segui questi passaggi per includere un profilo CPU/memoria nella segnalazione di bug, insieme a una descrizione dettagliata delle dimensioni del cluster, del numero di pod, del numero di servizi e così via.