Risoluzione dei problemi di scalabilità di Istiod in Cloud Service Mesh

Questa sezione illustra i problemi comuni di Cloud Service Mesh e come risolverli. Se hai bisogno di ulteriore assistenza, vedi Ricevere assistenza.

Fattori di scalabilità

Istiod invia la configurazione a ogni sidecar utilizzando uno stream gRPC a lungo termine. Ha diverse caratteristiche che influiscono sulla scalabilità:

  • Le dimensioni della configurazione da generare:
    • Numero totale di servizi/pod e Risorse Istio
    • Per le installazioni su larga scala, modifica le impostazioni di Sidecar per ridurre le dimensioni della configurazione.
  • Il tasso di cambiamento nell'ambiente:
    • Quando viene creato un nuovo servizio o viene modificata la configurazione Istio, la configurazione vengono inviati ai proxy.
    • L'aggiunta di nuovi endpoint non influisce sulle prestazioni, perché vengono inviati solo aggiornamenti incrementali.
  • Il numero di proxy per i quali viene generata la configurazione:
    • Il valore è influenzato dal numero di gateway e pod con un sidecar.

Considerazioni sulla scalabilità

Istiod offre una buona scalabilità verticale (richieste di grandi dimensioni) e orizzontale (più di repliche). Assicurati che i limiti di CPU non siano troppo restrittivi; se Istio raggiunge il limite di CPU, potrebbe verificarsi una limitazione che influisce negativamente la distribuzione della configurazione. In caso di problemi di prestazioni, considera eseguire l'upgrade alla versione più recente di Cloud Service Mesh, poiché ogni versione ha ottimizzazioni del rendimento.

Carico sbilanciato

Variazioni di grande entità nelle dimensioni del cluster potrebbero causare un carico temporaneamente sbilanciato, a causa legami di lunga durata. Ciò è mitigato da una connessione massima di 30 minuti l'età, che potrebbe generare messaggi di errore in Envoy, come gRPC config stream closed: 13, che consentono il ribilanciamento naturale del carico.

Per attenuare il problema, utilizza più repliche di Istiod (il valore predefinito è 2 repliche) e la prescalabilità se prevedi aumenti di dimensioni estremi del cluster.