Bilanciamento del carico e scalabilità


Google Cloud offre il bilanciamento del carico e la scalabilità automatica per gruppi di istanze.

Bilanciamento del carico

Google Cloud offre il bilanciamento del carico lato server per consentirti di distribuire il traffico in entrata su più istanze di macchine virtuali (VM). Il bilanciamento del carico offre i seguenti vantaggi:

  • Scalare l'app
  • Supportare il traffico intenso
  • Rileva e rimuovi automaticamente le istanze VM non integre utilizzando controlli di integrità. Le istanze che diventano di nuovo in stato di integrità vengono aggiunte di nuovo automaticamente.
  • Instrada il traffico verso la macchina virtuale più vicina

Il bilanciamento del carico di Google Cloud utilizza le risorse regola di forwarding per associare determinati tipi di traffico e inoltrarlo a un bilanciatore del carico. Ad esempio, una regola di forwarding può associare il traffico TCP destinato alla porta 80 sull'indirizzo IP 192.0.2.1, quindi inoltrarlo a un bilanciatore del carico, che lo indirizzerà alle istanze VM in buono stato.

Il bilanciamento del carico di Google Cloud è un servizio gestito, il che significa che i suoi componenti sono ridondanti e altamente disponibili. Se un componente di bilanciamento del carico si arresta in modo anomalo, viene riavviato o sostituito automaticamente e immediatamente.

Google Cloud offre diversi tipi di bilanciamento del carico che differiscono per funzionalità, scenari di utilizzo e modalità di configurazione. Per le descrizioni, consulta la documentazione di Google Cloud Load Balancing.

Scalabilità automatica

Compute Engine offre la scalabilità automatica per aggiungere o rimuovere automaticamente le istanze VM da un gruppo di istanze gestite (MIG) in base agli incrementi o alle riduzioni del carico. La scalabilità automatica consente alle app di gestire agevolmente l'aumento del traffico e riduce i costi quando il fabbisogno di risorse è inferiore. Puoi eseguire il ridimensionamento automatico di un gruppo di istanze gestite in base all'utilizzo della CPU, alle metriche di Cloud Monitoring, alle pianificazioni o alla capacità di gestione del bilanciamento del carico.

Quando configuri un gestore della scalabilità automatica in base alla capacità di gestione del bilanciamento del carico, il gestore della scalabilità automatica monitora la capacità di gestione di un gruppo di istanze e esegue la scalabilità quando le istanze VM superano o non raggiungono la capacità. La capacità di pubblicazione di un'istanza può essere definita nel servizio di backend del bilanciatore del carico e può essere basata sull'utilizzo o sulle richieste al secondo. Per ulteriori informazioni, consulta Scalabilità basata sulla capacità di gestione del bilanciamento del carico.

Per scoprire di più sulla scalabilità automatica, consulta Gruppi di istanze a scalabilità automatica.

Passaggi successivi