Panoramica del bilanciatore del carico delle applicazioni

Il bilanciatore del carico delle applicazioni è un bilanciatore del carico di livello 7 basato su proxy che ti consente di eseguire e scalare i servizi. Il bilanciatore del carico delle applicazioni distribuisce il traffico HTTP e HTTPS ai backend ospitati su varie piattaforme Google Cloud, come Compute Engine, Google Kubernetes Engine (GKE), Cloud Storage e Cloud Run, nonché ai backend esterni collegati tramite internet o utilizzando la connettività ibrida.

I bilanciatori del carico delle applicazioni sono disponibili nelle seguenti modalità di deployment:

  • Bilanciatore del carico delle applicazioni esterno: bilancia il carico del traffico proveniente dai client su internet. Per i dettagli sull'architettura, consulta l'architettura del bilanciatore del carico delle applicazioni esterno.

    Modalità di deployment Livello di servizio di rete Schema di bilanciamento del carico Indirizzo IP Porte frontend
    Esterno globale Livello Premium EXTERNAL_MANAGED IPv4
    IPv6

    Può fare riferimento a una sola porta compresa tra 1 e 65535.

    Esterno regionale Livello Premium o Standard EXTERNAL_MANAGED IPv4
    Classico

    Globale nel livello Premium

    Regionale nel livello Standard

    ESTERNO* IPv4
    IPv6 (richiede il livello Premium)
    * È possibile collegare servizi di backend EXTERNAL_MANAGED alle regole di forwarding EXTERNAL. Tuttavia, i servizi di backend EXTERNAL non possono essere collegati alle regole di inoltro EXTERNAL_MANAGED. Per usufruire delle nuove funzionalità disponibili solo con il bilanciatore del carico delle applicazioni esterno globale, ti consigliamo di eseguire la migrazione delle risorse EXTERNAL esistenti a EXTERNAL_MANAGED utilizzando la procedura descritta in Eseguire la migrazione delle risorse dal bilanciatore del carico delle applicazioni classico a quello esterno globale.
  • Bilanciatore del carico delle applicazioni interno: bilancia il carico del traffico all'interno della rete VPC o delle reti connesse alla rete VPC. Per i dettagli sull'architettura, consulta Architettura del bilanciatore del carico delle applicazioni interno.

    Modalità di deployment Livello di servizio di rete Schema di bilanciamento del carico Indirizzo IP Porte frontend
    Interno a livello di regione Livello Premium INTERNAL_MANAGED IPv4

    Può fare riferimento a una sola porta compresa tra 1 e 65535.

    Interno tra regioni*

    Livello Premium INTERNAL_MANAGED IPv4

    * Il bilanciatore del carico utilizza risorse globali e può essere implementato in una o più regioni Google Cloud a tua scelta.

Lo schema di bilanciamento del carico è un attributo della regola di inoltro e del servizio di backend di un bilanciatore del carico e indica se quest'ultimo può essere usato per il traffico interno o esterno. Il termine _MANAGED nello schema di bilanciamento del carico indica che il bilanciatore del carico è implementato come servizio gestito su Google Front End (GFE) o sul proxy Envoy open source. In uno schema di bilanciamento del carico di tipo _MANAGED, le richieste vengono indirizzate a GFE o al proxy Envoy.

Application Load Balancer esterno

I bilanciatori del carico delle applicazioni esterni vengono implementati utilizzando Google Front End (GFE) o proxy gestiti. I bilanciatori del carico delle applicazioni esterni globali e i bilanciatori del carico delle applicazioni classici utilizzano GFE distribuiti a livello globale, che operano insieme utilizzando la rete globale e il piano di controllo di Google. I GFE offrono il bilanciamento del carico su più regioni nel livello Premium, indirizzando il traffico al backend funzionante più vicino con capacità e terminando il traffico HTTP(S) il più vicino possibile agli utenti. I bilanciatori del carico delle applicazioni esterni globali e regionali utilizzano il software open source Envoy proxy per abilitare funzionalità di gestione avanzata del traffico.

Questi bilanciatori del carico possono essere implementati in una delle seguenti modalità: globale, a livello di regione o classica.

I bilanciatori del carico delle applicazioni esterni supportano le seguenti funzionalità:

Il seguente diagramma mostra un'architettura di esempio di bilanciatore del carico delle applicazioni esterno.

Architettura del bilanciatore del carico delle applicazioni esterno.
Architettura del bilanciatore del carico delle applicazioni esterno
.

Per una panoramica completa, consulta la Panoramica dell'architettura per i bilanciatori del carico delle applicazioni esterni.

Bilanciatore del carico delle applicazioni interno

I bilanciatori del carico delle applicazioni interni sono bilanciatori del carico di livello 7 regionali basati su proxy Envoy che ti consentono di eseguire e scalare il traffico delle applicazioni HTTP dietro un indirizzo IP interno. Gli Application Load Balancer interni supportano i backend in una regione, ma possono essere configurati in modo da essere accessibili a livello globale dai client di qualsiasi regione Google Cloud.

Il bilanciatore del carico distribuisce il traffico ai backend ospitati su Google Cloud, on-premise o in altri ambienti cloud. I bilanciatori del carico delle applicazioni interni supportano anche le seguenti funzionalità:

  • Norme relative alla località. All'interno di un gruppo di istanza di backend o di un gruppo di endpoint di rete, puoi configurare la modalità di distribuzione delle richieste alle istanze o agli endpoint dei membri. Per maggiori dettagli, vedi Gestione del traffico.
  • Accesso globale. Quando l'accesso globale è abilitato, i client di qualsiasi regione possono accedere al bilanciatore del carico. Per maggiori dettagli, vedi Attivare l'accesso globale.
  • Accesso da reti connesse. Puoi rendere il bilanciatore del carico accessibile ai client da reti diverse dalla propria rete VPC (Virtual Private Cloud) di Google Cloud. Le altre reti devono essere connesse alla rete VPC del bilanciatore del carico utilizzando il peering di rete VPC, Cloud VPN o Cloud Interconnect. Per maggiori dettagli, vedi Accedere alle reti collegate.
  • Compatibilità con GKE tramite Ingress (completamente orchestrato). Per maggiori dettagli, vedi Configurare Ingress per i bilanciatori del carico delle applicazioni interni.
  • I bilanciatori del carico delle applicazioni interni regionali sono supportati con App Hub, che è in anteprima.
Architettura del bilanciatore del carico delle applicazioni interno.
Architettura del bilanciatore del carico delle applicazioni interno.

Per una panoramica completa, consulta la Panoramica dell'architettura per i bilanciatori del carico delle applicazioni interni.

Casi d'uso

Le seguenti sezioni descrivono alcuni casi d'uso comuni per i bilanciatori del carico delle applicazioni.

Servizi web a tre livelli

Puoi implementare una combinazione di bilanciatori del carico delle applicazioni e bilanciatori del carico di rete per supportare i servizi web tradizionali a tre livelli. L'esempio seguente mostra come puoi implementare ogni livello, a seconda del tipo di traffico:

  • Livello web. Il frontend dell'applicazione viene servito da un bilanciatore del carico delle applicazioni esterno con backend di gruppi di istanze. Il traffico proviene da internet e viene eseguito tramite proxy dal bilanciatore del carico a un insieme di backend del gruppo di istanze in varie regioni. Questi backend inviano il traffico HTTP(S) a un insieme di bilanciatori del carico delle applicazioni interni.
  • Livello di applicazione. Il middleware dell'applicazione viene disegnato e scalato utilizzando un bilanciatore del carico delle applicazioni interno e backend di gruppi di istanze. I bilanciatori del carico distribuiscono il traffico ai gruppi di istanze di middleware. Questi gruppi di istanze di middleware inviano quindi il traffico ai bilanciatori del carico di rete passthrough interni.
  • Livello del database. I bilanciatori del carico di rete fungono da frontend per il livello di database. Distribuiscono il traffico ai backend di archiviazione dei dati in varie regioni.
Routing basato sul livello 7 in un'applicazione web a tre livelli.
Routing basato sul livello 7 in un'applicazione web a tre livelli.

Accesso globale per i bilanciatori del carico delle applicazioni interni regionali

Se abiliti l'accesso globale per il bilanciatore del carico delle applicazioni interno regionale, le VM client di livello web possono trovarsi in un'altra regione.

Questo esempio di applicazione a più livelli mostra quanto segue:

  • Un livello web disponibile a livello globale e rivolto a internet che esegue il bilanciamento del carico del traffico utilizzando un bilanciatore del carico delle applicazioni esterno.
  • Un livello di database backend bilanciato del carico nella regione us-east1 a cui accede il livello web globale.
  • Una VM client che fa parte del livello web nella regione europe-west1 che accede al livello del database bilanciato interno in us-east1.
App web a tre livelli con un bilanciatore del carico delle applicazioni esterno, accesso globale e un bilanciatore del carico delle applicazioni interno.
App web a tre livelli con un bilanciatore del carico delle applicazioni esterno, accesso globale e un bilanciatore del carico delle applicazioni interno (fai clic per ingrandire).

Carichi di lavoro con conformità giurisdizionale

Alcuni carichi di lavoro con requisiti normativi o di conformità richiedono che le configurazioni di rete e la terminazione del traffico si trovino in una regione specifica. Per questi carichi di lavoro, un bilanciatore del carico delle applicazioni esterno regionale è spesso l'opzione preferita per fornire i controlli di giurisdizione richiesti da questi carichi di lavoro.

Gestione avanzata del traffico

Gli Application Load Balancer supportano funzionalità avanzate di gestione del traffico che ti consentono di avere un controllo granulare sulla modalità di gestione del traffico. Queste funzionalità includono:

  • Puoi aggiornare la modalità di gestione del traffico senza dover modificare il codice dell'applicazione.
  • Puoi instradare in modo intelligente il traffico in base ai parametri HTTP(S), ad esempio host, percorso, intestazioni e altri parametri di richiesta. Ad esempio, puoi utilizzare i bucket Cloud Storage per gestire i contenuti video statici e i gruppi di istanze o i NEG per gestire tutte le altre richieste.
  • Puoi ridurre i rischi durante il deployment di una nuova versione della tua applicazione utilizzando la suddivisione del traffico in base al peso. Ad esempio, puoi inviare il 95% del traffico alla versione precedente del servizio e il 5% alla nuova versione. Dopo aver verificato che la nuova versione funziona come previsto, puoi modificare gradualmente le percentuali fino a quando il 100% del traffico non raggiunge la nuova versione del servizio. La suddivisione del traffico viene in genere utilizzata per il deployment di nuove versioni, test A/B, migrazione dei servizi, modernizzazione dei servizi legacy e processi simili.

Di seguito è riportato un esempio di routing basato sul percorso implementato utilizzando un bilanciatore del carico delle applicazioni interno. Ogni percorso viene gestito da un backend diverso.

Routing basato su percorso con bilanciatori del carico delle applicazioni interni.
Routing basato su percorso con bilanciatori del carico delle applicazioni interni.

Per ulteriori dettagli, consulta quanto segue:

Estensibilità con Service Extensions

L'integrazione con le Estensioni di servizio consente di inserire logica personalizzata nel percorso di bilanciamento del carico dei bilanciatori del carico delle applicazioni supportati.

Per ulteriori informazioni, consulta la panoramica delle Estensioni di servizio.

Migrazione dei servizi legacy a Google Cloud

La migrazione di un servizio esistente a Google Cloud ti consente di liberare la capacità on-premise e ridurre il costo e l'onere della manutenzione di un'infrastruttura on-premise. Puoi configurare temporaneamente un deployment ibrido che ti consenta di instradare il traffico sia al tuo attuale servizio on-premise sia a un endpoint del servizio Google Cloud corrispondente.

Il seguente diagramma mostra questa configurazione con un bilanciatore del carico delle applicazioni interno. Se utilizzi un bilanciatore del carico interno, puoi configurare il bilanciatore del carico di Google Cloud in modo che utilizzi la suddivisione del traffico in base al peso per suddividere il traffico tra i due servizi. La suddivisione del traffico ti consente di iniziare inviando lo 0% del traffico al servizio Google Cloud e il 100% al servizio on-premise. Puoi quindi aumentare gradualmente la proporzione di traffico inviato al servizio Google Cloud. Alla fine, invii il 100% del traffico al servizio Google Cloud e puoi ritirare il servizio on-premise.

Esegui la migrazione dei servizi legacy a Google Cloud.
Esegui la migrazione dei servizi precedenti a Google Cloud.

Bilanciamento del carico per le applicazioni GKE

Esistono tre modi per eseguire il deployment di bilanciatori del carico delle applicazioni per i cluster GKE:

Load balancing per Cloud Run, funzioni Cloud Run e applicazioni App Engine

Puoi utilizzare un bilanciatore del carico delle applicazioni come frontend per le tue applicazioni serverless Google Cloud. In questo modo puoi configurare le tue applicazioni serverless in modo che gestiscano le richieste da un indirizzo IP dedicato non condiviso con altri servizi.

Per configurare questa opzione, utilizza un NEG serverless come backend del bilanciatore del carico. I seguenti diagrammi mostrano come un'applicazione serverless viene integrata con un bilanciatore del carico delle applicazioni.

Esterno globale

Questo diagramma mostra come un NEG serverless si inserisce in un'architettura di bilanciatore del carico delle applicazioni esterno globale.

Architettura del bilanciatore del carico delle applicazioni esterno globale per le app serverless.
Architettura del bilanciatore del carico delle applicazioni esterno globale per le app serverless.

Esterno regionale

Questo diagramma mostra come un NEG serverless si inserisce in un'architettura di bilanciatore del carico delle applicazioni esterno regionale. Questo bilanciatore del carico supporta solo i backend Cloud Run.

Architettura del bilanciatore del carico delle applicazioni esterno regionale per le app serverless.
Architettura del bilanciatore del carico delle applicazioni esterno regionale per le app serverless.

Interno a livello di regione

Questo diagramma mostra come un NEG serverless si inserisce nel modello di bilanciatore del carico delle applicazioni interno regionale. Questo bilanciatore del carico supporta solo i backend Cloud Run.

Architettura del bilanciatore del carico delle applicazioni interno regionale per le app serverless.
Architettura del bilanciatore del carico delle applicazioni interno regionale per le app serverless.

Interno tra regioni

Questo diagramma mostra come un gruppo di errori serverless si inserisce nel modello di bilanciatore del carico delle applicazioni interno tra regioni. Questo bilanciatore del carico supporta solo i backend Cloud Run.

Architettura del bilanciatore del carico delle applicazioni interno tra regioni per le app serverless.
Architettura del bilanciatore del carico delle applicazioni interno tra regioni per le app serverless (fai clic per ingrandire).

Documentazione correlata:

Bilanciamento del carico verso backend esterni a Google Cloud

I bilanciatori del carico delle applicazioni supportano il bilanciamento del carico del traffico verso endpoint che vanno oltre Google Cloud, come data center on-premise e altri ambienti cloud. I backend esterni sono in genere accessibili in uno dei seguenti modi:

  • Accessibile tramite la rete internet pubblica. Per questi endpoint, utilizza un NEG internet come backend del bilanciatore del carico. Il NEG internet è configurato per indicare un singolo endpoint FQDN:porta o IP:porta sul backend esterno. I NEG internet possono essere globali o regionali.

    Il seguente diagramma mostra come connettersi a backend esterni accessibili tramite la rete internet pubblica utilizzando un NEG internet globale.

    Bilanciatore del carico delle applicazioni esterno globale con un backend esterno.
    Bilanciatore del carico delle applicazioni esterno globale con un backend esterno.

    Per ulteriori dettagli, consulta la panoramica dei NEG di internet.

  • Accessibile tramite connettività ibrida (Cloud Interconnect o Cloud VPN). Per questi endpoint, utilizza un NEG ibrido come backend del bilanciatore del carico. Il NEG ibrido è configurato in modo da puntare agli endpoint IP:Port sul backend esterno.

    I seguenti diagrammi mostrano come connettersi ai backend esterni accessibili utilizzando Cloud Interconnect o Cloud VPN.

    Esterno

    Connettività ibrida con bilanciatori del carico delle applicazioni esterni globali.
    Connettività ibrida con bilanciatori del carico delle applicazioni esterni globali.

    Interno

    Connettività ibrida con bilanciatori del carico delle applicazioni interni.
    Connettività ibrida con bilanciatori del carico delle applicazioni interni.

    Per maggiori dettagli, consulta la panoramica delle NEG ibride.

Integrazione con Private Service Connect

Private Service Connect consente il consumo privato di servizi su reti VPC appartenenti a gruppi, team, progetti o organizzazioni diversi. Puoi utilizzare Private Service Connect per accedere ad API e servizi Google o a servizi gestiti in un'altra rete VPC.

Puoi utilizzare un bilanciatore del carico delle applicazioni esterno globale per accedere ai servizi pubblicati utilizzando Private Service Connect. Per saperne di più, consulta Informazioni sui backend di Private Service Connect.

Puoi utilizzare un bilanciatore del carico delle applicazioni interno per inviare richieste alle API e ai servizi Google regionali supportati. Per ulteriori informazioni, vedi Accedere alle API di Google tramite i backend.

Alta disponibilità e failover tra regioni

Il failover tra regioni è disponibile solo con bilanciatori del carico delle applicazioni esterni globali, bilanciatori del carico delle applicazioni classici e bilanciatori del carico delle applicazioni interni tra regioni. Questi bilanciatori del carico ti consentono di migliorare la disponibilità del servizio quando crei servizi di backend globali con backend in più regioni. Se i backend di una determinata regione non sono attivi, il traffico viene trasferito in modo corretto a un'altra regione.

Per scoprire di più su come funziona il failover, consulta i seguenti argomenti: