Panoramica della gestione del traffico per i bilanciatori del carico delle applicazioni interni

I bilanciatori del carico delle applicazioni interni regionali e i bilanciatori del carico delle applicazioni interni tra regioni supportano le seguenti funzionalità avanzate di gestione del traffico:
  • Svoltare il traffico. Instrada il traffico in modo intelligente in base ai parametri HTTP(S) (ad ad esempio host, percorso, intestazioni e altri parametri di richiesta).
  • Azioni di traffico. Esegui azioni basate su richieste e risposte (ad esempio reindirizzamenti e trasformazioni di intestazioni).
  • Norme sul traffico. Ottimizzare il comportamento del bilanciamento del carico (ad esempio, algoritmi di bilanciamento del carico avanzati).

Puoi configurare queste funzionalità utilizzando le mappe URL e i servizi di backend. Per ulteriori informazioni, consulta i seguenti argomenti:

Esempi di casi d'uso

La gestione del traffico risponde a molti casi d'uso. Questa sezione fornisce alcuni esempi di alto livello.

Indirizzamento del traffico: routing basato su intestazioni

L'indirizzamento del traffico ti consente di indirizzare il traffico alle istanze di servizio in base Parametri HTTP come le intestazioni delle richieste. Ad esempio, se il dispositivo di un utente è un dispositivo mobile con user-agent:Mobile nell'intestazione della richiesta, la gestione del traffico può inviare questo traffico alle istanze di servizio designate per gestire il traffico mobile e inviare il traffico che non ha user-agent:Mobile alle istanze designate per gestire il traffico da altri dispositivi.

Indirizzamento del traffico di Cloud Load Balancing.
Figura 1. Indirizzamento del traffico di Cloud Load Balancing (fai clic per ingrandire).

Azioni di traffico: suddivisione del traffico in base alla ponderazione

Il deployment di una nuova versione di un servizio di produzione esistente in genere comporta ai rischi. Anche se i test superano la fase di gestione temporanea, probabilmente non vorrai sottoporre il 100% dei tuoi utenti alla nuova versione immediatamente. Con la gestione del traffico, puoi definire suddivisioni del traffico in base alla percentuale su più servizi di backend.

Ad esempio, puoi inviare il 95% del traffico alla versione precedente del servizio e il 5% alla nuova versione. Dopo aver convalidato la nuova versione di produzione funzioni come previsto, puoi spostare gradualmente percentuali finché il 100% del traffico raggiunge la nuova versione del servizio. La suddivisione del traffico viene in genere utilizzata per il deployment di nuove versioni, i test A/B, la migrazione dei servizi e processi simili.

Suddivisione del traffico di Cloud Load Balancing.
Figura 2. Suddivisione del traffico di Cloud Load Balancing (fai clic per ingrandire).

Criteri di traffico: mirroring delle richieste

La tua organizzazione potrebbe avere requisiti di conformità specifici che richiedono che tutto il traffico venga sottoposto a mirroring in un servizio aggiuntivo che possa, ad esempio, registrare i dettagli della richiesta in un database per la riproduzione successiva.

Estensibilità con Service Extensions

I callout di Service Extensions ti consentono di inserire logica personalizzata nel percorso dei dati con bilanciamento del carico. Queste estensioni ti consentono di istruire i bilanciatori del carico delle applicazioni supportati a effettuare chiamate gRPC ad applicazioni o servizi gestiti dall'utente durante l'elaborazione dei dati.

Per ulteriori informazioni, consulta la panoramica di Service Extensions.

Componenti di gestione del traffico

A livello generale, i bilanciatori del carico consentono di gestire il traffico sfruttando mappe URL a livello di regione e servizi di backend regionali Google Cloud.

Per i bilanciatori del carico delle applicazioni interni tra regioni, la gestione del traffico utilizza le risorse mappe URL globali e servizi di backend globali.

Puoi configurare lo smistamento del traffico e le azioni di traffico utilizzando le mappe URL. Le risorse Google Cloud associate alle mappe URL includono seguenti:

  • Regola di route
  • Corrispondenza regola
  • Azione regola

Puoi configurare i criteri relativi al traffico utilizzando i servizi di backend. Le risorse Google Cloud associate ai servizi di backend include:

  • Interruttori di sicurezza
  • Criterio del bilanciatore del carico della località
  • Impostazioni del bilanciatore del carico con hashing coerente
  • Rilevamento outlier

Il seguente diagramma mostra le risorse utilizzate per implementare ogni funzionalità.

Modello di dati di Cloud Load Balancing.
Figura 3. Modello di dati di Cloud Load Balancing (fai clic per ingrandire).

Routing delle richieste ai backend

Nei bilanciatori del carico delle applicazioni interni regionali, viene determinato il backend per il traffico con un approccio in due fasi:

  • Il bilanciatore del carico seleziona un servizio di backend con backend. I backend possono essere le istanze di macchine virtuali (VM) Compute Engine in un gruppo di istanze non gestite VM di Compute Engine in un gruppo di istanze gestite o container di un nodo Google Kubernetes Engine (GKE) in un gruppo di endpoint di rete (NEG). Il bilanciatore del carico sceglie un servizio di backend in base alle regole definite in un mappa di URL a livello di regione.
  • Il servizio di backend seleziona un'istanza di backend in base ai criteri definiti in un servizio di backend regionale.

Quando configuri il routing, puoi scegliere tra le seguenti modalità:

  • Regola semplice per host e percorso
  • Regola avanzata per host, percorso e route

Le due modalità si escludono a vicenda. Ogni URL mappa può contenere solo una modalità o l'altra.

Regola semplice per host e percorso

In una regola host e percorso semplice, le mappe URL funzionano come descritto nella sezione Mappa URL Panoramica.

Il seguente diagramma mostra il flusso logico di una regola host e percorso semplice.

Flusso della mappa URL con una regola host e percorso semplice.
Figura 4. Flusso della mappa degli URL con una semplice regola host e per il percorso (fai clic per ingrandire).

Una richiesta viene valutata inizialmente utilizzando le regole dell'host. Un host è il dominio specificato dalla richiesta. Se la richiesta host corrisponde a una delle voci nel campo hosts, viene utilizzato il matcher del percorso associato.

Successivamente, viene valutato il corrispettivo del percorso. Le regole percorso vengono valutate long-path-matches-first ed è possibile specificare le regole di percorso in qualsiasi ordine. Una volta trovata la corrispondenza più specifica, la richiesta viene indirizzata al dal servizio di backend corrispondente. Se la richiesta non corrisponde, viene utilizzato il servizio di backend predefinito.

Una tipica regola host e percorso semplice potrebbe essere simile alla seguente, dove il traffico video viene indirizzato a video-backend-service, mentre tutto il resto del traffico viene indirizzato web-backend-service.

gcloud compute url-maps describe lb-map
defaultService: regions/us-west1/backendServices/web-backend-service
hostRules:
- hosts:
  - '*'
  pathMatcher: pathmap
name: lb-map
pathMatchers:
- defaultService: regions/us-west1/backendServices/web-backend-service
  name: pathmap
  pathRules:
  - paths:
    - /video
    - /video/*
    service: regions/us-west1/backendServices/video-backend-service
region: regions/us-west1

Regola avanzata per host, percorso e route

Le regole avanzate per host, percorso e route offrono opzioni di configurazione aggiuntive rispetto alle regole semplici per host e percorso. Queste opzioni consentono di attivare modelli di gestione del traffico e anche modificare parte della semantica. Ad esempio, le regole di route hanno un valore di priorità associato e vengono interpretate in ordine di priorità (anziché utilizzando la semantica della corrispondenza del percorso più lungo in primo luogo).

Come nell'esempio precedente di regola semplice per host e percorso, puoi configurare la gestione avanzata del traffico utilizzando una mappa URL. Ad esempio, La mappa URL configura il routing in cui il 95% del traffico viene instradato a un backend e il 5% del traffico viene instradato a un altro servizio di backend.

gcloud compute url-maps describe lb-map
defaultService: regions/us-west1/backendServices/service-a
hostRules:
- hosts:
  - '*'
  pathMatcher: matcher1
name: lb-map
pathMatchers:
- defaultService: regions/us-west1/backendServices/service-a
  name: matcher1
  routeRules:
  - matchRules:
    - prefixMatch: ''
    routeAction:
      weightedBackendServices:
      - backendService: regions/us-west1/backendServices/service-a
        weight: 95
      - backendService: regions/us-west1/backendServices/service-b
        weight: 5
region: regions/us-west1

Regole host

Quando una richiesta raggiunge il bilanciatore del carico, il campo host della richiesta viene valutato in base al valore hostRules definito nella mappa URL. Ogni regola host consiste in un elenco di uno o più host e un matcher di percorso singolo (pathMatcher). Se non viene definito alcun hostRules, la richiesta viene indirizzata al defaultService.

Per ulteriori informazioni, consulta hostRules[] e defaultService nella documentazione dell'API mappa degli URL regionali.

Matcher percorso

Quando una richiesta corrisponde a una regola host, il bilanciatore del carico valuta matcher di percorso corrispondente all'host.

Un matcher di percorso è costituito da:

  • Una o più regole di percorso (pathRules) o regole di route (routeRules).
  • Un servizio predefinito (defaultService), che è il servizio predefinito. di servizio di backend utilizzato quando non esistono altri servizi di backend corrispondenti.
Per ulteriori informazioni, vedi pathMatchers[], pathMatchers[].pathRules[] e pathMatchers[].routeRules[] nell'API della mappa URL regionale documentazione.

Regole percorso

Le regole percorso (pathRules) specificano uno o più percorsi dell'URL, ad esempio / o /video. Le regole percorso sono in genere destinate al tipo di routing semplice basato su host e percorso descritto in precedenza.

Per ulteriori informazioni, consulta pathRules[] nella documentazione dell'API mappa degli URL regionali.

Regole di route

Una regola di routing (routeRules) associa le informazioni di una richiesta in entrata e prende una decisione di routing in base alla corrispondenza.

Le regole di routing possono contenere una serie di regole di corrispondenza (matchRules) e di azioni di routing (routeAction) diverse.

Una regola di corrispondenza valuta la richiesta in arrivo in base al percorso, alle intestazioni e ai parametri di query della richiesta HTTP(S). Le regole di corrispondenza supportano vari tipi di corrispondenze (ad es. la corrispondenza del prefisso), così come i modificatori (ad es. insensibilità). In questo modo, ad esempio, puoi inviare richieste HTTP(S) a un insieme di backend in base alla presenza di un'intestazione HTTP definita in base alle tue esigenze.

Nota: le opzioni di corrispondenza e la semantica variano a seconda della parte della richiesta che che corrisponderai. Per ulteriori informazioni, consulta matchRules[] nella documentazione dell'API mappa degli URL regionali.

Se hai più regole di route, il bilanciatore del carico le esegue in ordine di priorità (in base al campo priority), il che ti consente di specificare una logica personalizzata per la corrispondenza, il routing e altre azioni.

All'interno di una determinata regola di route, quando viene eseguita la prima corrispondenza, il bilanciatore del carico interrompe la valutazione delle regole di corrispondenza e le eventuali regole di corrispondenza rimanenti vengono ignorate.

Google Cloud esegue le seguenti azioni:

  1. Cerca la prima regola di corrispondenza che corrisponde alla richiesta.
  2. Interrompe la ricerca di altre regole di corrispondenza.
  3. Applica le azioni nelle azioni route corrispondenti.

Le regole di routing hanno diversi componenti, come descritto nella tabella seguente.

Componente regola percorso (API field name) Descrizione
Priorità (priority) Un numero compreso tra 0 e 2147483647 (ovvero (2^31)-1) assegnato a una regola di route all'interno di un determinato matcher percorso.

La priorità determina l'ordine di valutazione delle regole di route. La priorità di una regola diminuisce quando il suo numero aumenta, quindi che una regola con priorità 4 venga valutata prima di una regola con priorità 25. Viene applicata la prima regola corrispondente alla richiesta.

I numeri di priorità possono avere spazi. Non puoi creare più di una regola con la stessa priorità.
Descrizione (description) Una descrizione facoltativa di massimo 1024 caratteri.
Servizio (service) L'URL completo o parziale della risorsa del servizio di backend verso la quale il traffico in caso di corrispondenza con questa regola.
Regole di corrispondenza (matchRules) Una o più regole valutate in base alla richiesta. Questi matchRules possono corrispondere a tutti o a un sottoinsieme degli attributi HTTP della richiesta, ad esempio il percorso, le intestazioni HTTP e i parametri di query (GET).

All'interno di un matchRule, tutti i criteri corrispondenti deve essere soddisfatto affinché routeActions di routeRule hanno effetto. Se un routeRule ha più matchRules, il routeActions del routeRule vengono applicati quando una richiesta corrisponde a uno degli matchRules di routeRule.
Azione route (routeAction) Ti consente di specificare quali azioni da prendere quando i criteri della regola di corrispondenza sono soddisfatti. Queste azioni includono la suddivisione del traffico, le riscritture degli URL, i tentativi e mirroring, fault injection e criteri CORS.
Azione di reindirizzamento (urlRedirect) Puoi configurare un'azione per rispondere con un reindirizzamento HTTP quando i criteri della regola di corrispondenza sono soddisfatti. Questo campo non può essere utilizzato insieme con un'azione di route.
Azione intestazione (headerAction) Puoi configurare le regole di trasformazione dell'intestazione della richiesta e della risposta quando i criteri in matchRules sono soddisfatti.
Per ulteriori informazioni, consulta i seguenti campi nella documentazione dell'API mappa URL a livello di regione:
  • routeRules[]
  • routeRules[].priority
  • routeRules[].description
  • routeRules[].service
  • routeRules[].matchRules[]
  • routeRules[].routeAction
  • routeRules[].urlRedirect
  • routeRules[].headerAction

Regole delle corrispondenze

Le regole di corrispondenza (matchRules) corrispondono a uno o più attributi di una richiesta e prendono azioni specificate nella regola di route. Il seguente elenco fornisce alcuni esempi di attributi delle richieste che possono essere abbinati utilizzando le regole di corrispondenza:

  • Host: un nome host è la parte del nome di dominio di un URL. ad esempio la parte del nome host dell'URL http://example.net/video/hd è example.net. Nella richiesta, il nome host proviene dall'intestazione Host, come mostrato in questo comando curl di esempio, dove 10.1.2.9 è il bilanciamento del carico Indirizzo IP:

    curl -v http://10.1.2.9/video/hd --header 'Host: example.com'
    
  • I percorsi seguono il nome host; ad esempio /images. La regola può specificare se deve corrispondere l'intero percorso o solo la parte iniziale.

  • Altri parametri di richiesta HTTP, ad esempio le intestazioni HTTP, che consentono i cookie così come i parametri di ricerca (variabili GET).

Per un elenco completo delle regole di corrispondenza supportate, consulta: pathMatchers[].routeRules[].matchRules[] nell'API della mappa URL a livello di regione documentazione.

Azioni route

Le azioni di routing sono azioni specifiche da eseguire quando una regola di routing corrisponde agli attributi di una richiesta.

Azione route (API field name) Descrizione
Reindirizzamenti (urlRedirect) Restituisce un 3xx configurabile codice di risposta. Imposta inoltre l'intestazione di risposta Location con l'URI appropriato, sostituendo l'host e il percorso come specificato nell'azione di reindirizzamento.
Riscrivi URL (urlRewrite) Riscrivi la parte del nome host dell'URL, la parte del percorso dell'URL o entrambe prima di inviare una richiesta al servizio di backend selezionato.
Trasformazioni dell'intestazione (headerAction) Aggiunge o rimuove le intestazioni delle richieste prima di inviare una richiesta al servizio di backend. Può anche aggiungere o rimuovere le intestazioni di risposta dopo aver ricevuto una risposta dal servizio di backend.
Mirroring del traffico (requestMirrorPolicy)

Oltre a inoltrare la richiesta al servizio di backend selezionato, invia una richiesta identica al servizio di backend mirror configurato su una base fire and forget. Il bilanciatore del carico non attende una risposta dal backend a cui invia la richiesta sottoposta a mirroring.

Il mirroring è è utile per testare una nuova versione di un servizio di backend. Puoi anche utilizzarlo per eseguire il debug degli errori di produzione su una versione di debug del servizio di backend, anziché sulla versione di produzione.

Tieni presente le seguenti limitazioni quando utilizzi il mirroring del traffico:

  • Il mirroring del traffico è supportato quando entrambi i servizi di backend hanno backend di gruppi di istanze gestite, NEG a livello di zona o NEG ibridi. Non è supportato per NEG internet, NEG serverless e Private Service Connect di backend.
  • Le richieste al servizio di backend con mirroring non generano log per Cloud Logging e Cloud Monitoring.
Suddivisione del traffico ponderata (weightedBackendServices) Consente di distribuire il traffico per una regola corrispondente a più servizi di backend, in proporzione a un peso definito dall'utente assegnato al singolo servizio di backend.

Questa funzionalità è utile per configurare implementazioni pianificate o test A/B. Ad esempio, l'azione di routing potrebbe essere configurate in modo che il 99% del traffico venga inviato a un servizio una versione stabile di un'applicazione, mentre l'1% del traffico a un servizio separato che esegue una versione più recente dell'applicazione.
Nuovi tentativi (retryPolicy)

Configura le condizioni in cui i nuovi tentativi del bilanciatore del carico non sono riusciti richieste, quanto tempo attende il bilanciatore del carico prima di riprovare il numero massimo di nuovi tentativi consentiti.

Timeout (timeout) Specifica il timeout per la route selezionata. Il timeout viene calcolato da dal momento in cui la richiesta viene completamente elaborata fino al momento in cui la risposta viene elaborata completamente. Il timeout include tutti i nuovi tentativi.
Fault injection (faultInjectionPolicy) Introduce gli errori durante la gestione delle richieste per simulare gli errori, tra cui latenza elevata, sovraccarico del servizio, errori del servizio e partizionamento della rete. Questa funzionalità è utile per testare la resilienza di un servizio ai guasti simulati.
Iniezione ritardata (faultInjectionPolicy) Introducono ritardi per un modello definito dall'utente delle richieste prima di inviare la richiesta al backend selezionato completamente gestito di Google Cloud.
Interrompi inserimento (faultInjectionPolicy) Risponde direttamente a una frazione di richieste con codici di stato HTTP definiti dall'utente invece di inoltrarle richieste al servizio di backend.
Criteri di sicurezza (corsPolicy) Gestione dei criteri di condivisione delle risorse tra origini (CORS) impostazioni per l'applicazione delle richieste CORS.

Puoi specificare una delle seguenti azioni di route:

  • Instrada il traffico a un singolo servizio (service).
  • Suddividi il traffico tra più servizi (weightedBackendServices weight:x, dove x deve essere compreso tra 0 e 1000).
  • URL di reindirizzamento (urlRedirect).

Inoltre, puoi combinare una delle azioni di route menzionate in precedenza con una o più delle seguenti azioni di route:

  • Esegui il mirroring del traffico (requestMirrorPolicy).
  • Riscrivi l'host e il percorso dell'URL (urlRewrite).
  • Riprova le richieste non riuscite (retryPolicy).
  • Imposta timeout (timeout).
  • Introduci gli errori a una percentuale del traffico (faultInjectionPolicy).
  • Aggiungi il criterio CORS (corsPolicy).
  • Manipolare le intestazioni della richiesta o della risposta (headerAction).
Per ulteriori informazioni sulla configurazione e sulla semantica delle azioni di route, consulta nel riquadro documentazione relativa all'API della mappa degli URL a livello di regione:
  • urlRedirect
  • urlRewrite
  • headerAction
  • requestMirrorPolicy
  • weightedBackendServices
  • retryPolicy
  • timeout
  • faultInjectionPolicy
  • corsPolicy

Reindirizzamenti da HTTP a HTTPS

Se devi reindirizzare il traffico HTTP a HTTPS, puoi creare due regole di forwarding con un indirizzo IP comune.

Affinché due regole di forwarding condividano lo stesso indirizzo IP interno, devi prenota l'indirizzo IP e includi il flag --purpose=SHARED_LOADBALANCER_VIP:

gcloud compute addresses create NAME \
    --region=us-west1 \
    --subnet=backend-subnet \
    --purpose=SHARED_LOADBALANCER_VIP

Per un esempio completo, consulta Configurare il reindirizzamento da HTTP a HTTPS per bilanciatori del carico delle applicazioni interni.

Criteri di traffico

Utilizzando le risorse del servizio di backend, puoi configurare i criteri di traffico ottimizza il bilanciamento del carico all'interno di un gruppo di istanze o di un endpoint di rete (NEG). Questi criteri vengono applicati solo dopo che è stato selezionato un servizio di backend utilizzando la mappa URL (come descritto in precedenza).

I criteri di traffico ti consentono di:

  • Controlla l'algoritmo di bilanciamento del carico tra le istanze all'interno del backend completamente gestito di Google Cloud.
  • Controlla il volume delle connessioni a un servizio a monte.
  • Controlla l'eliminazione di host non integri da un servizio di backend.
Le seguenti funzionalità dei criteri di traffico sono configurate nel backend regionale completamente gestito.
Criterio di traffico (API field name) Descrizione
Criterio di bilanciamento del carico per le località (LocalityLbPolicy)

Per un servizio di backend, la distribuzione del traffico si basa su una modalità di bilanciamento del carico e su un criterio di bilanciamento del carico per le località.

La modalità di bilanciamento determina il peso/la frazione di traffico che deve essere inviata a ciascun backend (gruppo di istanze o GCE_VM_IP_PORT NEG). Il criterio di bilanciamento del carico (LocalityLbPolicy) determina in che modo viene eseguito il bilanciamento del carico dei backend all'interno della zona o del gruppo. Quando un servizio di backend riceve il traffico, lo indirizza innanzitutto a un backend (gruppo di istanze o GCE_VM_IP_PORTNEG) in base alla modalità di bilanciamento del backend. Dopo aver selezionato un backend, il traffico viene distribuiti tra le istanze o gli endpoint all'interno di ciascuna zona i criteri relativi alla località. Per i gruppi di istanze gestite a livello di regione, il criterio di località si applica a ogni zona costituente.

Per le modalità di bilanciamento supportate, consulta Modalità di bilanciamento.

Per gli algoritmi dei criteri di bilanciamento del carico supportati, consulta localityLbPolicy nella documentazione dell'API del servizio di backend regionale.

Affinità sessione (consistentHash)

Sono incluse l'affinità basata sui cookie HTTP, l'affinità basata sulle intestazioni HTTP, l'affinità dell'indirizzo IP del client, l'affinità della sessione basata sui cookie stateful e l'affinità del cookie generato. L'affinità sessione fornisce un tentativo secondo il criterio del "best effort" per inviare richieste da un determinato client allo stesso backend finché il backend è integro e dispone di capacità.

Per ulteriori informazioni sull'affinità sessione, consulta consistentHash in regionale documentazione dell'API del servizio di backend.

Rilevamento outlier (outlierDetection)

Un insieme di criteri che specificano gli endpoint o le VM di backend non integri da estrarre nei NEG, insieme ai criteri che definiscono quando un backend o un endpoint è considerato sufficientemente integro per ricevere nuovamente il traffico.

Per saperne di più sul rilevamento di outlier, consulta outlierDetection in regionale documentazione dell'API del servizio di backend.

Interruttore di circuito (circuitBreakers)

Imposta limiti superiori per il volume di connessioni e richieste per connessione a un servizio di backend.

Per ulteriori informazioni sull'interruzione del circuito, consulta circuitBreakers nella documentazione dell'API del servizio di backend regionale.

Passaggi successivi