Présentation de l'équilibreur de charge d'application externe

Ce document présente les concepts que vous devez maîtriser pour configurer un équilibreur de charge d'application externe.

Un équilibreur de charge d'application externe est un équilibreur de charge de couche 7 basé sur un proxy qui vous permet d'exécuter et de faire évoluer vos services derrière une seule adresse IP externe. Un équilibreur de charge d'application externe répartit le trafic HTTP et HTTPS entre les backends hébergés sur diverses plates-formes Google Cloud (telles que Compute Engine, Google Kubernetes Engine (GKE), Cloud Storage, etc.), ainsi que les backends externes connectés à Internet ou via une connectivité hybride. Pour en savoir plus, consultez la section Présentation de l'équilibreur de charge d'application : cas d'utilisation.

Modes de fonctionnement

Vous pouvez configurer un équilibreur de charge d'application externe dans les modes suivants :

  • Équilibreur de charge d'application externe global. Il s'agit d'un équilibreur de charge global mis en œuvre en tant que service géré sur Google Front End (GFE). Il utilise le proxy Envoy Open Source pour prendre en charge des fonctionnalités avancées de gestion du trafic telles que la mise en miroir du trafic, la répartition du trafic en fonction du poids, les transformations d'en-tête basé sur les requêtes/réponses, etc.
  • Équilibreur de charge d'application classique. Il s'agit de l'équilibreur de charge d'application externe classique qui est global au niveau Premium, mais qui peut être configuré pour être régional au niveau Standard. Cet équilibreur de charge est mis en œuvre sur les serveurs GFE (Google Front End). Les GFE sont distribués dans le monde entier et fonctionnent conjointement grâce au réseau mondial et au plan de contrôle de Google.
  • Équilibreur de charge d'application externe régional. Il s'agit d'un équilibreur de charge régional mis en œuvre en tant que service géré sur le proxy Envoy Open Source. Il comprend des fonctionnalités avancées de gestion du trafic telles que la mise en miroir du trafic, la répartition du trafic en fonction d'une pondération, les transformations d'en-tête basées sur les requêtes/réponses, etc.
Mode d'équilibreur de charge Cas d'utilisation recommandés Capacités
Équilibreur de charge d'application externe global Utilisez cet équilibreur de charge pour les charges de travail HTTP(S) externes avec des utilisateurs ou des services de backend dans plusieurs régions.
Équilibreur de charge d'application classique

Cet équilibreur de charge est global au niveau Premium, mais peut être configuré pour être régional au niveau Standard.

Dans le niveau de service réseau Premium, cet équilibreur de charge offre un équilibrage de charge multirégional, tente de diriger le trafic vers le backend opérationnel le plus proche dont la capacité est suffisante, et termine le trafic HTTP(S) le plus près possible de vos utilisateurs. Pour en savoir plus sur le processus de distribution des requêtes, consultez la section Distribution du trafic.

Dans le niveau de service réseau standard, l'équilibrage de charge est traité au niveau régional.

  • Compatible avec GKE en utilisant un objet Gateway (entièrement orchestré), Ingress (entièrement orchestré) ou des NEG autonomes (orchestration manuelle).
  • Compatible avec Google Cloud Armor
  • Moins de fonctionnalités de routage du trafic
Consultez la page Fonctionnalités d'équilibrage de charge pour obtenir la liste complète des fonctionnalités.
Équilibreur de charge d'application externe régional

Cet équilibreur de charge contient de nombreuses fonctionnalités de l'équilibreur de charge d'application classique existant, ainsi que des fonctionnalités supplémentaires de gestion avancée du trafic.

Utilisez cet équilibreur de charge si vous souhaitez diffuser du contenu à partir d'une seule géolocalisation (par exemple, pour respecter les réglementations de conformité).

Cet équilibreur de charge peut être configuré en niveau Premium ou Standard.

Pour obtenir la liste complète, consultez la section Fonctionnalités d'équilibrage de charge.

Identifier le mode

console Cloud

  1. Dans Google Cloud Console, accédez à la page Équilibrage de charge.
    Accéder à la page "Équilibrage de charge"
  2. Dans l'onglet Équilibreurs de charge, le type, le protocole et la région de l'équilibreur de charge sont affichés. Si la région est vide, l'équilibreur de charge est global. Le tableau suivant récapitule comment identifier le mode de l'équilibreur de charge.

    Mode d'équilibreur de charge Type d'équilibreur de charge Type d'accès Région
    Équilibreur de charge d'application externe global Application Externe
    Équilibreur de charge d'application classique Application (classique) Externe
    Équilibreur de charge d'application externe régional Application Externe Spécifie une région

gcloud

  1. Pour déterminer le mode d'un équilibreur de charge, exécutez la commande suivante :

    gcloud compute forwarding-rules describe FORWARDING_RULE_NAME
    

    Dans le résultat de la commande, vérifiez le schéma d'équilibrage de charge, la région et le niveau de réseau. Le tableau suivant récapitule comment identifier le mode de l'équilibreur de charge.

    Mode d'équilibreur de charge Schéma d'équilibrage de charge Règle de transfert Niveau de réseau
    Équilibreur de charge d'application externe global EXTERNAL_MANAGED Monde Premium
    Équilibreur de charge d'application classique EXTERNAL Monde Standard ou Premium
    Équilibreur de charge d'application externe régional EXTERNAL_MANAGED Spécifie une région Standard ou Premium

Architecture

Les ressources suivantes sont requises pour déployer un équilibreur de charge d'application externe :

  • Pour les équilibreurs de charge d'application externes régionaux, un sous-réseau proxy réservé est utilisé pour envoyer des connexions depuis l'équilibreur de charge vers les backends.

  • Une règle de transfert externe spécifie une adresse IP externe, un port et un proxy HTTP(S) cible mondial. Les clients utilisent l'adresse IP et le port pour se connecter à l'équilibreur de charge.

  • Un proxy HTTP(S) cible reçoit une requête du client. Le proxy HTTP(S) évalue la requête à l'aide du mappage d'URL pour prendre des décisions d'acheminement du trafic. Le proxy peut également authentifier les communications avec des certificats SSL.

    • Pour l'équilibrage de charge HTTPS, le proxy HTTPS cible prouve son identité aux clients à l'aide de certificats SSL. Un proxy HTTP(S) cible accepte un nombre limité de certificats SSL.
  • Le proxy HTTP(S) exploite un mappage d'URL mondial pour déterminer le routage en fonction d'attributs HTTP (chemin de requête, cookies ou en-têtes, par exemple). En s'appuyant sur le routage choisi, le proxy transmet les requêtes des clients à des services de backend ou des buckets backend spécifiques. Le mappage d'URL peut spécifier des actions supplémentaires, telles que l'envoi de redirections à des clients.

  • Un service de backend répartit les requêtes entre les backends opérationnels. Les équilibreurs de charge d'application externes globaux sont également compatibles avec les buckets backend.

    • Un ou plusieurs backends doivent être connectés au service de backend ou au bucket backend.
  • Une vérification d'état surveille régulièrement la disponibilité de vos backends. Cela réduit le risque que des requêtes soient envoyées à des backends ne pouvant pas les traiter.

  • Règles de pare-feu pour que vos backends acceptent les vérifications d'état. Les équilibreurs de charge d'application externes régionaux nécessitent une règle de pare-feu supplémentaire pour autoriser le trafic provenant du sous-réseau proxy réservé à atteindre les backends.

Monde

Ce schéma montre les composants d'un déploiement de l'équilibreur de charge d'application externe global. Cette architecture s'applique à la fois à l'équilibreur de charge d'applications externe global et à l'équilibreur de charge d'application classique au niveau Premium.

Composants de l'équilibreur de charge d'application externe global
Composants de l'équilibreur de charge d'application externe global

Régional

Ce schéma montre les composants d'un déploiement d'équilibreur de charge d'application externe régional.

Composants de l'équilibreur de charge d'application externe régional
Composants de l'équilibreur de charge d'application externe régional

Sous-réseau proxy réservé

Les sous-réseaux proxy réservés ne sont requis que pour les équilibreurs de charge d'application externes régionaux.

Le sous-réseau proxy réservé fournit un ensemble d'adresses IP utilisées par Google pour exécuter des proxys Envoy en votre nom. Vous devez créer un sous-réseau proxy réservé dans chaque région du réseau VPC dans lequel vous utilisez des équilibreurs de charge d'application externes régionaux. L'option --purpose pour ce sous-réseau proxy réservé est définie sur REGIONAL_MANAGED_PROXY. Tous les équilibreurs de charge régionaux basés sur Envoy dans la même région et le même réseau VPC partagent un pool de proxys Envoy du même sous-réseau proxy réservé. En outre :

  • Les sous-réseaux proxy réservés ne sont utilisés que pour les proxys Envoy, et non pour vos backends.
  • Les VM de backend ou les points de terminaison de tous les équilibreurs de charge d'application externes régionaux d'une région et d'un réseau VPC reçoivent les connexions du sous-réseau proxy réservé.
  • L'adresse IP de l'équilibreur de charge d'application externe régional n'est pas située dans le sous-réseau proxy réservé. L'adresse IP de l'équilibreur de charge est définie par sa règle de transfert gérée en externe et décrite ci-dessous.

Si vous avez déjà créé un sous-réseau proxy réservé avec --purpose=INTERNAL_HTTPS_LOAD_BALANCER, vous devez migrer l'objectif du sous-réseau vers REGIONAL_MANAGED_PROXY avant de pouvoir créer d'autres équilibreurs de charge basés sur Envoy dans la même région du réseau VPC.

Règles de transfert et adresses

Les règles de transfert permettent d'acheminer le trafic par adresse IP, port et protocole vers une configuration d'équilibrage de charge comprenant un proxy cible et un ou plusieurs services de backend.

Chaque règle de transfert fournit une adresse IP unique que vous pouvez utiliser dans les enregistrements DNS relatifs à votre application. Aucun équilibrage de charge DNS n'est requis. Vous pouvez soit spécifier une adresse IP qui sera utilisée par le service, soit laisser Cloud Load Balancing en attribuer une.

Chaque règle de transfert d'un équilibreur de charge d'application peut référencer un port unique compris entre 1 et 65 535. Pour accepter plusieurs ports, vous devez configurer plusieurs règles de transfert. Vous pouvez configurer plusieurs règles de transfert pour utiliser la même adresse IP interne (VIP) et référencer le même proxy HTTP(S) cible tant que la combinaison globale de l'adresse IP, du port et du protocole sont uniques pour chaque règle de transfert. Vous pouvez ainsi utiliser un seul équilibreur de charge avec un mappage d'URL partagé en tant que proxy pour plusieurs applications.

Le type de règle de transfert, d'adresse IP et de schéma d'équilibrage de charge utilisé par les équilibreurs de charge d'application externes dépend du mode de l'équilibreur de charge et du niveau de service réseau de l'équilibreur de charge.

Mode d'équilibreur de charge Niveau de service réseau Schéma de règle de transfert, adresse IP et équilibrage de charge Routage depuis Internet vers l'interface de l'équilibreur de charge
Équilibreur de charge d'application externe global Niveau Premium

Règle de transfert externe globale

Adresse IP externe globale

Schéma d'équilibrage de charge :
EXTERNAL_MANAGED

Requêtes acheminées vers le GFE le plus proche du client sur Internet.
Équilibreur de charge d'application classique Niveau Premium

Règle de transfert externe globale

Adresse IP externe globale

Schéma d'équilibrage de charge :
EXTERNAL

Requêtes acheminées vers le GFE le plus proche du client sur Internet.
Niveau Standard

Règle de transfert externe régionale

Adresse IP externe régionale

Schéma d'équilibrage de charge :
EXTERNAL

Requêtes acheminées vers un GFE dans la région de l'équilibreur de charge
Équilibreur de charge d'application externe régional Niveau Premium ou Standard

Règle de transfert externe régionale

Adresse IP externe régionale

Schéma d'équilibrage de charge :
EXTERNAL_MANAGED

Requêtes acheminées vers les proxys Envoy de la même région que l'équilibreur de charge.

Pour obtenir la liste complète des protocoles compatibles avec les règles de transfert d'équilibreur de charge d'application externe dans chaque mode, consultez la page Fonctionnalités de l'équilibreur de charge.

Proxys cibles

Les proxys cibles interrompent les connexions HTTP(S) des clients. Une ou plusieurs règles de transfert dirigent le trafic vers le proxy cible, qui consulte le mappage d'URL pour déterminer comment acheminer le trafic vers les backends.

Ne vous attendez pas à ce que le proxy préserve la casse des noms dans les en-têtes de requête ou de réponse. Par exemple, un en-tête de réponse Server: Apache/1.0 peut se présenter sous la forme server: Apache/1.0 au niveau du client.

Le tableau suivant spécifie le type de proxy cible requis par les équilibreurs de charge d'application externes dans chaque mode.

Mode d'équilibreur de charge Types de proxys cibles En-têtes ajoutés par les proxys En-têtes personnalisés compatibles Compatibilité avec Cloud Trace
Équilibreur de charge d'application externe global HTTP mondial,
HTTPS mondial
Les proxys définissent les en-têtes de requête et de réponse HTTP comme suit :
  • Via: 1.1 google (requêtes et réponses)
  • X-Forwarded-Proto : [http | https] (requêtes uniquement)
  • X-Forwarded-For : [<supplied-value>,]<client-ip>,<load-balancer-ip> (voir l'en-tête X-Forwarded-For) (requêtes uniquement)

Les proxys peuvent également définir l'en-tête X-Cloud-Trace-Context.

Configuré sur le service de backend ou le bucket backend.

Non compatible avec Cloud CDN

Équilibreur de charge d'application classique HTTP mondial,
HTTPS mondial
Les proxys définissent les en-têtes de requête et de réponse HTTP comme suit :
  • Via: 1.1 google (requêtes et réponses)
  • X-Forwarded-Proto : [http | https] (requêtes uniquement)
  • X-Forwarded-For : [<supplied-value>,]<client-ip>,<load-balancer-ip> (voir l'en-tête X-Forwarded-For) (requêtes uniquement)

Les proxys peuvent également définir l'en-tête X-Cloud-Trace-Context.

Configuré sur le service de backend ou le bucket backend.
Équilibreur de charge d'application externe régional HTTP régional,
HTTPS régional
  • X-Forwarded-Proto : [http | https] (requêtes uniquement)
  • Via: 1.1 google (requêtes et réponses)
  • X-Forwarded-For : [<supplied-value>,]<client-ip>,<load-balancer-ip> (voir l'en-tête X-Forwarded-For) (requêtes uniquement)

En plus des en-têtes ajoutés par le proxy cible, l'équilibreur de charge ajuste certains autres en-têtes HTTP comme suit :

  • Pour l'équilibreur de charge d'application externe global, les en-têtes de requête et de réponse sont toujours convertis en minuscules. Par exemple, Host devient host et Keep-ALIVE devient keep-alive.

    La seule exception à cette règle s'applique lorsque vous utilisez des backends NEG Internet globaux avec HTTP/1.1. Pour en savoir plus sur le traitement des en-têtes HTTP/1.1 avec les NEG Internet globaux, consultez la présentation des NEG Internet.

  • Pour l'équilibreur de charge d'application classique, les en-têtes de requête et de réponse sont convertis en minuscules, sauf lorsque vous utilisez HTTP/1.1. Avec HTTP/1.1, les en-têtes sont traités comme des noms propres. La première lettre de la clé d'en-tête et chaque lettre suivant un trait d'union (-) sont mises en majuscule afin de préserver la compatibilité avec les clients HTTP/1.1. Par exemple, user-agent est remplacé par User-Agent, et content-encoding devient Content-Encoding.

  • Certains en-têtes sont fusionnés. Lorsqu'il existe plusieurs instances de la même clé d'en-tête (par exemple, Via), l'équilibreur de charge combine leurs valeurs dans une même liste d'éléments séparés par des virgules correspondant à une clé d'en-tête unique. Seuls les en-têtes dont les valeurs peuvent être représentées sous la forme d'une liste d'éléments séparés par des virgules sont fusionnés. Les autres en-têtes, tels que Set-Cookie, ne sont jamais fusionnés.

En-tête d'hôte

Lorsque l'équilibreur de charge effectue la requête HTTP, il conserve l'en-tête d'hôte de la requête d'origine.

En-tête "X-Forwarded-For"

L'équilibreur de charge ajoute deux adresses IP séparées par une seule virgule à l'en-tête X-Forwarded-For dans l'ordre suivant :

  • Adresse IP du client qui se connecte à l'équilibreur de charge
  • Adresse IP de la règle de transfert de l'équilibreur de charge

Si aucun en-tête X-Forwarded-For n'est présent dans la requête entrante, ces deux adresses IP correspondent à l'intégralité de la valeur d'en-tête :

X-Forwarded-For: <client-ip>,<load-balancer-ip>

Si la requête inclut un en-tête X-Forwarded-For, l'équilibreur de charge conserve la valeur fournie avant le <client-ip>,<load-balancer-ip> :

X-Forwarded-For: <supplied-value>,<client-ip>,<load-balancer-ip>

Lorsque vous exécutez un logiciel de proxy inverse HTTP sur les backends de l'équilibreur de charge, le logiciel peut ajouter l'une des adresses IP suivantes (ou les deux) à la fin de l'en-tête X-Forwarded-For :

  • L'adresse IP du service Google Front End (GFE) connecté au backend. Ces adresses IP se trouvent dans les plages 130.211.0.0/22 et 35.191.0.0/16.

  • L'adresse IP du système backend lui-même.

Ainsi, un processus en amont après le backend de votre équilibreur de charge peut recevoir un en-tête X-Forwarded-For au format :

<existing-values>,<client-ip>,<load-balancer-ip><GFE-IP><backend-IP>

Mappages d'URL

Les mappages d'URL définissent des correspondances de motifs pour l'acheminement de requêtes vers les services de backend adéquats en fonction de l'URL de la requête. Un service par défaut est défini pour gérer toute requête qui ne correspond pas à une règle d'hôte ou à une règle de correspondance de chemin donnée. Dans certains cas, comme celui décrit dans l'exemple d'équilibrage de charge multirégional, vous pouvez choisir de ne définir aucune règle d'URL et de vous appuyer seulement sur le service par défaut. Pour le routage des requêtes, le mappage d'URL vous permet de répartir votre trafic en examinant les composants d'URL pour envoyer des requêtes à différents ensembles de backends.

Les mappages d'URL utilisés avec les équilibreurs de charge d'application externes globaux et les équilibreurs de charge d'application externes régionaux sont compatibles avec plusieurs fonctionnalités de gestion avancée du trafic telles que l'orientation du trafic basée sur l'en-tête, la répartition du trafic en fonction d'une pondération et la mise en miroir des requêtes. Pour en savoir plus, consultez les ressources suivantes :

Le tableau suivant spécifie le type de mappage d'URL requis par les équilibreurs de charge d'application externes dans chaque mode.

Mode d'équilibreur de charge Type de mappage d'URL
Équilibreur de charge d'application externe global Global
Équilibreur de charge d'application classique Global (avec uniquement un sous-ensemble de fonctionnalités compatibles)
Équilibreur de charge d'application externe régional Regional (Régional)

Certificats SSL

Les équilibreurs de charge d'application externes utilisant des proxys HTTPS cibles nécessitent des clés privées et des certificats SSL dans la configuration de l'équilibreur de charge :

  • Google Cloud propose deux méthodes de configuration pour l'attribution de clés privées et de certificats SSL aux proxys HTTPS cibles : les certificats SSL Compute Engine et le gestionnaire de certificats. Pour obtenir une description de chaque configuration, consultez la section Méthodes de configuration des certificats dans la présentation des certificats SSL.

  • Google Cloud fournit deux types de certificats : les certificats autogérés et les certificats gérés par Google. Pour obtenir une description de chaque type, consultez la section Types de certificats dans la présentation des certificats SSL.

  • Le type d'équilibreur de charge d'application externe (global, régional ou classique) détermine les méthodes de configuration et les types de certificats compatibles. Pour en savoir plus, consultez la section Certificats et équilibreurs de charge Google Cloud dans la présentation des certificats SSL.

TLS mutuel

En règle générale, la communication HTTPS n'est possible qu'une seule fois : le client vérifie l'identité du serveur. Pour les applications nécessitant que l'équilibreur de charge authentifie l'identité des clients qui s'y connectent, un équilibreur de charge d'application externe global et un équilibreur de charge d'application classique sont tous deux compatibles avec le protocole TLS mutuel (mTLS).

Avec l'authentification mTLS, l'équilibreur de charge demande au client d'envoyer un certificat pour s'authentifier lors du handshake TLS avec l'équilibreur de charge. Vous pouvez configurer un magasin de confiance utilisé par l'équilibreur de charge pour valider la chaîne de confiance du certificat client.

Google Cloud utilise la ressource TrustConfig du gestionnaire de certificats pour stocker les certificats utilisés par le serveur pour vérifier le certificat présenté par le client. Si vous utilisez un équilibreur de charge d'application classique sur le niveau de service réseau Premium ou un équilibreur de charge d'application externe global, vous pouvez utiliser le Gestionnaire de certificats pour provisionner et gérer vos certificats SSL ou TrustConfig sur plusieurs instances de l'équilibreur de charge à grande échelle. Pour en savoir plus, consultez la section Présentation du Gestionnaire de certificats.

Pour en savoir plus sur mTLS, consultez la page Authentification TLS mutuelle.

Règles SSL

Les règles SSL spécifient l'ensemble des fonctionnalités SSL utilisées par les équilibreurs de charge Google Cloud lors de la négociation SSL avec les clients.

Par défaut, l'équilibrage de charge HTTPS utilise un ensemble de fonctionnalités SSL offrant une bonne sécurité et une compatibilité étendue. Certaines applications requièrent davantage de contrôle sur les versions SSL et les algorithmes de chiffrement utilisés pour les connexions HTTPS ou SSL. Vous pouvez définir une règle SSL pour spécifier l'ensemble des fonctionnalités SSL utilisées par votre équilibreur de charge lors de la négociation SSL avec les clients. En outre, vous pouvez appliquer cette règle SSL à votre proxy HTTPS cible.

Le tableau suivant spécifie la compatibilité des règles SSL avec les équilibreurs de charge dans chaque mode.

Mode d'équilibreur de charge Règles SSL compatibles
Équilibreur de charge d'application externe global
Équilibreur de charge d'application classique
Équilibreur de charge d'application externe régional

Services de backend et buckets

Les services de backend fournissent des informations de configuration à l'équilibreur de charge. Les équilibreurs de charge utilisent les informations d'un service de backend pour rediriger le trafic entrant vers un ou plusieurs backends associés. Pour obtenir un exemple de configuration d'un équilibreur de charge avec un service de backend et un backend Compute Engine, consultez la page Configurer un équilibreur de charge d'application externe avec un backend Compute Engine.

Les buckets backend dirigent le trafic entrant vers des buckets Cloud Storage. Pour obtenir un exemple d'ajout d'un bucket à un équilibreur de charge d'application externe, consultez la page Configurer un équilibreur de charge avec des buckets backend.

Le tableau suivant spécifie les fonctionnalités de backend compatibles avec les équilibreurs de charge d'application externes dans chaque mode.


Mode d'équilibreur de charge
Backends compatibles sur un service de backend Compatible avec les buckets backend Compatible avec Google Cloud Armor Compatible avec Cloud CDN4 Compatible avec IAP4 Compatible avec les extensions de service
Groupes d'instances NEG zonaux NEG Internet NEG sans serveur NEG hybrides NEG Private Service Connect
Équilibreur de charge d'application externe global 2
Équilibreur de charge d'application classique 1
en cas d'utilisation du niveau Premium

Équilibreur de charge d'application externe régional 1

1 Utilisez des points de terminaison de type GCE_VM_IP_PORT avec GKE : Utilisez des NEG zonaux autonomes ou utilisez Ingress

2 Utilisez des points de terminaison de type GCE_VM_IP_PORT avec GKE : Utilisez des NEG zonaux autonomes

3 Compatible uniquement avec GKE Gateway Controller

4 IAP et Cloud CDN ne sont pas compatibles entre eux. Ils ne peuvent pas être activés sur le même service de backend.

Pour en savoir plus, consultez les ressources suivantes :

Backends et réseaux VPC

Les restrictions concernant l'emplacement des backends dépendent du type d'équilibreur de charge.

  • Pour l'équilibreur de charge d'application externe mondial et l'équilibreur de charge d'application classique, toutes les instances backend des backends de groupe d'instances et tous les points de terminaison backend de backend NEG doivent être situés dans le même projet. Toutefois, un backend de groupe d'instances ou un NEG peut utiliser un autre réseau VPC dans ce projet. Les différents réseaux VPC n'ont pas besoin d'être connectés via l'appairage de réseaux VPC, car les systèmes de proxy GFE communiquent directement avec les backends dans leurs réseaux VPC respectifs.
  • Pour l'équilibreur de charge d'application externe régional, tous les backends doivent être situés dans le même réseau VPC et dans la même région.

Protocole de communication avec les backends

Lorsque vous configurez un service de backend pour l'équilibreur de charge, vous définissez le protocole utilisé par le service de backend pour communiquer avec les backends. Vous pouvez choisir parmi HTTP, HTTPS ou HTTP/2. L'équilibreur de charge utilise uniquement le protocole que vous spécifiez. S'il ne parvient pas à négocier une connexion au backend avec le protocole spécifié, l'équilibreur de charge ne recourt pas à l'un des autres protocoles.

Si vous choisissez HTTP/2, vous devez utiliser TLS. Le protocole HTTP/2 sans chiffrement n'est pas accepté.

Pour obtenir la liste complète des protocoles acceptés, consultez la section Fonctionnalités d'équilibrage de charge : Protocoles entre l'équilibreur de charge et les backends.

Assistance WebSocket

Les équilibreurs de charge HTTP(S) de Google Cloud proposent une compatibilité intégrée avec le protocole WebSocket lorsque vous utilisez HTTP ou HTTPS en tant que protocole avec le backend. L'équilibreur de charge ne nécessite aucune configuration pour relayer les connexions WebSocket par proxy.

Le protocole WebSocket fournit un canal de communication en duplex intégral entre clients et serveurs. Une requête HTTP(S) initialise le canal. Pour en savoir plus sur le protocole, consultez la RFC 6455.

Lorsque l'équilibreur de charge reconnaît une requête WebSocket Upgrade d'un client HTTP(S) suivie d'une réponse Upgrade réussie de la part de l'instance backend, l'équilibreur de charge relaie le trafic bidirectionnel par proxy pendant la durée de la connexion en cours. Si l'instance backend ne renvoie pas de réponse Upgrade réussie, l'équilibreur de charge ferme la connexion.

Les délais avant expiration de la connexion WebSocket dépendent du type d'équilibreur de charge (global, régional ou classique). Pour en savoir plus, consultez la section Délai avant expiration du service de backend.

L'affinité de session pour WebSockets fonctionne de la même manière que pour toute autre requête. Pour en savoir plus, consultez la section Affinité de session.

Utiliser gRPC avec vos applications Google Cloud

gRPC est un framework Open Source pour les appels de procédure à distance. Il est basé sur le standard HTTP/2. Voici quelques exemples d'utilisation de gRPC :

  • Systèmes distribués à faible latence et hautement évolutifs
  • Développement de clients mobiles communiquant avec un serveur cloud
  • Conception de nouveaux protocoles devant être précis, efficaces et indépendants du langage
  • Conception à plusieurs couches pour permettre l'extension, l'authentification et la journalisation

Pour utiliser gRPC avec vos applications Google Cloud, vous devez relayer les requêtes par proxy de bout en bout via HTTP/2. Procédez comme suit :

  1. Configurez un équilibreur de charge HTTPS.
  2. Activez HTTP/2 comme protocole à utiliser entre l'équilibreur de charge et les backends.

L'équilibreur de charge négocie le protocole HTTP/2 avec les clients dans le cadre du handshake SSL à l'aide de l'extension TLS ALPN.

L'équilibreur de charge peut toujours négocier le protocole HTTPS avec certains clients ou accepter des requêtes HTTP non sécurisées sur un équilibreur de charge configuré pour utiliser HTTP/2 entre l'équilibreur de charge et les instances backend. Ces requêtes HTTP ou HTTPS sont transformées par l'équilibreur de charge pour relayer les requêtes par proxy via HTTP/2 vers les instances backend.

Vous devez activer le protocole TLS sur vos backends. Pour en savoir plus, consultez la section Chiffrement entre l'équilibreur de charge et les backends.

Si vous souhaitez configurer un équilibreur de charge d'application externe en utilisant HTTP/2 avec un objet Ingress Google Kubernetes Engine, ou en associant gRPC et HTTP/2 avec un objet Ingress, consultez la page HTTP/2 pour l'équilibrage de charge avec Ingress.

Pour en savoir plus sur la résolution des problèmes liés à HTTP/2, consultez la section Résoudre les problèmes liés à l'utilisation du protocole HTTP/2 avec les backends.

Pour plus d'informations sur les limites du protocole HTTP/2, consultez la section Limites liées à HTTP/2.

Vérifications d'état

Chaque service de backend spécifie une vérification d'état qui vérifie régulièrement que les backends sont disponibles et aptes à recevoir une connexion de l'équilibreur de charge. Cela réduit le risque que des requêtes soient envoyées à des backends ne pouvant pas les traiter. Les vérifications d'état ne vérifient pas si l'application elle-même fonctionne.

Pour les vérifications d'état, vous devez créer une règle de pare-feu autorisant le trafic entrant qui permet aux vérifications d'état d'atteindre vos instances backend. En règle générale, les vérifications d'état proviennent du mécanisme de vérification d'état centralisé de Google.

Les équilibreurs de charge d'application externes régionaux qui utilisent des backends NEG hybrides font exception à cette règle car leurs vérifications d'état proviennent du sous-réseau proxy réservé. Pour plus d'informations, consultez la présentation des NEG hybrides.

Protocole de vérification d'état

Bien que ce ne soit pas obligatoire et pas toujours possible, il est recommandé d'utiliser une vérification d'état dont le protocole correspond à celui du service de backend. Par exemple, une vérification d'état HTTP/2 permet de tester plus précisément la connectivité HTTP/2 aux backends. En revanche, les équilibreurs de charge d'application externes régionaux qui utilisent des backends NEG hybrides ne sont pas compatibles avec les vérifications d'état gRPC. Pour obtenir la liste des protocoles de vérification d'état compatibles, consultez la section Fonctionnalités d'équilibrage de charge.

Le tableau suivant spécifie le champ d'application des vérifications d'état compatibles avec les équilibreurs de charge d'application externes dans chaque mode.

Mode d'équilibreur de charge Type de vérification d'état
Équilibreur de charge d'application externe global Global
Équilibreur de charge d'application classique Global
Équilibreur de charge d'application externe régional Regional (Régional)

Pour en savoir plus sur les vérifications d'état, consultez les pages suivantes :

Règles de pare-feu

L'équilibreur de charge nécessite les règles de pare-feu suivantes :

  • Pour les équilibreurs de charge d'application externes globaux, une règle d'entrée autorisant le trafic provenant des serveurs Google Front End (GFE) vers vos backends.
    Pour l'équilibreur de charge d'application externe régional, une règle d'entrée autorisant le trafic provenant du sous-réseau proxy réservé d'atteindre vos backends.
  • Une règle d'autorisation d'entrée pour autoriser le trafic provenant des plages de vérification de l'état. Pour plus d'informations sur les vérifications de l'état et découvrir pourquoi il est nécessaire d'autoriser le trafic qui en provient, consultez Plages d'adresses IP de vérification et règles de pare-feu.

Les règles de pare-feu sont mises en œuvre au niveau de l'instance de VM, et non sur les proxys GFE. Vous ne pouvez pas utiliser les règles de pare-feu Google Cloud pour empêcher le trafic d'atteindre l'équilibreur de charge. Pour l'équilibreur de charge d'application externe global et l'équilibreur de charge d'application classique, vous pouvez utiliser Google Cloud Armor.

Les ports de ces règles de pare-feu doivent être configurés comme suit :

  • Autorisez le trafic vers le port de destination pour la vérification d'état de chaque service de backend.

  • Pour les backends de groupe d'instances : déterminez les ports à configurer par le mappage entre le port nommé du service de backend et les numéros de port associés à ce port nommé sur chaque groupe d'instances. Les numéros de port peuvent varier entre les groupes d'instances attribués au même service de backend.

  • Pour les backends de NEG GCE_VM_IP_PORT : autorisez le trafic vers les numéros de port des points de terminaison.

Le tableau suivant récapitule les plages d'adresses IP sources requises pour les règles de pare-feu :

Mode d'équilibreur de charge Plages sources de vérification d'état Demander des plages sources
Équilibreur de charge d'application externe global
  • 35.191.0.0/16
  • 130.211.0.0/22
La source du trafic GFE dépend du type de backend :
  • Groupes d'instances, NEG zonaux (GCE_VM_IP_PORT) et NEG de connectivité hybride (NON_GCP_PRIVATE_IP_PORT) :
    • 130.211.0.0/22
    • 35.191.0.0/16
  • NEG Internet (INTERNET_FQDN_PORT et INTERNET_IP_PORT) :
    • 34.96.0.0/20
    • 34.127.192.0/18
  • NEG SERVERLESS et buckets de backend : le réseau de production de Google gère le routage des paquets
Équilibreur de charge d'application classique
  • 35.191.0.0/16
  • 130.211.0.0/22
La source du trafic GFE dépend du type de backend :
  • Groupes d'instances, NEG zonaux (GCE_VM_IP_PORT) et NEG de connectivité hybride (NON_GCP_PRIVATE_IP_PORT) :
    • 35.191.0.0/16
    • 130.211.0.0/22
  • NEG Internet (INTERNET_FQDN_PORT et INTERNET_IP_PORT) :
    • 34.96.0.0/20
    • 34.127.192.0/18
  • NEG SERVERLESS et buckets de backend : le réseau de production de Google gère le routage des paquets.
Équilibreur de charge d'application externe régional
  • 35.191.0.0/16
  • 130.211.0.0/22

L'ajout de plages de vérification de l'état à la liste d'autorisation de Google n'est pas nécessaire pour les NEG hybrides. Toutefois, si vous utilisez à la fois des NEG hybrides et zonaux dans un service de backend, vous devez ajouter les plages de vérification d'état Google à la liste d'autorisation pour les NEG zonaux.
Le sous-réseau proxy réservé que vous configurez.

Architecture du VPC partagé

Les équilibreurs de charge d'application externes sont compatibles avec les réseaux qui utilisent un VPC partagé. Un VPC partagé permet à des organisations de connecter des ressources provenant de différents projets à un réseau VPC commun, afin de pouvoir communiquer entre elles de manière sécurisée et efficace à l'aide d'adresses IP internes de ce réseau. Si vous n'êtes pas familiarisé avec le VPC partagé, consultez la présentation du VPC partagé.

Il existe plusieurs façons de configurer un équilibreur de charge d'application externe dans un réseau VPC partagé. Quel que soit le type de déploiement, tous les composants de l'équilibreur de charge doivent appartenir à la même organisation.

Équilibreur de charge Composants d'interface Composants backend
Équilibreur de charge d'application externe global

L'adresse IP externe globale, la règle de transfert, le proxy HTTP(S) cible et le mappage d'URL associé doivent être définis dans le même projet. Ce projet peut être un projet hôte ou un projet de service.

Un service de backend global doit être défini dans le même projet hôte ou de service que les backends (groupes d'instances ou NEG). Les vérifications d'état associées aux services de backend doivent également être définies dans le même projet que le service de backend.

Équilibreur de charge d'application classique L'adresse IP externe globale, la règle de transfert, le proxy HTTP(S) cible et le mappage d'URL associé doivent être définis dans le même projet hôte ou de service que les backends. Un service de backend global doit être défini dans le même projet hôte ou de service que les backends (groupes d'instances ou NEG). Les vérifications d'état associées aux services de backend doivent également être définies dans le même projet que le service de backend.
Équilibreur de charge d'application externe régional

Créez le réseau et le sous-réseau proxy réservé requis dans le projet hôte de VPC partagé.

L'adresse IP externe régionale, la règle de transfert, le proxy HTTP(S) cible et le mappage d'URL associé doivent être définis dans le même projet. Ce projet peut être un projet hôte ou un projet de service.

Vous pouvez effectuer l'une des actions suivantes :
  • Créer des services de backend et des backends (groupes d'instances, NEG sans serveur ou autres types de backends compatibles) dans le même projet de service que les composants d'interface.
  • Créer des services de backend et des backends (groupes d'instances, NEG sans serveur ou autres types de backends compatibles) dans autant de projets de service que nécessaire. Un seul mappage d'URL peut référencer des services de backend sur différents projets. Ce type de déploiement est appelé référence de services inter-projets.

Chaque service de backend doit être défini dans le même projet que les backends auxquels il fait référence. Les vérifications de l'état associées aux services de backend doivent également être définies dans le même projet que le service de backend.

Bien que vous puissiez créer tous les composants et les backends d'équilibrage de charge dans le projet hôte de VPC partagé, ce type de déploiement ne sépare pas les responsabilités d'administration réseau et de développement de services.

Tous les composants et les backends de l'équilibreur de charge dans un projet de service

Le schéma d'architecture suivant illustre un déploiement de VPC partagé standard dans lequel tous les composants et les backends de l'équilibreur de charge se trouvent dans un projet de service. Ce type de déploiement est compatible avec tous les équilibreurs de charge d'application.

Les composants et les backends de l'équilibreur de charge doivent utiliser le même réseau VPC.

Équilibreur de charge d&#39;application externe régional sur un réseau VPC partagé
Équilibreur de charge d'application externe régional sur un réseau VPC partagé

Backends sans serveur dans un environnement VPC partagé

Pour un équilibreur de charge qui utilise un backend de NEG sans serveur, le service Cloud Run ou Cloud Functions de backend doit se trouver dans le même projet que le NEG sans serveur.

En outre, pour l'équilibreur de charge d'application externe régional compatible avec le référencement de services inter-projets, le service de backend, le NEG sans serveur et le service Cloud Run doivent toujours se trouver dans le même projet de service.

Référence de services inter-projets

Dans ce modèle, le mappage d'URL et l'interface de l'équilibreur de charge se trouve dans un projet hôte ou de service. Les services de backend et les backends de l'équilibreur de charge peuvent être répartis entre les projets de l'environnement VPC partagé. Les services de backend inter-projets peuvent être référencés dans un seul mappage d'URL. C'est ce que l'on appelle la référence du service inter-projets.

Le référencement de services inter-projets permet aux organisations de configurer un équilibreur de charge central et d'acheminer le trafic vers des centaines de services répartis sur plusieurs projets différents. Vous pouvez gérer toutes les règles et stratégies de routage du trafic de manière centralisée dans un mappage d'URL. Vous pouvez également associer l'équilibreur de charge à un seul ensemble de noms d'hôte et de certificats SSL. Par conséquent, vous pouvez optimiser le nombre d'équilibreurs de charge nécessaires au déploiement de votre application et réduire les coûts de gestion, d'exploitation et de quota.

En disposant de projets différents pour chacune de vos équipes fonctionnelles, vous pouvez également assurer la séparation des rôles au sein de votre organisation. Les propriétaires de service peuvent se concentrer sur la création de services dans des projets de service, tandis que les équipes réseau peuvent provisionner et gérer des équilibreurs de charge dans un autre projet, et les deux peuvent être connectées à l'aide du référencement de services inter-projets.

Les propriétaires de services peuvent conserver leur autonomie quant à l'exposition de leurs services et contrôler quels utilisateurs peuvent y accéder à l'aide de l'équilibreur de charge. Ce procédé fait appel à un rôle IAM spécial appelé Rôle "Utilisateur des services d'équilibreur de charge Compute" (roles/compute.loadBalancerServiceUser).

Pour apprendre à configurer un VPC partagé pour un équilibreur de charge d'application externe régional, avec ou sans référencement de services inter-projets, consultez la page Configurer un équilibreur de charge d'application externe régional avec un VPC partagé.

Limites connues liées au référencement des services inter-projets

  • La référence de services inter-projets peut être utilisée avec des groupes d'instances, des NEG sans serveur et avec la plupart des autres types de backends compatibles. Toutefois, les restrictions suivantes s'appliquent :

    • Avec les équilibreurs de charge d'application externes régionaux, vous ne pouvez pas référencer de service de backend inter-projets si le service de backend dispose de backends NEG Internet régionaux.
  • Le référencement de services multiprojet n'est pas compatible avec l'équilibreur de charge d'application externe global ou l'équilibreur de charge d'application classique.
  • Google Cloud ne fait pas de distinction entre les ressources (par exemple, les services de backend) utilisant le même nom sur plusieurs projets. Par conséquent, lorsque vous utilisez le référencement de services multiprojet, nous vous recommandons d'utiliser des noms de service de backend uniques pour tous les projets de votre organisation.

Exemple 1 : interface et backend de l'équilibreur de charge dans des projets de service différents

Voici un exemple de déploiement dans lequel l'interface et le mappage d'URL de l'équilibreur de charge sont créés dans le projet de service A, et le mappage d'URL référence un service de backend dans le projet de service B.

Dans ce cas, les administrateurs réseau ou les administrateurs d'équilibrage de charge du projet de service A nécessitent un accès aux services de backend du projet de service B. Les administrateurs du projet de service B attribuent le rôle IAM compute.loadBalancerServiceUser aux administrateurs de l'équilibreur de charge du projet de service A, qui souhaitent référencer le service de backend dans le projet de service B.

Interface et mappage d&#39;URL de l&#39;équilibreur de charge dans le projet de service
Interface et backend de l'équilibreur de charge dans différents projets de service

Exemple 2 : interface de l'équilibreur de charge dans le projet hôte et backends dans les projets de service

Dans ce type de déploiement, l'interface et le mappage d'URL de l'équilibreur de charge sont créés dans le projet hôte, et les services de backend (et les backends) sont créés dans les projets de service.

Dans ce cas, les administrateurs réseau ou les administrateurs d'équilibreur de charge du projet hôte requièrent un accès aux services de backend dans les projets de service. Les administrateurs de projets de service accordent le rôle IAM compute.loadBalancerServiceUser aux administrateurs de l'équilibreur de charge du projet hôte A qui souhaitent référencer le service de backend dans le projet de service.

Interface et mappage d&#39;URL de l&#39;équilibreur de charge dans le projet hôte
Interface et mappage d'URL de l'équilibreur de charge dans le projet hôte

Fonctionnement des connexions

Connexions à l'équilibreur de charge d'application externe global

Les équilibreurs de charge d'application externes globaux sont mis en œuvre par de nombreux proxys appelés GFE (Google Front End). Il n'y a pas qu'un seul proxy. Au niveau Premium, la même adresse IP externe globale est annoncée à partir de divers points de présence et les requêtes des clients sont dirigées vers le GFE le plus proche du client.

Selon l'emplacement de vos clients, plusieurs GFE peuvent initier des connexions HTTP(S) à vos backends. Les paquets envoyés à partir des GFE ont des adresses IP sources de la même plage que celle utilisée par les vérificateurs d'état : 35.191.0.0/16 et 130.211.0.0/22.

Selon la configuration du service de backend, le protocole utilisé par chaque GFE pour se connecter aux backends peut être HTTP, HTTPS ou HTTP/2. Pour les connexions HTTP ou HTTPS, la version HTTP utilisée est HTTP 1.1.

Le message HTTP keepalive est activé par défaut, comme indiqué dans la spécification HTTP 1.1. Les messages keepalive HTTP tentent d'utiliser efficacement la même session TCP. mais il n'y a aucune garantie. Le GFE utilise un délai avant expiration du message keepalive HTTP client de 610 secondes et un délai avant expiration par défaut du message keepalive du backend de 600 secondes. Vous pouvez mettre à jour le délai avant expiration du message keepalive HTTP client, mais la valeur du délai avant expiration du message keepalive du backend est fixe. Vous pouvez configurer le délai avant expiration de la requête/réponse en définissant le délai avant expiration du service de backend. Bien qu'ils soient étroitement liés, un message keepalive HTTP et un délai d'inactivité TCP ne sont pas identiques. Pour en savoir plus, consultez la section Délais d'expiration et nouvelles tentatives.

Pour garantir que le trafic est équilibré de manière égale, l'équilibreur de charge peut fermer correctement une connexion TCP en envoyant un paquet FIN ACK après avoir terminé une réponse incluant un en-tête Connection: close, ou en émettant un encadrement HTTP/2 GOAWAY après avoir terminé une réponse. Ce comportement n'interfère avec aucune requête ni réponse active.

Le nombre de connexions HTTP et de sessions TCP varie en fonction du nombre de GFE connectés, du nombre de clients se connectant aux GFE, du protocole de communication avec les backends et de l'emplacement des backends.

Pour en savoir plus, consultez la section Fonctionnement des équilibreurs de charge d'application externes du guide "Optimiser la capacité des applications avec l'équilibrage de charge global".

Connexions à l'équilibreur de charge d'application externe régional

L'équilibreur de charge d'application externe régional est un service géré mis en œuvre sur le proxy Envoy. L'équilibreur de charge d'application externe régional utilise un sous-réseau partagé appelé sous-réseau proxy réservé pour provisionner un ensemble d'adresses IP utilisées par Google pour exécuter des proxys Envoy en votre nom. L'option --purpose pour ce sous-réseau proxy réservé est définie sur REGIONAL_MANAGED_PROXY. Tous les équilibreurs de charge régionaux basés sur Envoy dans un réseau et une région spécifiques partagent ce sous-réseau.

Les clients utilisent l'adresse IP et le port de l'équilibreur de charge pour se connecter à cet équilibreur de charge. Les requêtes des clients sont dirigées vers le sous-réseau proxy réservé situé dans la même région que le client. L'équilibreur de charge interrompt les requêtes des clients, puis ouvre de nouvelles connexions entre le sous-réseau proxy réservé et vos backends. Par conséquent, les paquets envoyés à partir de l'équilibreur de charge ont des adresses IP sources du sous-réseau proxy réservé.

Selon la configuration du service de backend, le protocole utilisé par les proxys Envoy pour se connecter aux backends peut être HTTP, HTTPS ou HTTP/2. Dans le cas de HTTP ou HTTPS, la version HTTP est HTTP 1.1. Le message HTTP keepalive est activé par défaut, comme indiqué dans la spécification HTTP 1.1. Le proxy Envoy définit à la fois le délai avant expiration du message keepalive HTTP client et le délai avant expiration du message keepalive du backend sur une valeur par défaut de 600 secondes chacun. Vous pouvez mettre à jour le délai avant expiration du message keepalive HTTP client, mais la valeur du délai avant expiration du message keepalive du backend est fixe. Vous pouvez configurer le délai avant expiration de la requête/réponse en définissant le délai avant expiration du service de backend. Pour en savoir plus, consultez la section Délais d'expiration et nouvelles tentatives.

Communication entre les clients et l'équilibreur de charge

  • Les clients peuvent communiquer avec l'équilibreur de charge via le protocole HTTP 1.1 ou HTTP/2.
  • Lorsque HTTPS est utilisé, les clients modernes utilisent par défaut HTTP/2. Ce fonctionnement est contrôlé au niveau du client et non au niveau de l'équilibreur de charge HTTPS.
  • Vous ne pouvez pas désactiver HTTP/2 en modifiant la configuration sur l'équilibreur de charge. Toutefois, vous pouvez configurer certains clients pour qu'ils utilisent HTTP 1.1 au lieu de HTTP/2. Par exemple, avec curl, définissez le paramètre --http1.1.
  • Les équilibreurs de charge d'application externes acceptent la réponse HTTP/1.1 100 Continue.

Pour obtenir la liste complète des protocoles compatibles avec les règles de transfert d'équilibreur de charge d'application externe dans chaque mode, consultez la page Fonctionnalités de l'équilibreur de charge.

Adresses IP sources des paquets client

Les adresses IP sources des paquets, telles qu'elles sont perçues par les backends, ne correspondent pas à l'adresse IP externe Google Cloud de l'équilibreur de charge. En d'autres termes, il existe deux connexions TCP :

Pour les équilibreurs de charge d'application externes globaux :
  • Connexion 1, du client d'origine vers l'équilibreur de charge (GFE) :

    • Adresse IP source : le client d'origine (ou l'adresse IP externe si le client est protégé par la fonctionnalité NAT ou un proxy de transfert).
    • Adresse IP de destination : l'adresse IP de votre équilibreur de charge.
  • Connexion 2, de l'équilibreur de charge (GFE) vers la VM de backend ou le point de terminaison :

    • Adresse IP source : adresse IP située dans l'une des plages spécifiées dans les règles de pare-feu.

    • Adresse IP de destination : une adresse IP interne de la VM de backend ou du conteneur dans le réseau VPC.

Pour les équilibreurs de charge d'application externes régionaux :
  • Connexion 1, du client d'origine vers l'équilibreur de charge (sous-réseau proxy réservé) :

    • Adresse IP source : le client d'origine (ou l'adresse IP externe si le client est protégé par la fonctionnalité NAT ou un proxy de transfert).
    • Adresse IP de destination : l'adresse IP de votre équilibreur de charge.
  • Connexion 2, de l'équilibreur de charge (sous-réseau proxy réservé) vers la VM de backend ou le point de terminaison :

    • Adresse IP source : une adresse IP du sous-réseau proxy réservé partagée entre tous les équilibreurs de charge basés sur Envoy déployés dans la même région en tant qu'équilibreur de charge.

    • Adresse IP de destination : une adresse IP interne de la VM de backend ou du conteneur dans le réseau VPC.

Chemin de retour

Pour les équilibreurs de charge d'application externes globaux, Google Cloud utilise des routes spéciales non définies dans votre réseau VPC pour les vérifications d'état. Pour en savoir plus, consultez la section Chemins de retour pour les équilibreurs de charge.

Pour les équilibreurs de charge d'application externes régionaux, Google Cloud utilise des proxys Envoy Open Source pour interrompre les requêtes des clients adressées à l'équilibreur de charge. L'équilibreur de charge interrompt la session TCP et ouvre une nouvelle session TCP depuis le sous-réseau proxy réservé de la région vers votre backend. Les routes définies au sein de votre réseau VPC facilitent la communication entre les proxys Envoy et vos backends, et inversement.

Ports ouverts

Les GFE offrent plusieurs ports ouverts pour les autres services Google exécutés sur la même architecture. Lorsque vous exécutez une analyse de port, d'autres ports ouverts peuvent s'afficher pour d'autres services Google s'exécutant sur des GFE.

Les équilibreurs de charge basés sur GFE (équilibreurs de charge d'application externes globaux et équilibreurs de charge d'application classiques) affichent toujours les ports 80 et 443 comme ouverts (ainsi que tout autre port que vous avez configuré dans les règles de transfert de votre équilibreur de charge). Toutefois, si vous n'avez pas configuré de règle de transfert pour le port 80 ou 443, toutes les connexions envoyées à ces ports sont refusées. À l'inverse, les équilibreurs de charge d'application externes régionaux sont mis en œuvre à l'aide des proxys Envoy et n'affichent pas de ports ouverts supplémentaires lors d'une analyse.

L'exécution d'une analyse de port sur l'adresse IP d'un équilibreur de charge basé sur GFE n'est pas utile du point de vue de l'audit pour les raisons suivantes :

  • Une analyse de port (par exemple, avec nmap) n'attend généralement pas de paquet de réponse ni de paquet TCP RST lors de l'exécution de la vérification TCP SYN. Les GFE n'envoient des paquets SYN-ACK en réponse aux vérifications SYN que pour les ports sur lesquels vous avez configuré une règle de transfert. Les GFE n'envoient des paquets à vos backends qu'en réponse aux paquets envoyés à l'adresse IP de votre équilibreur de charge et au port de destination configuré sur sa règle de transfert. Les paquets envoyés à une adresse IP ou à un port différents ne sont pas envoyés à vos backends.

    Les GFE mettent en œuvre des fonctionnalités de sécurité telles que Google Cloud Armor. Avec Google Cloud Armor Standard, les GFE offrent une protection permanente contre les attaques DDoS volumétriques et basées sur un protocole, et les inondations SYN. Cette protection est disponible même si vous n'avez pas explicitement configuré Google Cloud Armor. Vous ne serez facturé que si vous configurez des règles de sécurité ou si vous vous inscrivez au niveau Managed Protection Plus.

  • Les paquets envoyés à l'adresse IP de votre équilibreur de charge peuvent recevoir une réponse de n'importe quel GFE du parc de Google. Cependant, l'analyse d'une combinaison d'adresse IP et de port de destination d'un équilibreur de charge n'interroge qu'un seul GFE par connexion TCP. L'adresse IP de votre équilibreur de charge n'est pas attribuée à un seul appareil ou système. Ainsi, l'analyse de l'adresse IP d'un équilibreur de charge basé sur un GFE n'analyse pas tous les GFE du parc de Google.

En gardant cela à l'esprit, voici quelques moyens plus efficaces d'auditer la sécurité de vos instances backend :

  • Un auditeur de sécurité doit inspecter la configuration des règles de transfert pour la configuration de l'équilibreur de charge. Les règles de transfert définissent le port de destination pour lequel votre équilibreur de charge accepte les paquets et les transfère aux backends. Pour les équilibreurs de charge basés sur GFE, chaque règle de transfert externe ne peut référencer qu'un seul port TCP de destination. Pour un équilibreur de charge utilisant le port TCP 443, le port UDP 443 est utilisé lorsque la connexion est mise à niveau vers QUIC (HTTP/3).

  • Un auditeur de sécurité doit inspecter la configuration des règles de pare-feu applicable aux VM de backend. Les règles de pare-feu que vous définissez bloquent le trafic entre les GFE et les VM de backends, mais elles ne bloquent pas le trafic entrant vers les GFE. Pour connaître les bonnes pratiques, consultez la section Règles de pare-feu.

terminaison TLS

Le tableau suivant récapitule la manière dont la terminaison TLS est gérée par les équilibreurs de charge d'application externes dans chaque mode.

Mode d'équilibreur de charge terminaison TLS
Équilibreur de charge d'application externe global Le protocole TLS est interrompu sur un GFE, qui peut se trouver n'importe où dans le monde.
Équilibreur de charge d'application classique Le protocole TLS est interrompu sur un GFE, qui peut se trouver n'importe où dans le monde.
Équilibreur de charge d'application externe régional TLS est interrompu sur les proxys Envoy situés dans un sous-réseau proxy réservé dans une région choisie par l'utilisateur. Utilisez ce mode d'équilibreur de charge si vous avez besoin d'exercer un contrôle géographique sur la région où le protocole TLS est interrompu.

Délais d'expiration et nouvelles tentatives

Les équilibreurs de charge d'application externes sont compatibles avec les types de délais d'expiration suivants :

Type de délai d'expiration et description Valeurs par défaut Valeurs personnalisées acceptées
Global Classique Regional (Régional)
Délai avant expiration du service de backend1

Un délai avant expiration de la requête et de la réponse Représente la durée maximale pouvant s'écouler entre le moment où l'équilibreur de charge envoie le premier octet de la requête HTTP à votre backend et le moment où celui-ci renvoie le dernier octet de la réponse HTTP. Si la réponse HTTP entière n'a pas été renvoyée à l'équilibreur de charge dans le délai avant expiration de la requête ou de la réponse, les données de réponse restantes sont supprimées.

Pour les WebSockets utilisés avec les équilibreurs de charge d'application classiques, durée maximale du WebSocket, qu'il soit inactif ou actif.

  • Pour les NEG sans serveur sur un service de backend : 60 minutes
  • Pour tous les autres types de backends sur un service de backend : 30 secondes
  • Pour les buckets backend : 24 heures (86 400 secondes)
2 2
Délai avant expiration du message keepalive HTTP du client
Durée maximale d'inactivité de la connexion TCP entre un client et le proxy de l'équilibreur de charge. (La même connexion TCP peut être utilisée pour plusieurs requêtes HTTP.)
  • Pour les équilibreurs de charge d'application externes globaux et les équilibreurs de charge d'application classiques, le proxy de l'équilibreur de charge est un GFE de première couche.
  • Pour les équilibreurs de charge d'application externes régionaux, le proxy de l'équilibreur de charge correspond au logiciel Envoy.
  • Pour un équilibreur de charge d'application externe global et un équilibreur de charge d'application classique : 610 secondes
  • Pour un équilibreur de charge d'application externe régional : 600 secondes
Délai avant expiration du message keepalive HTTP du backend
Durée maximale d'inactivité de la connexion TCP entre le proxy de l'équilibreur de charge et un backend. (La même connexion TCP peut être utilisée pour plusieurs requêtes HTTP.)
  • Pour les équilibreurs de charge d'application externes globaux et les équilibreurs de charge d'application classiques, le proxy de l'équilibreur de charge est un GFE de deuxième couche.
  • Pour les équilibreurs de charge d'application externes régionaux, le proxy de l'équilibreur de charge correspond au logiciel Envoy.
  • Pour les services de backend : 10 minutes (600 secondes)
  • Pour les buckets backend : 6 minutes (360 secondes)
Délai d'inactivité de la session QUIC
Durée maximale d'inactivité d'une session QUIC entre le client (en aval) et le GFE d'un équilibreur de charge d'application externe mondial ou d'un équilibreur de charge d'application classique.

Pour les équilibreurs de charge d'application externes mondiaux et équilibreurs de charge d'application classiques, procédez comme suit :

Le délai d'inactivité de la session QUIC correspond au délai d'inactivité minimal du client ou au délai d'inactivité du GFE (300 secondes).

Le délai d'inactivité du GFE est fixé à 300 secondes. Le délai d'inactivité du client peut être configuré.

1Non configurable pour les backends de NEG sans serveur. Non configurable pour les buckets backend.

2 La configuration n'est pas compatible avec WebSockets.

Délai avant expiration du service de backend

Le délai avant expiration du service backend configurable représente la durée maximale pendant laquelle l'équilibreur de charges attend que de votre backend traite une requête HTTP et renvoie la réponse HTTP correspondante. À l'exception des NEG sans serveur, la valeur par défaut du délai avant expiration du service de backend est de 30 secondes.

Par exemple, si vous souhaitez télécharger un fichier de 500 Mo et que la valeur du délai avant expiration du service de backend est de 90 secondes, l'équilibreur de charge s'attend à ce que le backend fournisse l'intégralité du fichier de 500 Mo dans un délai de 90 secondes. Le délai avant expiration du service de backend peut être configuré de sorte qu'il soit insuffisant pour envoyer une réponse HTTP complète. Dans ce cas, si l'équilibreur de charge a au moins reçu des en-têtes de réponse HTTP du backend, il renvoie les en-têtes de réponse complets et tout ce qu'il a pu tirer du corps de réponse dans le délai avant expiration du service de backend.

Vous devez définir le délai avant expiration du service de backend sur la durée la plus longue attendue par votre backend pour traiter une réponse HTTP. Vous devez augmenter le délai avant expiration du service de backend si le logiciel exécuté sur votre backend a besoin de plus de temps pour traiter une requête HTTP et renvoyer sa réponse complète. Par exemple, vous devez augmenter le délai avant expiration si vous voyez des réponses HTTP 408 avec jsonPayload.statusDetail client_timed_out.

Le délai avant expiration du service de backend accepte des valeurs comprises entre 1 et 2,147,483,647 secondes. Cependant, les valeurs plus élevées ne sont pas des options pratiques de configuration. Google Cloud ne garantit pas qu'une connexion TCP sous-jacente peut rester ouverte pendant toute la durée du délai avant expiration du service de backend. Les systèmes clients doivent mettre en œuvre une logique de nouvelle tentative au lieu de compter sur une connexion TCP pour être ouverte pendant de longues périodes.

Remarques supplémentaires :

  • Les délais avant expiration de la connexion WebSocket dépendent du type d'équilibreur de charge :

    • Pour les équilibreurs de charge d'application classiques, le délai avant expiration d'une connexion WebSocket dépend du délai avant expiration du service de backend configurable de l'équilibreur de charge, qui est de 30 secondes par défaut. Ce délai s'applique aux connexions WebSocket, qu'elles soient utilisées ou non.
    • Pour les équilibreurs de charge d'application externes globaux et régionaux, les connexions WebSocket actives ne suivent pas le délai avant expiration du service de backend. Les connexions WebSocket inactives sont fermées au terme du délai avant expiration du service de backend.
    • En outre, les connexions WebSocket utilisées par les équilibreurs de charge d'application externes globaux et les équilibreurs de charge d'application classiques sont automatiquement fermées après 24 heures. Cette limite de 24 heures n'est pas personnalisable et se produit indépendamment du fait que les connexions sont utilisées ou que le délai avant expiration du service de backend est défini sur une valeur supérieure à 86 400 secondes (24 heures).
  • Pour un équilibreur de charge d'application externe global ou un équilibreur de charge d'application classique, les délais avant expiration du service de backend de plus d'un jour (86 400 secondes) ne sont pas recommandés, car Google Cloud redémarre régulièrement les Google Front End pour les mises à jour logicielles et d'autres opérations de maintenance de routine. La valeur du délai avant expiration du service de backend ne retarde pas les activités de maintenance de Google. Plus la valeur du délai avant expiration du service de backend est longue, plus il est probable que Google mette fin aux connexions TCP pour la maintenance.

  • Pour un équilibreur de charge d'application externe régional, Google Cloud redémarre ou modifie périodiquement le nombre de tâches logicielles Envoy diffusées. Plus la valeur du délai avant expiration du service de backend est longue, plus il est probable que les tâches de redémarrage ou de remplacement d'Envoy interrompent les connexions TCP.

Les équilibreurs de charge d'application externes régionaux sont compatibles avec un paramètre de mappage d'URL routeActions.timeout, qui peut remplacer le délai avant expiration du service de backend. Lorsque routeActions.timeout est omis, la valeur du délai avant expiration du service de backend est utilisée. Lorsque routeActions.timeout est fourni, le délai avant expiration du service de backend est ignoré et la valeur de routeActions.timeout est utilisée comme délai avant expiration de la requête et de la réponse.

Pour configurer le délai avant expiration du service de backend, utilisez l'une des méthodes suivantes :

  • Console Google Cloud : modifiez le champ Délai avant expiration du service de backend de l'équilibreur de charge.
  • Google Cloud CLI : utilisez la commande gcloud compute backend-services update pour modifier le paramètre --timeout de la ressource du service de backend.
  • API : pour un équilibreur de charge d'application externe global ou un équilibreur de charge d'application classique, modifiez le paramètre timeoutSec pour la ressource backendServices globale.
  • API : pour un équilibreur de charge d'application externe régional, modifiez le paramètre timeoutSec pour la ressource regionBackendServices.

Délai d'expiration du message keepalive HTTP client

Le délai d'expiration du message keepalive HTTP client représente la durée maximale pendant laquelle une connexion TCP peut être inactive entre le client en aval et l'un des types de proxys suivants :

  • Pour un équilibreur de charge d'application externe global ou un équilibreur de charge d'application classique : un Google Front End de première couche
  • Pour un équilibreur de charge d'application externe régional : un proxy Envoy

Un délai d'expiration du message keepalive HTTP représente le délai d'inactivité TCP pour les connexions TCP sous-jacentes. Le délai avant expiration du message keepalive HTTP client ne s'applique pas aux WebSockets.

  • Pour un équilibreur de charge d'application externe global, la valeur par défaut est de 610 secondes. Vous pouvez configurer le délai d'expiration HTTP du client avec une valeur comprise entre 5 et 1 200 secondes.
  • Pour un équilibreur de charge d'application classique, le délai avant expiration du message keepalive HTTP client est fixé à 610 secondes.
  • Pour un équilibreur de charge d'application externe régional, le délai avant expiration du message keepalive HTTP client est fixé à 600 secondes.

Pour configurer le paramètre de délai d'expiration du message keepalive, utilisez l'une des méthodes suivantes :

Le délai d'expiration du message keepalive HTTP client de l'équilibreur de charge doit être supérieur au délai d'expiration du message keepalive HTTP (TCP inactif) utilisé par les clients ou les proxys en aval. Si un client en aval possède un délai avant expiration du message keepalive HTTP (TCP inactif) supérieur à celui de l'équilibreur de charge, il est possible qu'une condition de concurrence se produise. Du point de vue d'un client en aval, une connexion TCP établie est autorisée à être inactive plus longtemps que l'équilibreur de charge ne le permet. Cela signifie que le client en aval peut envoyer des paquets après que l'équilibreur de charge considère la connexion TCP comme fermée. Dans ce cas, l'équilibreur de charge répond par un paquet de réinitialisation TCP (RST).

Délai avant expiration du message keepalive HTTP du backend

Les équilibreurs de charge d'application externes sont des proxys qui utilisent au moins deux connexions TCP :

  • Pour un équilibreur de charge d'application externe global ou un équilibreur de charge d'application classique, une première connexion TCP existe entre le client (en aval) et un GFE de première couche. Les GFE de première couche se connectent aux GFE de deuxième couche, puis les GFE de deuxième couche ouvrent une deuxième connexion TCP à vos backends.

  • Pour un équilibreur de charge d'application externe régional, une première connexion TCP existe entre le client (en aval) et un proxy Envoy. Le proxy Envoy ouvre ensuite une deuxième connexion TCP à vos backends.

les connexions TCP secondaires de l'équilibreur de charge peuvent ne pas être fermées après chaque requête ; elles peuvent rester ouvertes pour gérer plusieurs requêtes et réponses HTTP. Le délai avant expiration du message keepalive HTTP du backend définit le délai d'inactivité TCP entre l'équilibreur de charge et vos backends. Le délai avant expiration du message keepalive HTTP du backend ne s'applique pas aux WebSockets.

Le délai avant expiration du message keepalive du backend est fixé à 10 minutes (600 secondes) et ne peut pas être modifié. Le délai d'expiration du message keepalive du backend de l'équilibreur de charge doit être inférieur au délai d'expiration du message keepalive utilisé par les logiciels exécutés sur vos backends. Cela évite une condition de concurrence où le système d'exploitation de vos backends peut fermer les connexions TCP avec une réinitialisation TCP (RST). Étant donné que le délai avant expiration du message keepalive du backend pour l'équilibreur de charge n'est pas configurable, vous devez configurer votre logiciel backend de sorte que sa valeur de délai d'expiration de message keepalive HTTP (TCP inactive) soit supérieure à 600 secondes.

Le tableau suivant répertorie les modifications à effectuer pour modifier les valeurs du délai d'expiration du message keepalive pour les logiciels de serveur Web courants.

Logiciel de serveur Web Paramètre Réglage par défaut Réglage recommandé
Apache KeepAliveTimeout KeepAliveTimeout 5 KeepAliveTimeout 620
nginx keepalive_timeout keepalive_timeout 75s; keepalive_timeout 620s;

Délai d'inactivité de la session QUIC

Le délai d'inactivité de la session QUIC représente la durée maximale d'inactivité d'une session QUIC entre le client et le GFE d'un équilibreur de charge d'application externe global ou d'un équilibreur de charge d'application classique.

La valeur du délai d'inactivité de la session QUIC est définie comme la valeur minimale du délai d'inactivité du client ou du délai d'inactivité du GFE (300 secondes). Le délai d'inactivité du GFE est fixé à 300 secondes. Le délai d'inactivité du client peut être configuré.

Tentatives

La compatibilité de la logique de nouvelle tentative dépend du mode de l'équilibreur de charge d'application externe.

Mode d'équilibreur de charge Logique de nouvelle tentative
Équilibreur de charge d'application externe global

Configurable à l'aide d'une stratégie de nouvelle tentative dans le mappage d'URL. Le nombre de tentatives par défaut (numRetries) est de 1. Le nombre maximal de nouvelles tentatives pouvant être configurées à l'aide de la stratégie de nouvelle tentative est de 25. Le délai avant expiration par défaut pour chaque tentative (perTryTimeout) est de 30 secondes avec une valeur de perTryTimeout configurable maximale de 24 heures.

Sans stratégie de nouvelle tentative, les requêtes infructueuses sans corps HTTP (par exemple, des requêtes GET) qui aboutissent à des réponses HTTP 502, 503 ou 504 (retryConditions=["gateway-error"]) sont relancées une fois.

Les requêtes HTTP POST ne font pas l'objet d'une nouvelle tentative.

Les requêtes faisant l'objet d'une nouvelle tentative ne génèrent qu'une seule entrée de journal associée à la réponse finale.

Équilibreur de charge d'application classique

Vous ne pouvez pas modifier la stratégie de nouvelle tentative pour les nouvelles tentatives de connexion.

Les requêtes HTTP POST ne font pas l'objet d'une nouvelle tentative.

Les requêtes HTTP GET sont toujours relancées tant qu'au moins 80 % des backends sont opérationnels. Si un groupe ne comprend qu'une seule instance backend et que la connexion à celle-ci échoue, le pourcentage d'instances backend non opérationnelles est de 100 %. Le GFE ne tente donc pas de relancer la requête.

L'équilibreur de charge relance une requête GET ayant échoué si la première requête a échoué avant de recevoir les en-têtes de réponse de l'instance backend.

Les requêtes faisant l'objet d'une nouvelle tentative ne génèrent qu'une seule entrée de journal associée à la réponse finale. Pour en savoir plus, consultez la section Journalisation et surveillance de l'équilibreur de charge d'application externe.

Les requêtes infructueuses aboutissent à la synthèse d'une réponse HTTP 502

Équilibreur de charge d'application externe régional

Configurable à l'aide d'une stratégie de nouvelle tentative dans le mappage d'URL. Le nombre de nouvelles tentatives par défaut (numRetries) est de 1. Le nombre maximal de nouvelles tentatives pouvant être configurées à l'aide de la stratégie de nouvelle tentative est de 25. Le délai avant expiration par défaut pour chaque tentative (perTryTimeout) est de 30 secondes avec une valeur de perTryTimeout configurable maximale de 24 heures.

Sans stratégie de nouvelle tentative, les requêtes infructueuses sans corps HTTP (par exemple, des requêtes GET) qui aboutissent à des réponses HTTP 502, 503 ou 504 sont relancées. une fois.

Les requêtes HTTP POST ne font pas l'objet d'une nouvelle tentative.

Les requêtes faisant l'objet d'une nouvelle tentative ne génèrent qu'une seule entrée de journal associée à la réponse finale.

Le protocole WebSocket est compatible avec GKE Ingress.

Traitement des requêtes et réponses illégales

Il existe différentes raisons pour lesquelles l'équilibreur de charge peut être amené à empêcher des requêtes client ou des réponses du backend d'atteindre, respectivement, le backend ou le client. Certaines raisons sont strictement liées à la conformité avec le protocole HTTP/1.1. D'autres visent à éviter de transmettre des données inattendues en provenance ou à destination des backends. Aucune vérification ne peut être désactivée.

L'équilibreur de charge bloque les requêtes dans les cas de figure suivants pour assurer la conformité avec le protocole HTTP/1.1 :

  • Il ne peut pas analyser la première ligne de la requête.
  • Le délimiteur : manque dans un en-tête.
  • Les en-têtes ou la première ligne contiennent des caractères non valides.
  • La longueur du contenu n'est pas un nombre valide, ou il existe plusieurs en-têtes de longueur de contenu.
  • Il existe plusieurs clés de codage de transfert ou des valeurs de codage de transfert non reconnues.
  • La requête présente un corps non découpé en blocs et aucune longueur de contenu n'est spécifiée.
  • Les blocs de corps ne peuvent pas être analysés. C'est le seul cas de figure où certaines données parviennent au backend. L'équilibreur de charge ferme les connexions au client et au backend lorsqu'il reçoit un bloc impossible à analyser.

L'équilibreur de charge bloque la requête si l'une des conditions suivantes est remplie :

L'équilibreur de charge bloque la réponse du backend si l'une des conditions suivantes est remplie :

  • La taille totale des en-têtes de réponse dépasse la taille d'en-tête de réponse maximale autorisée pour les équilibreurs de charge d'application externes.
  • La version de HTTP est inconnue.

Distribution du trafic

Lorsque vous ajoutez un groupe d'instances backend ou un NEG à un service de backend, vous spécifiez un mode d'équilibrage, qui définit une méthode mesurant la charge du backend et une capacité cible. Les équilibreurs de charge d'application externes sont compatibles avec deux modes d'équilibrage :

  • RATE, pour les groupes d'instances ou les NEG, est le nombre cible maximal de requêtes par seconde (RPS). La valeur RPS cible maximale peut être dépassée si tous les backends ont une capacité égale ou supérieure.

  • UTILIZATION est l'utilisation du backend des VM dans un groupe d'instances.

La manière dont le trafic est réparti entre les backends dépend du mode de l'équilibreur de charge.

Équilibreur de charge d'application externe global

Avant qu'un serveur GFE (Google Front End) envoie des requêtes aux instances backend, le GFE estime quelles instances backend peuvent recevoir des requêtes. Cette estimation de la capacité est effectuée de manière proactive, et non au moment où les requêtes arrivent. Les GFE reçoivent régulièrement des informations sur la capacité disponible et distribuent les requêtes entrantes en conséquence.

La capacité dépend en partie du mode d'équilibrage. Pour le mode RATE, c'est relativement simple : un GFE détermine exactement le nombre de requêtes qu'il peut attribuer par seconde. L'équilibrage de charge basé sur UTILIZATION est plus complexe : l'équilibreur de charge vérifie l'utilisation actuelle des instances, puis estime une charge de requête que chaque instance peut gérer. Cette estimation évolue au fil du temps lorsque l'utilisation des instances et les modèles de trafic changent.

Ces deux facteurs (l'estimation de la capacité et l'attribution proactive) influencent la répartition entre les instances. Ainsi, Cloud Load Balancing se comporte différemment d'un simple équilibreur de charge round robin (à tour de rôle) qui répartit exactement les requêtes à 50/50 entre deux instances. Au lieu de cela, l'équilibrage de charge Google Cloud tente d'optimiser la sélection de l'instance backend pour chaque requête.

Pour l'équilibreur de charge d'application externe global, l'équilibrage de charge est réparti sur deux niveaux. Le mode d'équilibrage détermine la pondération/la fraction du trafic à envoyer à chaque backend (groupe d'instances ou NEG ). Ensuite, la règle d'équilibrage de charge (LocalityLbPolicy) détermine la manière dont le trafic est distribué aux instances ou aux points de terminaison au sein du groupe. Pour en savoir plus, consultez la page Règle d'équilibrage de charge de la zone (documentation de l'API du service de backend).

Pour l'équilibreur de charge d'application classique, le mode d'équilibrage permet de sélectionner le backend le plus adapté (groupe d'instances ou NEG). Le trafic est ensuite distribué à tour de rôle entre les instances ou les points de terminaison du backend.

Distribution des requêtes

Les équilibreurs de charge d'application externes basés sur GFE utilisent le processus suivant pour répartir les requêtes entrantes :

  1. Du client au GFE de première couche. Les routeurs de périphérie annoncent l'adresse IP externe de la règle de transfert à la périphérie du réseau de Google. Chaque annonce répertorie un prochain saut vers un système d'équilibrage de charge de couche 3/4 (Maglev). Les systèmes Maglev acheminent le trafic vers un GFE (Google Front End) de première couche.
    • Lorsque vous utilisez le niveau Premium, Google annonce l'adresse IP de votre équilibreur de charge à partir de tous les points of presence dans le monde. Toutes les adresses IP de l'équilibreur de charge sont anycast mondiales.
    • Lorsque vous utilisez le niveau Standard, Google annonce l'adresse IP de votre équilibreur de charge à partir des points of presence associés à la région de la règle de transfert. L'équilibreur de charge utilise une adresse IP externe régionale. L'utilisation d'une règle de transfert de niveau Standard vous limite à un groupe d'instances et à des backends de NEG zonaux dans la même région que la règle de transfert de l'équilibreur de charge.
  2. Du GFE de première couche au GFE de deuxième couche. Le GFE de première couche interrompt le protocole TLS si nécessaire, puis achemine le trafic vers les GFE de deuxième couche en suivant le processus suivant :
    • Les GFE de première couche analysent le mappage d'URL et sélectionnent un service de backend ou un bucket backend.
    • Pour les services de backend dotés de NEG Internet, les GFE de première couche sélectionnent une passerelle de transfert externe de deuxième couche colocalisée avec le GFE de première couche. La passerelle de transfert envoie des requêtes au point de terminaison du NEG Internet. Ainsi s'achève le processus de répartition des requêtes pour les NEG Internet.
    • Pour les services de backend dotés de NEG sans serveur, de NEG Private Service Connect (PSC) et de buckets backend, les GFE de première couche sélectionnent un GFE de deuxième couche dans la région du NEG ou du bucket. Pour les buckets Cloud Storage multirégionaux, les GFE de première couche sélectionnent des GFE de deuxième couche dans une région aussi proche que possible des GFE de première couche (définie par le délai aller-retour du réseau).
    • Pour les services de backend dotés de groupes d'instances, de NEG zonaux avec des points de terminaison GCE_VM_IP_PORT et de NEG hybrides, le système de gestion de la capacité de Google informe les GFE de première couche de la capacité utilisée et configurée pour chaque backend. La capacité configurée pour un backend est définie par le mode d'équilibrage, la capacité cible du mode d'équilibrage et le scaler de capacité.
      • Niveau Standard : Les GFE de première couche sélectionnent un GFE de deuxième couche dans la région contenant les backends.
      • Niveau Premium : les GFE de première couche sélectionnent des GFE de deuxième couche dans un ensemble de régions applicables. Les régions applicables correspondent à toutes les régions dans lesquelles les backends ont été configurés, à l'exception de celles comportant des backends configurés sans capacité. Les GFE de première couche sélectionnent les GFE de deuxième couche les plus proches dans une région applicable (définis par le délai aller-retour du réseau). Si les backends sont configurés dans au moins deux régions, les GFE de première couche peuvent transférer des requêtes vers d'autres régions applicables si une région de premier choix est saturée. Le basculement vers d'autres régions est possible lorsque tous les backends de la région de premier choix sont saturés.
  3. Les GFE de deuxième couche sélectionnent des backends. Les GFE de deuxième couche sont situés dans des zones d'une région. Ils sélectionnent un backend en suivant le processus suivant :
    • Pour les services de backend dotés de NEG sans serveur, de NEG Private Service Connect et de buckets backend, les GFE de deuxième couche transfèrent les requêtes vers les systèmes de production de Google. Ainsi s'achève le processus de répartition des requêtes pour ces backends.
    • Pour les services de backend dotés de groupes d'instances, de NEG zonaux avec des points de terminaison GCE_VM_IP_PORT et de NEG hybrides, les systèmes de vérification d'état de Google informent les GFE de deuxième couche de l'état de la vérification d'état des instances backend ou des points de terminaison.

      Niveau Premium uniquement : Si le GFE de deuxième couche ne possède pas d'instances backend ni de points de terminaison opérationnels dans sa région, il peut envoyer des requêtes à un autre GFE de deuxième couche dans une autre région applicable avec des backends configurés. Le basculement entre les GFE de deuxième couche dans différentes régions n'épuise pas toutes les combinaisons de région à région possibles. Si vous devez détourner le trafic des backends d'une région particulière, au lieu de configurer les backends pour qu'ils échouent aux vérifications d'état, vous devez définir le scaler de capacité du backend sur zéro afin que le GFE de première couche exclut la région à l'étape précédente.

    Le GFE de deuxième couche achemine ensuite les requêtes vers des instances backend ou des points de terminaison dans des zones de sa région, comme indiqué à l'étape suivante.

  4. Le GFE de deuxième couche sélectionne une zone. Par défaut, les GFE de deuxième couche utilisent l'algorithme WATERFALL_BY_REGION, dans lequel chaque GFE de deuxième couche privilégie la sélection d'instances backend ou de points de terminaison dans la zone contenant le GFE de deuxième couche. Comme WATERFALL_BY_REGION minimise le trafic entre les zones, à des taux de requêtes faibles, chaque GFE de deuxième couche peut envoyer exclusivement des requêtes aux backends situés dans la zone du GFE de deuxième couche.

    Pour les équilibreurs de charge d'application externes globaux uniquement, les GFE de deuxième couche peuvent être configurés pour utiliser l'un des algorithmes alternatifs suivants à l'aide d'une règle serviceLbPolicy :

    • SPRAY_TO_REGION : les GFE de deuxième couche ne privilégient pas la sélection d'instances backend ou de points de terminaison dans la même zone que le GFE de deuxième couche. Les GFE de deuxième couche tentent de répartir le trafic vers l'ensemble des instances backend ou des points de terminaison de toutes les zones de la région. Cela peut entraîner une répartition plus équitable de la charge au détriment de la hausse du trafic entre les zones.
    • WATERFALL_BY_ZONE : les GFE de deuxième couche préfèrent fortement sélectionner des instances backend ou des points de terminaison dans la même zone que le GFE de deuxième couche. Les GFE de deuxième couche n'acheminent les requêtes vers les backends de différentes zones qu'une fois que tous les backends de la zone actuelle ont atteint leurs capacités configurées.
  5. Le GFE de deuxième couche sélectionne des instances ou des points de terminaison dans la zone. Par défaut, un GFE de deuxième couche répartit les requêtes entre les backends à tour de rôle. Pour les équilibreurs de charge d'application externes globaux uniquement, vous pouvez modifier ce comportement à l'aide d'une règle d'équilibrage de charge de localité (localityLbPolicy). Celle-ci ne s'applique qu'aux backends de la zone sélectionnée décrite à l'étape précédente.

Équilibreur de charge d'application externe régional

Pour les équilibreurs de charge d'application externes régionaux, la répartition du trafic est basée sur le mode d'équilibrage de charge et sur la règle de localité d'équilibrage de charge.

Le mode d'équilibrage détermine la pondération et la fraction de trafic à envoyer à chaque groupe (groupe d'instances ou NEG). La règle de localité d'équilibrage de charge (LocalityLbPolicy) détermine la manière dont les backends du groupe sont équilibrés.

Lorsqu'un service de backend reçoit du trafic, il dirige tout d'abord le trafic vers un backend (groupe d'instances ou NEG) en fonction du mode d'équilibrage du backend. Ensuite, une fois le backend sélectionné, le trafic est réparti entre les instances ou les points de terminaison de ce groupe de backend conformément à la règle de localité d'équilibrage de charge.

Pour en savoir plus, consultez les ressources suivantes :

Affinité de session

L'affinité de session tente au mieux d'envoyer les requêtes d'un client donné au même backend, à condition qu'il soit opérationnel et dispose d'une capacité suffisante, en fonction du mode d'équilibrage configuré.

Lorsque vous utilisez l'affinité de session, nous vous recommandons d'utiliser le mode d'équilibrage RATE au lieu de UTILIZATION. L'affinité de session est plus efficace si vous définissez le mode d'équilibrage sur le nombre de requêtes par seconde (RPS).

Les équilibreurs de charge d'application externes offrent les types d'affinité de session suivants :

Le tableau suivant récapitule les options d'affinité de session compatibles avec les équilibreurs de charge d'application externes dans chaque mode :

Mode d'équilibreur de charge Options d'affinité de session
  Aucun IP client Cookie généré Champ d'en-tête Cookie HTTP
Équilibreur de charge d'application externe global
Équilibreur de charge d'application classique
Équilibreur de charge d'application externe régional

Compatibilité HTTP/2

Le protocole HTTP/2 est une révision majeure du protocole HTTP/1. Le protocole HTTP/2 accepte les connexions entre les clients et l'équilibreur de charge d'application externe, ainsi que les connexions entre l'équilibreur de charge et ses backends.

L'équilibreur de charge négocie automatiquement le protocole HTTP/2 avec les clients dans le cadre du handshake TLS à l'aide de l'extension TLS ALPN. Même si un équilibreur de charge est configuré pour utiliser HTTPS, les clients modernes utilisent par défaut HTTP/2. Cette opération est contrôlée côté client et non au niveau de l'équilibreur de charge.

Si un client n'est pas compatible avec le protocole HTTP/2 et que l'équilibreur de charge est configuré pour utiliser HTTP/2 entre l'équilibreur de charge et les instances backend, l'équilibreur de charge peut toujours négocier une connexion HTTPS ou accepter des requêtes HTTP non sécurisées. Ces requêtes HTTPS ou HTTP sont ensuite transformées par l'équilibreur de charge pour relayer les requêtes par proxy via HTTP/2 vers les instances backend.

Pour utiliser HTTP/2, vous devez activer TLS sur vos backends. Pour en savoir plus, consultez la section Chiffrement entre l'équilibreur de charge et les backends.

Nombre maximal de flux simultanés HTTP/2

Le paramètre SETTINGS_MAX_CONCURRENT_STREAMS HTTP/2 décrit le nombre maximal de flux accepté par le point de terminaison (flux lancés par le point de terminaison pair). La valeur annoncée par un client HTTP/2 à un équilibreur de charge Google Cloud est sans importance, car l'équilibreur de charge ne lance pas de flux vers le client.

Dans le cas où l'équilibreur de charge utilise HTTP/2 pour communiquer avec un serveur qui s'exécute sur une VM, l'équilibreur de charge respecte la valeur SETTINGS_MAX_CONCURRENT_STREAMS annoncée par le serveur. Si une valeur "zéro" est annoncée, l'équilibreur de charge ne peut pas transférer les requêtes vers le serveur, et cela peut générer des erreurs.

Limites liées à HTTP/2

  • Le protocole HTTP/2 entre l'équilibreur de charge et l'instance peut nécessiter beaucoup plus de connexions TCP à l'instance que HTTP(S). Le regroupement de connexions, une optimisation qui réduit le nombre de ces connexions avec HTTP(S), n'est pas disponible actuellement avec HTTP/2. Par conséquent, vous pouvez constater des latences de backend élevées, car les connexions backend sont établies plus fréquemment.
  • Le protocole HTTP/2 entre l'équilibreur de charge et le backend n'est pas compatible avec l'exécution du protocole WebSocket sur un seul flux d'une connexion HTTP/2 (RFC 8441).
  • Le protocole HTTP/2 entre l'équilibreur de charge et le backend n'est pas compatible avec le serveur push.
  • Le taux d'erreur gRPC et le volume de requêtes ne sont pas visibles dans l'API Google Cloud ni dans la console Google Cloud. Si le point de terminaison gRPC renvoie une erreur, les journaux de l'équilibreur de charge et les données de surveillance signalent le code de réponse HTTP OK 200.

Compatibilité HTTP/3

HTTP/3 est un protocole Internet de nouvelle génération. Il repose sur IETF QUIC, un protocole développé à partir du protocole Google QUIC d'origine. Le protocole HTTP/3 assure la compatibilité entre l'équilibreur de charge d'application externe, Cloud CDN et les clients.

à savoir :

  • IETF QUIC est un protocole de couche de transport qui offre un contrôle de congestion et une fiabilité semblables à TCP, qui utilise TLS 1.3 pour une sécurité optimale, et qui fournit des performances améliorées.
  • HTTP/3 est une couche d'application basée sur IETF QUIC qui s'appuie sur QUIC pour gérer le multiplexage, le contrôle de congestion, la détection de perte et la retransmission.
  • Le protocole HTTP/3 permet d'initier les connexions client plus rapidement, élimine le blocage en tête de ligne dans les flux multiplexés et permet de migrer la connexion lorsque l'adresse IP d'un client change.
  • Le protocole HTTP/3 accepte les connexions entre les clients et l'équilibreur de charge, mais pas les connexions entre l'équilibreur de charge et ses backends.
  • Les connexions HTTP/3 utilisent l'algorithme de contrôle de congestion BBR.

L'utilisation du protocole HTTP/3 sur votre équilibreur de charge peut améliorer le temps de chargement des pages Web, réduire les nouvelles mises en mémoire tampon de vidéos et améliorer le débit sur les connexions à latence plus élevée.

Le tableau suivant spécifie la compatibilité HTTP/3 pour les équilibreurs de charge d'application externes dans chaque mode.

Mode d'équilibreur de charge Compatibilité HTTP/3
Équilibreur de charge d'application externe global (toujours au niveau Premium)
Équilibreur de charge d'application classique au niveau Premium
Équilibreur de charge d'application classique au niveau Standard
Équilibreur de charge d'application externe régional (niveau Premium ou Standard)

Négociation du protocole HTTP/3

Lorsque le protocole HTTP/3 est activé, l'équilibreur de charge annonce cette compatibilité aux clients, ce qui permet aux clients compatibles avec HTTP/3 d'établir des connexions HTTP/3 avec l'équilibreur de charge HTTPS.

  • Les clients correctement mis en œuvre peuvent toujours revenir au protocole HTTPS ou HTTP/2 lorsqu'ils ne parviennent pas à établir une connexion HTTP/3.
  • Les clients compatibles avec HTTP/3 utilisent leurs connaissances antérieures mises en cache de la compatibilité HTTP/3 pour éviter les allers-retours inutiles.
  • Du fait de ce mécanisme, activer ou désactiver HTTP/3 dans l'équilibreur de charge n'affecte pas sa capacité à se connecter aux clients.

La compatibilité est annoncée dans l'en-tête de réponse HTTP Alt-Svc. Lorsque HTTP/3 est activé, les réponses de l'équilibreur de charge incluent la valeur d'en-tête alt-svc suivante :

alt-svc: h3=":443"; ma=2592000,h3-29=":443"; ma=2592000"

Si le protocole HTTP/3 a été explicitement défini sur DISABLE, les réponses n'incluent pas d'en-tête de réponse alt-svc.

Lorsque HTTP/3 est activé sur votre équilibreur de charge HTTPS, certaines circonstances peuvent amener le client à revenir au protocole HTTPS ou HTTP/2 au lieu de négocier le protocole HTTP/3. En voici quelques-unes :

  • Lorsqu'un client est compatible avec des versions du protocole HTTP/3 qui ne sont pas acceptées par l'équilibreur de charge HTTPS.
  • Lorsque l'équilibreur de charge détecte que le trafic UDP est bloqué ou soumis à une limitation de débit, d'une manière qui empêcherait le bon fonctionnement de HTTP/3.
  • Le client n'est pas du tout compatible avec le protocole HTTP/3 et ne tente donc pas de négocier une connexion HTTP/3.

Lorsqu'une connexion se rabat sur HTTPS ou HTTP/2, nous ne comptabilisons pas ce problème comme une défaillance de l'équilibreur de charge.

Avant d'activer le protocole HTTP/3, assurez-vous que les comportements décrits ci-dessus sont acceptables pour vos charges de travail.

Configurer le protocole HTTP/3

Les valeurs NONE (par défaut) et ENABLE activent toutes deux la compatibilité HTTP/3 pour votre équilibreur de charge.

Lorsque le protocole HTTP/3 est activé, l'équilibreur de charge l'annonce aux clients. Ainsi, les clients compatibles peuvent négocier une version HTTP/3 avec l'équilibreur de charge. Les clients qui ne sont pas compatibles avec HTTP/3 ne négocient pas de connexion HTTP/3. Vous n'avez pas besoin de désactiver explicitement HTTP/3, sauf si vous avez identifié des mises en œuvre clientes défectueuses.

Les équilibreurs de charge d'application externes proposent trois méthodes de configuration du protocole HTTP/3, comme indiqué dans le tableau suivant.

Valeur quicOverride Comportement
NONE

La compatibilité du protocole HTTP/3 est annoncée aux clients.

ENABLE

La compatibilité du protocole HTTP/3 est annoncée aux clients.

Remarque : TLS 0-RTT (également appelé données anticipées TLS) n'est pas encore compatible avec HTTP/3.

DISABLE Désactive explicitement la diffusion des annonces concernant les protocoles HTTP/3 et QUIC aux clients.

Pour activer (ou désactiver) explicitement HTTP/3, procédez comme suit.

Console : HTTPS

  1. Dans Google Cloud Console, accédez à la page Équilibrage de charge.

    Accéder à la page "Équilibrage de charge"

  2. Sélectionnez l'équilibreur de charge que vous souhaitez modifier.

  3. Cliquez sur Frontend configuration (Configuration du frontend).

  4. Sélectionnez l'adresse IP et le port de l'interface que vous souhaitez modifier. Pour modifier une configuration HTTP/3, le protocole doit être HTTPS.

Activer le protocole HTTP/3

  1. Sélectionnez la liste déroulante Négociation QUIC.
  2. Pour activer explicitement HTTP/3 pour cette interface, sélectionnez Activé.
  3. Si vous disposez de plusieurs règles d'interface représentant IPv4 et IPv6, assurez-vous d'activer HTTP/3 sur chaque règle.

Désactiver le protocole HTTP/3

  1. Sélectionnez la liste déroulante Négociation QUIC.
  2. Pour désactiver explicitement HTTP/3 pour cette interface, sélectionnez Désactivé.
  3. Si vous disposez de plusieurs règles d'interface représentant IPv4 et IPv6, assurez-vous de désactiver HTTP/3 pour chaque règle.

gcloud : HTTPS

Avant d'exécuter cette commande, vous devez créer une ressource de certificat SSL pour chaque certificat.

gcloud compute target-https-proxies create HTTPS_PROXY_NAME \
    --global \
    --quic-override=QUIC_SETTING

Remplacez QUIC_SETTING par l'un des éléments suivants :

  • NONE (par défaut) : permet à Google de contrôler l'annonce du protocole HTTP/3.

    Lorsque vous sélectionnez NONE, HTTP/3 est annoncé aux clients, mais pas Google QUIC. Dans la console Google Cloud, cette option est appelée Automatique (par défaut).

  • ENABLE : annonce le protocole HTTP/3 aux clients.

  • DISABLE : n'annonce pas le protocole HTTP/3 aux clients.

API : HTTPS

POST https://www.googleapis.com/v1/compute/projects/PROJECT_ID/global/targetHttpsProxies/TARGET_PROXY_NAME/setQuicOverride

{
  "quicOverride": QUIC_SETTING
}

Remplacez QUIC_SETTING par l'un des éléments suivants :

  • NONE (par défaut) : permet à Google de contrôler l'annonce du protocole HTTP/3.

    Actuellement, lorsque vous sélectionnez NONE, HTTP/3 est annoncé aux clients, mais pas Google QUIC.

    Dans Google Cloud Console, cette option est appelée Automatique (par défaut).

  • ENABLE : annonce les protocoles HTTP/3 et Google QUIC aux clients.

  • DISABLE : n'annonce pas les protocoles HTTP/3 ou Google QUIC aux clients.

Limites

  • Les équilibreurs de charge HTTPS n'envoient pas d'alerte de fermeture close_notify lorsqu'ils mettent fin aux connexions SSL. En d'autres termes, l'équilibreur de charge ferme la connexion TCP au lieu de procéder à l'arrêt d'une connexion SSL.
  • Les équilibreurs de charge HTTPS n'acceptent que les minuscules dans les domaines d'un attribut de nom commun (CN) ou d'un autre nom d'objet (SAN) du certificat. Les certificats dont les domaines contiennent des majuscules ne sont renvoyés que lorsqu'ils sont définis comme certificat principal dans le proxy cible.
  • Les équilibreurs de charge HTTPS n'utilisent pas l'extension SNI (Server Name Indication) lors de la connexion au backend, à l'exception des équilibreurs de charge avec des backends NEG Internet. Pour en savoir plus, consultez la section Chiffrement entre l'équilibreur de charge et les backends.
  • Lorsque vous utilisez des équilibreurs de charge d'application externes régionaux avec Cloud Run dans un environnement VPC partagé, les réseaux VPC autonomes des projets de service peuvent envoyer du trafic vers d'autres services Cloud Run déployés dans d'autres projets de service au sein du même environnement VPC partagé. Il s'agit d'un problème connu. Ce type d'accès sera bloqué à l'avenir.
  • Google Cloud ne garantit pas qu'une connexion TCP sous-jacente peut rester ouverte pendant toute la durée du délai avant expiration du service de backend. Les systèmes clients doivent mettre en œuvre une logique de nouvelle tentative au lieu de compter sur une connexion TCP pour être ouverte pendant de longues périodes.
  • Vous ne pouvez pas créer un équilibreur de charge d'application externe régional au niveau Premium à l'aide de la console Google Cloud. Utilisez plutôt gcloud CLI ou l'API.

Étapes suivantes