Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Google Cloud propose l'équilibrage de charge et l'autoscaling pour les groupes d'instances.
Équilibrage de charge
Google Cloud propose l'équilibrage de charge côté serveur afin que vous puissiez distribuer le trafic entrant sur plusieurs instances de machines virtuelles (VM). L'équilibrage de charge offre les avantages suivants :
Faire évoluer votre application
Supporter un trafic dense
Détecter et supprimer automatiquement les instances de machines virtuelles non opérationnelles à l'aide des vérifications d'état. Les instances redevenues opérationnelles sont automatiquement rajoutées.
Acheminer le trafic vers la machine virtuelle la plus proche
L'équilibrage de chargeGoogle Cloud utilise des ressources de règles de transfert qui correspondent à certains types de trafic et les transfèrent vers un équilibreur de charge.
Par exemple, une règle de transfert peut correspondre au trafic TCP destiné au port 80 sur l'adresse IP 192.0.2.1, puis le transférer vers un équilibreur de charge, qui le dirige ensuite vers des instances de VM opérationnelles.
L'équilibrage de chargeGoogle Cloud est un service géré, ce qui signifie que ses composants sont redondants et à disponibilité élevée. Si un composant d'équilibrage de charge échoue, il est redémarré ou automatiquement et immédiatement remplacé.
Google Cloud propose différents types d'équilibrage de charge qui diffèrent par leurs capacités, leurs scénarios d'utilisation et leur configuration. Pour obtenir une description, consultez la documentation sur l'équilibrage de chargeGoogle Cloud .
Autoscaling
Compute Engine propose l'autoscaling pour ajouter ou supprimer automatiquement des instances de VM dans un groupe d'instances géré (MIG) selon la hausse ou la baisse de la charge. Cela permet à vos applications de gérer de façon optimale les hausses de trafic et réduit vos coûts lorsque les besoins en ressources diminuent. Vous pouvez procéder à l'autoscaling d'un groupe d'instances géré en fonction de son utilisation du processeur, des métriques Cloud Monitoring, des planifications ou de la capacité de diffusion de l'équilibrage de charge.
Si vous configurez un autoscaler pour une évolutivité basée sur la capacité de diffusion de l'équilibrage de charge, l'autoscaler surveillera la capacité de diffusion d'un groupe d'instances et adaptera le nombre d'instances de VM si celles-ci sont en sur ou sous-capacité. La capacité de diffusion d'une instance peut être définie dans le service de backend de l'équilibreur de charge et peut être basée sur l'utilisation ou le nombre de requêtes par seconde. Pour en savoir plus, consultez la page Scaling basé sur la capacité de diffusion de l'équilibrage de charge.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/03 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/03 (UTC)."],[[["\u003cp\u003eGoogle Cloud offers server-side load balancing to distribute incoming traffic across multiple virtual machine instances, ensuring high availability and scalability.\u003c/p\u003e\n"],["\u003cp\u003eThe load balancing service uses forwarding rules to direct specific types of traffic to a load balancer, which then routes it to healthy VM instances.\u003c/p\u003e\n"],["\u003cp\u003eAutoscaling in Compute Engine automatically adjusts the number of VM instances in a managed instance group based on various factors such as CPU utilization, Cloud Monitoring metrics, schedules, or load balancing serving capacity.\u003c/p\u003e\n"],["\u003cp\u003eGoogle Cloud's autoscaling feature can scale based on the serving capacity of the instance group, defined in the load balancer's backend service, which can use either utilization or requests per second as metrics.\u003c/p\u003e\n"]]],[],null,["*** ** * ** ***\n\nGoogle Cloud offers load balancing and autoscaling for\n[groups of instances](/compute/docs/instance-groups).\n\nLoad balancing\n\nGoogle Cloud offers server-side load balancing so you can distribute\nincoming traffic across multiple virtual machine (VM) instances. Load\nbalancing provides the following benefits:\n\n- Scale your app\n- Support heavy traffic\n- Detect and automatically remove unhealthy VM instances using [health checks](/load-balancing/docs/health-check-concepts). Instances that become healthy again are automatically re-added.\n- Route traffic to the closest virtual machine\n\nGoogle Cloud load balancing uses forwarding rule\nresources to match certain types of traffic and forward it to a load balancer.\nFor example, a forwarding rule can match TCP traffic destined to port 80 on IP\naddress `192.0.2.1`, then forward it to a load balancer, which then directs\nit to healthy VM instances.\n\nGoogle Cloud load balancing is a managed service, which means its\ncomponents are redundant and highly available. If a load balancing component\nfails, it is restarted or replaced automatically and immediately.\n\nGoogle Cloud offers several different types of load balancing that\ndiffer in\ncapabilities, usage scenarios, and how you configure them. See\n[Google Cloud load balancing documentation](/load-balancing/docs)\nfor descriptions.\n\nAutoscaling\n\nCompute Engine offers autoscaling to automatically add or remove VM\ninstances from a\n[managed instance group (MIG)](/compute/docs/instance-groups#managed_instance_groups)\nbased on increases or decreases in load. Autoscaling lets your apps gracefully\nhandle increases in traffic, and it reduces cost when the need for resources is\nlower. You can autoscale a MIG based on its CPU utilization, Cloud Monitoring\nmetrics, schedules, or load balancing serving capacity.\n\nWhen you set up an autoscaler to scale based on load balancing serving capacity,\nthe autoscaler watches the serving capacity of an instance group and scales\nwhen the VM instances are over or under capacity. The serving capacity of an\ninstance can be defined in the load balancer's\n[backend service](/load-balancing/docs/backend-service) and can be\nbased on either utilization or requests per second. For more information, see\n[Scaling based on load balancing serving capacity](/compute/docs/autoscaler/scaling-load-balancing).\n\nTo learn more about autoscaling, see [Autoscaling groups of instances](/compute/docs/autoscaler).\n\nWhat's next\n\n- Learn more about [instance groups](/compute/docs/instance-groups).\n- Learn how to [autoscale managed instance groups](/compute/docs/autoscaler) based on:\n - [CPU utilization](/compute/docs/autoscaler/scaling-cpu)\n - [Load balancing serving capacity](/compute/docs/autoscaler/scaling-load-balancing)\n - [Monitoring metrics](/compute/docs/autoscaler/scaling-stackdriver-monitoring-metrics)\n - [Schedules](/compute/docs/autoscaler/scaling-schedules)\n- Learn how to [choose a load balancer](/load-balancing/docs/choosing-load-balancer) and\n - How to [set up an external Application Load Balancer](/load-balancing/docs/https/setting-up-https)\n - How to [set up an external passthrough Network Load Balancer](/load-balancing/docs/network/setting-up-network)"]]