Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Google Cloud ofrece balanceo de cargas y ajuste de escala automático para grupos de instancias.
Balanceo de cargas
Google Cloud ofrece balanceo de cargas del servidor para que puedas distribuir el tráfico entrante en varias instancias de máquina virtual (VM). El balanceo de cargas proporciona los siguientes beneficios:
Escalamiento de tu app
Compatibilidad con mucho tráfico
Detección y eliminación automática de instancias de máquina virtual en mal estado con la verificación de estado Cuando una instancia recobra el buen estado, se vuelve a agregar de manera automática
Enrutamiento del tráfico a la máquina virtual más cercana
El balanceo de cargas deGoogle Cloud usa recursos de reglas de reenvío para hacer coincidir ciertos tipos de tráfico y reenviarlo a un balanceador de cargas.
Por ejemplo, una regla de reenvío puede hacer coincidir el tráfico de TCP destinado al puerto 80 en la dirección IP 192.0.2.1 y, luego, reenviarlo a un balanceador de cargas que lo dirija a instancias de VM en buen estado.
El balanceo de cargas deGoogle Cloud es un servicio administrado, lo que significa que sus componentes son redundantes y con alta disponibilidad. Si un componente del balanceo de cargas falla, se reinicia o se reemplaza de inmediato de forma automática.
Google Cloud ofrece varios tipos diferentes de balanceo de cargas que difieren en cuanto a sus capacidades, situaciones de uso y formas de configuración. Consulta la documentación de balanceo de cargas deGoogle Cloud para obtener descripciones.
Ajuste de escala automático
Compute Engine ofrece ajuste de escala automático para agregar o quitar instancias de VM de un grupo de instancias administrado (MIG) de forma automática en función de los aumentos o disminuciones en la carga. El ajuste de escala automático permite que tus apps administren de forma correcta los aumentos de tráfico y reduce los costos cuando la necesidad de recursos es menor. Puedes realizar un ajuste de escala automático en un MIG según el uso de CPU, las métricas de Cloud Monitoring, los programas o la capacidad de entrega del balanceo de cargas.
Cuando configuras un escalador automático para que realice ajustes en función de la capacidad de procesamiento del balanceo de cargas, este analiza la capacidad de procesamiento de un grupo de instancias y realiza ajustes cuando las instancias de VM están por encima o por debajo de la capacidad. La capacidad activa de una instancia se puede definir en el servicio de backend del balanceador de cargas y se puede basar en el uso o las solicitudes por segundo. Para obtener más información, consulta Cómo escalar en función de la capacidad de entrega de balanceo de cargas.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-03 (UTC)"],[[["\u003cp\u003eGoogle Cloud offers server-side load balancing to distribute incoming traffic across multiple virtual machine instances, ensuring high availability and scalability.\u003c/p\u003e\n"],["\u003cp\u003eThe load balancing service uses forwarding rules to direct specific types of traffic to a load balancer, which then routes it to healthy VM instances.\u003c/p\u003e\n"],["\u003cp\u003eAutoscaling in Compute Engine automatically adjusts the number of VM instances in a managed instance group based on various factors such as CPU utilization, Cloud Monitoring metrics, schedules, or load balancing serving capacity.\u003c/p\u003e\n"],["\u003cp\u003eGoogle Cloud's autoscaling feature can scale based on the serving capacity of the instance group, defined in the load balancer's backend service, which can use either utilization or requests per second as metrics.\u003c/p\u003e\n"]]],[],null,["*** ** * ** ***\n\nGoogle Cloud offers load balancing and autoscaling for\n[groups of instances](/compute/docs/instance-groups).\n\nLoad balancing\n\nGoogle Cloud offers server-side load balancing so you can distribute\nincoming traffic across multiple virtual machine (VM) instances. Load\nbalancing provides the following benefits:\n\n- Scale your app\n- Support heavy traffic\n- Detect and automatically remove unhealthy VM instances using [health checks](/load-balancing/docs/health-check-concepts). Instances that become healthy again are automatically re-added.\n- Route traffic to the closest virtual machine\n\nGoogle Cloud load balancing uses forwarding rule\nresources to match certain types of traffic and forward it to a load balancer.\nFor example, a forwarding rule can match TCP traffic destined to port 80 on IP\naddress `192.0.2.1`, then forward it to a load balancer, which then directs\nit to healthy VM instances.\n\nGoogle Cloud load balancing is a managed service, which means its\ncomponents are redundant and highly available. If a load balancing component\nfails, it is restarted or replaced automatically and immediately.\n\nGoogle Cloud offers several different types of load balancing that\ndiffer in\ncapabilities, usage scenarios, and how you configure them. See\n[Google Cloud load balancing documentation](/load-balancing/docs)\nfor descriptions.\n\nAutoscaling\n\nCompute Engine offers autoscaling to automatically add or remove VM\ninstances from a\n[managed instance group (MIG)](/compute/docs/instance-groups#managed_instance_groups)\nbased on increases or decreases in load. Autoscaling lets your apps gracefully\nhandle increases in traffic, and it reduces cost when the need for resources is\nlower. You can autoscale a MIG based on its CPU utilization, Cloud Monitoring\nmetrics, schedules, or load balancing serving capacity.\n\nWhen you set up an autoscaler to scale based on load balancing serving capacity,\nthe autoscaler watches the serving capacity of an instance group and scales\nwhen the VM instances are over or under capacity. The serving capacity of an\ninstance can be defined in the load balancer's\n[backend service](/load-balancing/docs/backend-service) and can be\nbased on either utilization or requests per second. For more information, see\n[Scaling based on load balancing serving capacity](/compute/docs/autoscaler/scaling-load-balancing).\n\nTo learn more about autoscaling, see [Autoscaling groups of instances](/compute/docs/autoscaler).\n\nWhat's next\n\n- Learn more about [instance groups](/compute/docs/instance-groups).\n- Learn how to [autoscale managed instance groups](/compute/docs/autoscaler) based on:\n - [CPU utilization](/compute/docs/autoscaler/scaling-cpu)\n - [Load balancing serving capacity](/compute/docs/autoscaler/scaling-load-balancing)\n - [Monitoring metrics](/compute/docs/autoscaler/scaling-stackdriver-monitoring-metrics)\n - [Schedules](/compute/docs/autoscaler/scaling-schedules)\n- Learn how to [choose a load balancer](/load-balancing/docs/choosing-load-balancer) and\n - How to [set up an external Application Load Balancer](/load-balancing/docs/https/setting-up-https)\n - How to [set up an external passthrough Network Load Balancer](/load-balancing/docs/network/setting-up-network)"]]