Google Cloud 는 인스턴스 그룹에 대한 부하 분산 및 자동 확장 기능을 제공합니다.
부하 분산
Google Cloud 는 서버 측 부하 분산 기능을 제공하므로 수신 트래픽을 여러 가상 머신(VM) 인스턴스에 분산할 수 있습니다. 부하 분산은 다음과 같은 이점을 제공합니다.
앱 확장
높은 트래픽을 지원
상태 확인으로 비정상적인 VM 인스턴스를 감지하여 자동으로 삭제. 다시 정상화된 인스턴스는 자동으로 다시 추가됩니다.
트래픽을 가장 가까운 가상 머신으로 라우팅
Google Cloud 부하 분산은 전달 규칙 리소스를 사용하여 해당하는 특정 유형의 트래픽을 찾고 이를 부하 분산기로 전달합니다.
예를 들어 전달 규칙에 따라 IP 주소 192.0.2.1의 포트 80을 대상으로 하는 TCP 트래픽이 발견되면 이를 부하 분산기로 전달할 수 있으며, 그러면 부하 분산기는 이 트래픽을 정상적인 VM 인스턴스로 보냅니다.
Google Cloud 부하 분산은 관리형 서비스이므로 구성요소가 중복적이고 가용성이 높습니다. 부하 분산 구성요소가 실패하면 자동으로 즉시 다시 시작되거나 대체됩니다.
Google Cloud 는 기능, 사용 시나리오, 구성 방법이 다른 여러 가지 유형의 부하 분산을 제공합니다. 자세한 설명은 Google Cloud 부하 분산 문서를 참고하세요.
자동 확장
Compute Engine은 부하의 증가 또는 감소에 따라 관리형 인스턴스 그룹(MIG)에서 VM 인스턴스를 자동으로 추가하거나 삭제하는 자동 확장 기능을 제공합니다. 자동 확장을 사용하면 애플리케이션에서 트래픽 증가 처리가 원활해지며, 리소스 수요가 줄면 비용을 절감할 수 있습니다. CPU 사용률, Cloud Monitoring 측정항목, 일정 또는 부하 분산 제공 용량을 기준으로 MIG를 자동 확장할 수 있습니다.
부하 분산 제공 용량을 기준으로 확장되도록 자동 확장 처리를 구성하면 자동 확장 처리에서 인스턴스 그룹의 제공 용량을 관찰하고 VM 인스턴스가 용량을 초과하거나 용량보다 부족하면 조정합니다. 인스턴스의 처리 용량은 부하 분산기의 백엔드 서비스에서 정의할 수 있으며 초당 사용량 또는 요청 수를 기준으로 합니다. 자세한 내용은 부하 분산 제공 용량에 따라 확장을 참조하세요.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-03(UTC)"],[[["\u003cp\u003eGoogle Cloud offers server-side load balancing to distribute incoming traffic across multiple virtual machine instances, ensuring high availability and scalability.\u003c/p\u003e\n"],["\u003cp\u003eThe load balancing service uses forwarding rules to direct specific types of traffic to a load balancer, which then routes it to healthy VM instances.\u003c/p\u003e\n"],["\u003cp\u003eAutoscaling in Compute Engine automatically adjusts the number of VM instances in a managed instance group based on various factors such as CPU utilization, Cloud Monitoring metrics, schedules, or load balancing serving capacity.\u003c/p\u003e\n"],["\u003cp\u003eGoogle Cloud's autoscaling feature can scale based on the serving capacity of the instance group, defined in the load balancer's backend service, which can use either utilization or requests per second as metrics.\u003c/p\u003e\n"]]],[],null,["*** ** * ** ***\n\nGoogle Cloud offers load balancing and autoscaling for\n[groups of instances](/compute/docs/instance-groups).\n\nLoad balancing\n\nGoogle Cloud offers server-side load balancing so you can distribute\nincoming traffic across multiple virtual machine (VM) instances. Load\nbalancing provides the following benefits:\n\n- Scale your app\n- Support heavy traffic\n- Detect and automatically remove unhealthy VM instances using [health checks](/load-balancing/docs/health-check-concepts). Instances that become healthy again are automatically re-added.\n- Route traffic to the closest virtual machine\n\nGoogle Cloud load balancing uses forwarding rule\nresources to match certain types of traffic and forward it to a load balancer.\nFor example, a forwarding rule can match TCP traffic destined to port 80 on IP\naddress `192.0.2.1`, then forward it to a load balancer, which then directs\nit to healthy VM instances.\n\nGoogle Cloud load balancing is a managed service, which means its\ncomponents are redundant and highly available. If a load balancing component\nfails, it is restarted or replaced automatically and immediately.\n\nGoogle Cloud offers several different types of load balancing that\ndiffer in\ncapabilities, usage scenarios, and how you configure them. See\n[Google Cloud load balancing documentation](/load-balancing/docs)\nfor descriptions.\n\nAutoscaling\n\nCompute Engine offers autoscaling to automatically add or remove VM\ninstances from a\n[managed instance group (MIG)](/compute/docs/instance-groups#managed_instance_groups)\nbased on increases or decreases in load. Autoscaling lets your apps gracefully\nhandle increases in traffic, and it reduces cost when the need for resources is\nlower. You can autoscale a MIG based on its CPU utilization, Cloud Monitoring\nmetrics, schedules, or load balancing serving capacity.\n\nWhen you set up an autoscaler to scale based on load balancing serving capacity,\nthe autoscaler watches the serving capacity of an instance group and scales\nwhen the VM instances are over or under capacity. The serving capacity of an\ninstance can be defined in the load balancer's\n[backend service](/load-balancing/docs/backend-service) and can be\nbased on either utilization or requests per second. For more information, see\n[Scaling based on load balancing serving capacity](/compute/docs/autoscaler/scaling-load-balancing).\n\nTo learn more about autoscaling, see [Autoscaling groups of instances](/compute/docs/autoscaler).\n\nWhat's next\n\n- Learn more about [instance groups](/compute/docs/instance-groups).\n- Learn how to [autoscale managed instance groups](/compute/docs/autoscaler) based on:\n - [CPU utilization](/compute/docs/autoscaler/scaling-cpu)\n - [Load balancing serving capacity](/compute/docs/autoscaler/scaling-load-balancing)\n - [Monitoring metrics](/compute/docs/autoscaler/scaling-stackdriver-monitoring-metrics)\n - [Schedules](/compute/docs/autoscaler/scaling-schedules)\n- Learn how to [choose a load balancer](/load-balancing/docs/choosing-load-balancer) and\n - How to [set up an external Application Load Balancer](/load-balancing/docs/https/setting-up-https)\n - How to [set up an external passthrough Network Load Balancer](/load-balancing/docs/network/setting-up-network)"]]