Anthos Service Mesh와 Traffic Director가 이제 Cloud Service Mesh로 통합되었습니다. 자세한 내용은 Cloud Service Mesh 개요를 참조하세요.

이 페이지는 Cloud Translation API를 통해 번역되었습니다.

GKE 클러스터의 고급 부하 분산

이 페이지에서는 Kubernetes API를 사용하여 관리형 Cloud Service Mesh(TD) 사용자를 위해 GKE 클러스터에서 고급 부하 분산을 구성하는 방법을 보여줍니다.Google Cloud API를 사용하여 고급 부하 분산을 구성하는 방법에 대한 사용자 가이드는 고급 부하 분산 설정을 참조하세요.

고급 부하 분산을 사용하여 다음을 수행할 수 있습니다.

로컬 용량이 소진될 때까지 트래픽을 서비스 영역으로 유지합니다.
기본 위치의 충분한 엔드포인트가 비정상적이 되면 보조 위치로 장애 조치를 통해 트래픽을 '기본' 위치의 서비스로 전송합니다.
장애 조치가 발생하는 시점을 제어합니다(정상 호스트 비율 기준).

제한사항

Google Cloud 에서 고급 부하 분산 사용과 관련된 일반적인 제한사항이 적용됩니다.
이 기능은 Traffic Director를 컨트롤 플레인으로 사용하는 관리형 Cloud Service Mesh 사용자에게만 제공되며 데이터 영역 버전 1.19.10-asm.22 이상이 필요합니다.
GCPTrafficDistributionPolicy 및 GCPBackendPolicy의 일부 필드는 managedCloud Service Mesh (TD)에서 지원되지 않습니다. 지원되는 필드는 다음과 같습니다.
- GCPTrafficDistributionPolicy
  - ServiceLbAlgorithm
  - AutoCapacityDrain
  - FailoverConfig
- GCPBackendPolicy
  - MaxRatePerEndpoint
  - BackendPreference
나열되지 않은 모든 필드는 지원되지 않는 필드이며 지원되지 않는 필드가 하나 이상 구성된 정책은 Cloud Service Mesh에서 적용되지 않습니다 .
고급 부하 분산은 Google Cloud에서 실행되는 워크로드로 지원되는 Kubernetes 서비스에만 적용될 수 있습니다. 외부 서비스나 워크로드(예: ServiceEntry)는 지원되지 않습니다.
부하 분산 정책은 개별 Kubernetes 서비스에만 적용될 수 있습니다. 네임스페이스 전체/메시 전체 부하 분산 정책은 지원되지 않습니다.
QPS 용량만 지원됩니다.
GKE 버전 1.31.1 이상만 지원됩니다.
서비스 메시 고급 부하 분산 정책은 메시 트래픽만 제공하는 서비스에만 적용되어야 합니다. GKE 게이트웨이 백엔드로 작동하는 서비스에 적용되어서는 안 됩니다. 고급 부하 분산 트래픽이 메시 트래픽과 GKE 게이트웨이의 트래픽을 모두 제공하는 Kubernetes 서비스를 타겟팅하는 경우에는 트래픽 동작이 정의되지 않습니다.

고급 부하 분산 구성

다음 커스텀 리소스를 사용하여 GKE에서 고급 부하 분산을 구성할 수 있습니다. gke-gateway-api 저장소에서 자세한 리소스 정의를 확인할 수 있습니다.

GCPTrafficDistributionPolicy

GCPTrafficDistributionPolicy는 Kubernetes 서비스의 서비스 수준 부하 분산 정책을 구성합니다. 이를 통해 다음과 같이 할 수 있습니다.

커스텀 부하 분산 알고리즘을 선택합니다. 지원되는 알고리즘은 고급 부하 분산 표에 설명되어 있습니다.
자동 용량 드레이닝을 사용 설정합니다.
장애 조치 상태 기준을 조정합니다.

GCPTrafficDistributionPolicy 여러 개에서 같은 서비스를 타겟팅하는 경우 가장 오래된 정책이 적용됩니다.

GCPBackendPolicy

GCPBackendPolicy는 다음을 포함하여 부하 분산 동작에 영향을 미치는 서비스 백엔드 속성을 구성합니다.

서비스 백엔드 용량
선호하는 백엔드 지정

GCPBackendPolicy 여러 개가 클러스터에서 같은 서비스를 타겟팅하는 경우 가장 오래된 정책이 적용됩니다.

정책 상태

GCPTrafficDistributionPolicy 및 GCPBackendPolicy 모두에는 정책 연결 상태를 나타내는 상태 필드가 있습니다.

예를 들어 kubectl describe gcpbackendpolicies example-policy -n example을 실행하면 다음과 유사한 출력이 생성됩니다.

...
Status:
  Ancestors:
    Ancestor Ref:
      Group:
      Kind:       Service
      Name:       example-svc
      Namespace:  example
    Conditions:
      Last Transition Time:  2024-10-13T01:15:03Z
      Message:
      Observed Generation:   1
      Reason:                Attached
      Status:                True
      Type:                  Attached
    Controller Name:         gsmconfig.gke.io/controller

예비 설정

이 가이드를 완료하려면 먼저 GKE 클러스터에서 Cloud Service Mesh를 프로비저닝해야 합니다.

CRD가 설치되었는지 확인합니다.

kubectl get crd

출력은 다음과 비슷합니다.

...
gcptrafficdistributionpolicies.networking.gke.io   2024-07-18T21:50:12Z
gcpbackendpolicies.networking.gke.io               2024-07-18T21:50:12Z
...

GCPBackendPolicy CRD가 아직 설치되어 있지 않으면 설치합니다.

kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/gke-gateway-api/refs/heads/main/config/crd/networking.gke.io_gcpbackendpolicies.yaml

GCPTrafficDistributionPolicy CRD가 아직 설치되어 있지 않으면 설치합니다.

kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/gke-gateway-api/refs/heads/main/config/crd/networking.gke.io_gcptrafficdistributionpolicies.yaml

이 사용자 가이드의 예시 정책은 시연을 위해 foo 네임스페이스의 foo 서비스를 타겟팅합니다. 다음 명령어를 실행하여 테스트 서비스와 네임스페이스를 만들거나 원하는 경우 자체 서비스와 네임스페이스를 사용할 수 있습니다.

kubectl apply -f - <<EOF
kind: Namespace
apiVersion: v1
metadata:
  name: foo
  labels:
    istio-injection: enabled
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: foo
  namespace: foo
spec:
  replicas: 2
  selector:
    matchLabels:
      app: test-backend
  template:
    metadata:
      labels:
        app: test-backend
    spec:
      containers:
      - name: whereami
        image: gcr.io/google-samples/whereami:v1.2.23
        ports:
        - containerPort: 8080
---
apiVersion: v1
kind: Service
metadata:
  name: foo
  namespace: foo
spec:
  selector:
    app: test-backend
  ports:
  - port: 8080
    targetPort: 8080
EOF

부하 분산 알고리즘 구성

기본적으로 서비스에 대한 트래픽은 Cloud Service Mesh 서비스 메시의 모든 정상적인 단일 서비스 백엔드에 균등하게 분산됩니다. 다음 GCPTrafficDistributionPolicy를 만들어 트래픽이 백엔드 용량에 따라 가장 가까운 영역으로 분산되도록 할 수 있습니다.

kubectl apply -f - <<EOF
apiVersion: networking.gke.io/v1
kind: GCPTrafficDistributionPolicy
metadata:
  name: lb-policy
  namespace: foo
spec:
  targetRefs:
  - kind: Service
    group: ""
    name: foo-service
  default:
    serviceLbAlgorithm: WATERFALL_BY_ZONE
EOF

기본적으로 서비스 백엔드는 용량이 무한한 것처럼 취급됩니다. 로컬/가장 가까운 영역에 정상 호스트가 충분하게 있으면 트래픽은 특정 클라이언트 위치의 로컬/가장 가까운 영역 외부로 분산되지 않습니다. 단일 영역이 과부하되지 않도록 GCPBackendPolicy를 사용하여 서비스 백엔드 용량을 선택적으로 구성할 수 있습니다.

kubectl apply -f - <<EOF
apiVersion: networking.gke.io/v1
kind: GCPBackendPolicy
metadata:
  name: backend-policy
  namespace: foo
spec:
  targetRef:
    kind: Service
    group: ""
    name: foo-backend
  default:
    maxRatePerEndpoint: 5
EOF

장애 조치 동작 조정

기본적으로 기본 백엔드에서 충분한 비율의 호스트가 정상이면 장애 조치가 트리거되지 않습니다. 기본 백엔드 및 기타 용어에 대한 자세한 내용은 고급 부하 분산 개요를 참조하세요. GCPTrafficDistributionPolicy를 사용하면 트래픽이 기본 백엔드에서 장애 조치 백엔드로 전환될 때까지 정상 호스트 비율 기준점을 구성할 수 있습니다. 기준점이 클수록 장애 조치가 더 빨리 트리거됩니다. 예를 들어 기본 백엔드에서 정상 호스트 비율이 90% 아래로 떨어지면 즉시 장애 조치가 트리거되게 하려면 다음 GCPTrafficDistributionPolicy를 구성하면 됩니다.

kubectl apply -f - <<EOF
apiVersion: networking.gke.io/v1
kind: GCPTrafficDistributionPolicy
metadata:
  name: lb-policy
  namespace: foo
spec:
  targetRefs:
  - kind: Service
    group: ""
    name: foo-service
  default:
   failoverConfig:
     failoverHealthThreshold: 90
EOF

멀티 클러스터 서비스 메시에서 고급 부하 분산 구성

GCPTrafficDistributionPolicy 및 GCPBackendPolicy는 멀티 클러스터 서비스 메시의 서로 다른 범위에 적용됩니다.

GCPTrafficDistributionPolicy가 멀티 클러스터 서비스를 타겟팅하면 모든 클러스터에서 서비스 수준 부하 분산 동작을 정의합니다. 특정 멀티 클러스터 서비스에 GCPTrafficDistributionPolicy 하나만 만들어야 합니다. Istio API를 사용하여 서비스 메시를 구성하는 경우 Fleet의 모든 클러스터에 GCPTrafficDistributionPolicy를 만들 수 있습니다. 정책 상태를 검사하여 정책이 다른 정책과 충돌하는지 확인할 수 있습니다.

GCPBackendPolicy가 멀티 클러스터 서비스를 타겟팅하면 로컬 클러스터의 타겟팅 서비스에서 선택한 백엔드 포드에 대한 백엔드 수준 설정(예: 포드당 용량)을 정의합니다. 같은 멀티 클러스터 서비스의 경우 클러스터마다 다른 백엔드 수준 설정을 정의할 수 있습니다.

다음 예시에서는 Fleet 전반에서 사용할 부하 분산 알고리즘을 정의하도록 GCPTrafficDistributionPolicy가 클러스터 A에 생성되는 반면 GCPBackendPolicy는 각 클러스터에 있습니다. 두 GCPBackendPolicy 모두 로컬 클러스터의 백엔드 포드에 포드당 10qps 용량을 구성하지만 클러스터 A의 GCPBackendPolicy는 클러스터 A의 백엔드 포드를 선호하는 백엔드로 구성합니다.

이러한 정책을 함께 사용하면 서비스 foo로 전송되는 메시 내 트래픽의 부하 분산 동작을 구성할 수 있습니다.

클러스터 A의 백엔드 포드가 포드당 10qps를 처리해야 할 때까지 어디서나 오는 트래픽은 클러스터 A의 백엔드를 선호합니다.
- 주로 클러스터 A에서 backendPreference를 PREFERRED로 설정하는 GCPBackendPolicy에서 이 동작을 정의합니다.
클러스터 A의 백엔드에 구성된 용량을 초과하는 트래픽은 WATERFALL_BY_ZONE 알고리즘을 통해 클러스터 B로 라우팅됩니다. 선호하는 백엔드에 대한 자세한 설명은 고급 부하 분산 개요를 참조하세요.
- 주로 클러스터 A에서 알고리즘을 정의하는 GCPTrafficDistributionPolicy 및 클러스터 A와 B 모두에서 백엔드 용량을 정의하는 GCPBackendPolicy에서 이 동작을 정의합니다.

고급 부하 분산 멀티 클러스터 서비스 메시

Istio에서 일반 Kubernetes 서비스는 서비스 메시에 클러스터가 여러 개 있고 서비스가 클러스터 경계를 넘어 생성되면 암시적으로 '멀티 클러스터'가 됩니다. 다음 GCPTrafficDistributionPolicy는 일반 Kubernetes 서비스 foo를 타겟팅하지만 두 클러스터의 상응하는 워크로드로 구성된 멀티 클러스터 서비스 foo에도 적용됩니다.

클러스터 A의 GCPTrafficDistributionPolicy를 만듭니다.

kubectl apply --context cluster-a-context -f - <<EOF
kind: GCPTrafficDistributionPolicy
apiVersion: networking.gke.io/v1
metadata:
name: foo-traffic-distribution-policy
namespace: foo
spec:
  targetRefs:
  - kind: Service
    group: ""
    name: foo-service
  default:
    serviceLbAlgorithm: WATERFALL_BY_ZONE

EOF

클러스터 A의 GCPBackendPolicy를 만듭니다.

kubectl apply --context cluster-a-context -f - <<EOF
kind: GCPBackendPolicy
apiVersion: networking.gke.io/v1
metadata:
name: foo-backend-policy
namespace: foo
spec:
  default:
    maxRatePerEndpoint: 100
    backendPreference: PREFERRED
  targetRef:
    group: ""
    kind: Service
    name: foo-service
EOF

클러스터 B의 GCPBackendPolicy를 만듭니다.

kubectl apply --context cluster-b-context -f - <<EOF
kind: GCPBackendPolicy
apiVersion: networking.gke.io/v1
metadata:
name: foo-backend-policy
namespace: foo
spec:
  default:
    maxRatePerEndpoint: 10
  targetRef:
    group: ""
    kind: Service
    name: foo-service
EOF

다음 단계

고급 부하 분산 자세히 알아보기