고가용성을 위한 Kubernetes 워크로드

이 페이지에서는 Google Distributed Cloud (GDC) 에어 갭 멀티 영역 유니버스에서 애플리케이션의 내결함성을 높이는 Kubernetes 컨테이너 워크로드 전략을 권장합니다. GDC는 Google Kubernetes Engine (GKE)에서 널리 사용되고 지원되는 Kubernetes 네이티브 컨테이너 애플리케이션을 지원합니다.

이 페이지는 조직의 애플리케이션 워크로드를 만드는 애플리케이션 운영자 그룹 내 개발자를 위한 페이지입니다. 자세한 내용은 GDC 오프라인 문서 대상을 참고하세요.

HA 앱을 위한 Kubernetes 고려사항

Kubernetes에서 고가용성 (HA)을 달성하는 것은 컨트롤 플레인 이상입니다. 또한 Google Distributed Cloud (GDC) 에어 갭 유니버스에서 컨테이너 워크로드를 탄력적으로 설계하고 배포해야 합니다. Kubernetes는 인프라 문제가 발생하거나 정기 유지보수 중에도 다운타임을 최소화하고 고가용성 서비스를 제공하는 강력한 메커니즘을 여러 개 제공합니다. 다음 주제는 HA를 위해 고려해야 할 주요 전략입니다.

  • 복제본 및 자동 확장을 통해 가용성 유지: HA를 제공하려면 애플리케이션의 실행 중인 인스턴스가 충분해야 합니다.

    • ReplicaSet: ReplicaSet 리소스는 어느 시점에서든 실행되는 동일한 포드 복제본의 안정적인 집합을 유지합니다. 포드가 실패하거나 종료되면 ReplicaSet 컨트롤러가 자동으로 새 포드를 만들어 대체합니다. 자세한 내용은 ReplicaSet Kubernetes 문서를 참고하세요.

    • 수평형 포드 자동 확장 처리 (HPA): ReplicaSet는 고정된 복제본 수를 유지하는 반면 HPA는 CPU 사용률이나 메모리 사용량과 같은 관찰된 측정항목을 기반으로 이 수를 자동으로 조정합니다. 이를 통해 애플리케이션이 부하 급증을 처리할 수 있습니다. 자세한 내용은 수평형 포드 자동 확장 Kubernetes 문서를 참고하세요.

  • PodDisruptionBudget (PDB)로 다운타임 최소화: 자세한 내용은 애플리케이션에 중단 예산 지정 Kubernetes 문서를 참고하세요.

  • 안티어피니티 규칙으로 위험 분산: 자세한 내용은 어피니티 및 안티어피니티 Kubernetes 문서를 참고하세요.

  • 활성, 준비, 시작 프로브를 사용한 상태 점검: 자세한 내용은 활성, 준비, 시작 프로브 구성 Kubernetes 문서를 참고하세요.

  • 안정적인 엔드포인트 및 서비스를 사용한 부하 분산: 자세한 내용은 서비스 Kubernetes 문서를 참고하세요.

  • 배포를 사용한 단계적 업데이트 및 롤백: 자세한 내용은 Kubernetes 문서의 배포 롤백을 참고하세요.

  • 리소스 요청 및 한도 설정: 자세한 내용은 Kubernetes 문서의 포드 및 컨테이너의 리소스 관리를 참고하세요.

다음 단계