복원력이 우수한 환경에서 장애 조치 테스트 수행

Cloud Composer 3 | Cloud Composer 2 | Cloud Composer 1

이 페이지에서는 복원력이 우수한 (고가용성) 환경에 대해 데이터베이스 장애 조치 테스트를 수행하는 방법을 설명합니다.

환경 장애 조치 테스트는 데이터 센터의 특정 영역의 완전한 서비스 중단을 시뮬레이션합니다. 이러한 시나리오에서는 데이터베이스의 영역 서비스 중단이 발생할 수 있습니다. 장애 조치 테스트를 실행하면 복원력이 우수한 환경에서 장애 조치를 실행하는 방식을 모니터링하고 이로 인해 DAG 및 태스크에 미치는 영향을 확인할 수 있습니다.

시작하기 전에

  • 장애 조치 테스트를 실행하려면 Google 계정에 다음 역할 및 권한이 있어야 합니다.

  • Cloud Composer 3에서 환경의 클러스터는 환경의 테넌트 프로젝트에 있으며 영역 서비스 중단을 시뮬레이션할 수 없습니다.

환경이 정상인지 확인

장애 조치 테스트는 정상적인 환경에서만 테스트해야 합니다. 환경이 정상인지 확인하려면 다음 단계를 따르세요.

  1. Google Cloud 콘솔에서 환경 페이지로 이동합니다.

    환경으로 이동

  2. 환경 목록에서 환경 이름을 클릭합니다. 환경 세부정보 페이지가 열립니다.

  3. Monitoring 탭으로 이동합니다.

  4. 모든 상태 측정항목이 녹색인지 확인합니다.

데이터베이스 장애 조치 테스트 수행

Google Cloud CLI 명령어로 트리거하여 영역 서비스 중단을 시뮬레이션하는 데이터베이스 장애 조치 테스트를 수행할 수 있습니다. 예를 들어 환경의 데이터베이스가 다른 영역으로 전환하는 데 걸리는 시간을 측정하기 위해 이를 수행할 수 있습니다.

환경에 대해 데이터베이스 장애 조치 테스트를 실행하려면 다음 단계를 따르세요.

  1. 환경이 정상인지 확인합니다.

  2. 환경 데이터베이스의 기본 영역을 가져옵니다.

    gcloud composer environments fetch-database-properties \
        ENVIRONMENT_NAME \
        --location LOCATION
    

    다음을 바꿉니다.

    • ENVIRONMENT_NAME: Cloud Composer 환경의 이름입니다.
    • LOCATION: 환경이 위치한 리전입니다.

    예를 들면 다음과 같습니다.

    gcloud composer environments fetch-database-properties \
        example-environment \
        --location us-central1
    
  3. 데이터베이스 장애 조치 테스트를 시작합니다.

    gcloud composer environments database-failover \
        ENVIRONMENT_NAME \
        --location LOCATION
    

    다음을 바꿉니다.

    • ENVIRONMENT_NAME: Cloud Composer 환경의 이름입니다.
    • LOCATION: 환경이 위치한 리전입니다.

    예를 들면 다음과 같습니다.

    gcloud composer environments database-failover \
        example-environment \
        --location us-central1
    
  4. 데이터베이스 장애 조치 테스트가 완료될 때까지 기다립니다. 이 과정은 최대 3분 정도 걸릴 수 있습니다.

  5. 환경 데이터베이스의 기본 영역이 변경되었는지 확인합니다.

    gcloud composer environments fetch-database-properties \
        ENVIRONMENT_NAME \
        --location LOCATION
    
  6. 환경의 상태 측정항목을 확인하여 환경이 정상인지 확인합니다.

  7. 장애 조치에 사용할 수 있는 데이터베이스(composer.googleapis.com/environment/database/available_for_failover) 환경 측정항목이 True가 되면 환경의 데이터베이스가 다른 장애 조치에 사용할 준비가 됩니다. Cloud Monitoring에서 환경의 측정항목을 보는 방법에 관한 자세한 내용은 환경 모니터링을 참조하세요.

다음 단계