고가용성 구성 개요

이 페이지에서는 Cloud SQL 인스턴스의 고가용성(HA) 구성을 간략히 설명합니다. 새 인스턴스의 HA를 구성하거나 기존 인스턴스에 HA를 사용 설정하려면 인스턴스에서 고가용성 사용 설정 및 중지를 참조하세요.

HA 구성 개요

HA 구성의 목적은 영역 또는 인스턴스를 사용할 수 없게 되었을 때 다운타임을 줄이는 것입니다. 이런 일은 영역의 서비스가 중단되거나 인스턴스가 손상된 경우 발생할 수 있습니다. HA를 사용할 경우 클라이언트 애플리케이션에서 데이터를 계속 사용할 수 있습니다.

클러스터라고도 하는 HA 구성은 데이터 이중화 기능을 제공합니다. HA를 위해 구성된 Cloud SQL 인스턴스는 리전 인스턴스라고도 하며 구성된 리전 내의 기본 및 보조 영역에 배치됩니다. 리전 인스턴스 내에서의 구성은 기본 인스턴스대기 인스턴스로 이루어집니다. 각 영역의 영구 디스크에 동기식으로 복제하는 기능을 통해, 기본 인스턴스에 대한 모든 쓰기 작업은 트랜잭션이 커밋된 것으로 보고되기 전에 양쪽 영역의 디스크에 다 복제됩니다. 인스턴스 또는 영역에 장애가 발생하면 영구 디스크가 대기 인스턴스에 연결되고 이것이 새 기본 인스턴스가 됩니다. 그런 다음 사용자는 새 기본 인스턴스로 다시 라우팅됩니다. 이 절차를 장애 조치라고 합니다.

장애 조치 후에는 장애 조치를 받은 인스턴스는 원래의 인스턴스가 다시 온라인 상태로 돌아온 후에도 계속해서 기본 인스턴스를 유지합니다. 서비스 중단이 발생한 영역 또는 인스턴스를 다시 사용할 수 있게 되면 원래의 기본 인스턴스는 폐기되고 다시 생성됩니다. 그런 다음 이는 새로운 대기 인스턴스가 됩니다. 차후에 장애 조치가 발생하면 새로운 기본 인스턴스는 원래 영역의 원래 인스턴스로 장애 조치를 넘깁니다.

서비스 중단이 발생한 영역에 기본 인스턴스가 필요한 경우 장애 복구를 수행할 수 있습니다. 장애 복구는 장애 조치와 동일한 단계를 반대로 수행하며 트래픽을 원래 인스턴스로 다시 라우팅합니다. 장애 복구를 수행하려면 장애 조치 시작의 절차를 따르세요.

Cloud SQL 및 Cloud SQL HA 구성에 대한 리전 영구 디스크 지원에는 전체 서비스수준계약 (SLA) 범위가 적용됩니다. HA가 구성된 인스턴스에는 독립형 인스턴스의 두 배에 해당하는 요금이 청구됩니다. 이 요금에는 CPU, RAM 및 저장소가 포함됩니다. 자세한 내용은 가격 책정 페이지를 참조하세요.

Cloud SQL HA 구성의 다이어그램 개요. 아래에 텍스트로 설명됨

장애 조치 개요

HA가 구성된 인스턴스가 응답하지 않을 경우 Cloud SQL은 대기 인스턴스에서 데이터를 제공하도록 자동으로 전환됩니다. 장애 조치가 발생했는지 확인하려면 작업 로그의 장애 조치 내역을 확인하세요.

조치 절차

장애 조치 과정은 다음과 같습니다.

  • 기본 인스턴스 또는 영역에서 장애가 발생합니다.

    기본 인스턴스는 하트비트 신호로 1초마다 시스템 데이터베이스에 쓰기를 수행합니다. 여러 개의 하트비트가 감지되지 않으면 장애 조치가 시작됩니다. 기본 인스턴스가 약 60초 동안 응답하지 않거나 기본 인스턴스가 포함된 영역에서 중단이 발생하는 경우가 이에 해당합니다.

  • 이제 대기 인스턴스가 재연결 즉시 데이터를 제공합니다.

    대기 인스턴스는 기본 인스턴스와 공유하는 고정 IP 주소를 통해 보조 영역에서 데이터를 제공합니다.

    요구사항

    Cloud SQL에서 장애 조치를 허용하기 위해서는 다음과 같은 구성 요구사항을 충족해야 합니다.

    • 기본 인스턴스가 정상 작동 상태(중단되거나 유지보수 작업 중이거나 백업, 가져오기, 내보내기 작업과 같은 장기 실행 Cloud SQL 인스턴스 작업을 수행하고 있지 않음)여야 합니다.
    • 보조 영역과 대기 인스턴스가 모두 정상 상태여야 합니다. 대기 인스턴스가 응답하지 않거나 보조 영역에 대한 복제가 중단되면 장애 조치 작업이 차단됩니다. Cloud SQL이 대기 인스턴스를 복구하고 보조 영역을 사용할 수 있게 되면 복제가 다시 시작되고 Cloud SQL에서 장애 조치를 허용합니다.

    백업 및 복원

    고가용성을 위해 자동 백업을 사용 설정해야 합니다.

    애플리케이션 및 인스턴스

    비 HA 인스턴스와 HA 인스턴스의 작동 방식에는 차이가 없으므로 애플리케이션을 특정 방식으로 구성할 필요는 없습니다. 장애 조치가 발생하면 기본 인스턴스와 읽기 복제본에 대한 기존 연결이 해제되며, 기본 인스턴스에 연결을 다시 설정하는 데는 약 2~3분이 소요됩니다. 복제본에 연결하는 데 시간이 더 오래 걸릴 수 있습니다. 애플리케이션은 동일한 연결 문자열 또는 IP 주소를 사용하여 다시 연결하므로 장애 조치 후 애플리케이션을 업데이트할 필요가 없습니다.

    장애 조치 시 애플리케이션에 미치는 영향을 정확히 확인하려면 장애 조치를 수동으로 시작합니다.

    유지보수 다운타임

    유지보수 이벤트는 고가용성으로 구성된 기본 인스턴스에 다른 인스턴스와 동일한 방식으로 영향을 미칩니다. 이 기간 동안 기본 인스턴스가 다운될 수 있습니다. 서비스에 미치는 영향을 최소화하기 위해 유지보수 기간을 설정하여 다운타임이 발생하는 시간을 제어할 수 있습니다.

    인스턴스에서 유지보수가 수행되면 대기 인스턴스로 장애 조치되지 않습니다. 유지보수 업데이트는 기본 인스턴스와 동시에 대기 인스턴스에 적용됩니다.

    다음 단계