Persistent Disk 비동기 복제(PD 비동기 복제)는 리전 간 활성-수동 재해 복구(DR)를 위해 낮은 복구 지점 목표(RPO)와 낮은 복구 시간 목표(RTO) 블록 스토리지 복제 기능을 제공합니다.
PD 비동기 복제는 두 리전 사이에 비동기 데이터 복제 기능을 제공하는 스토리지 옵션입니다. 드물게 발생하는 리전 중단의 경우에도 PD 비동기 복제를 사용하면 데이터를 보조 리전으로 장애 조치하고 이 리전에서 워크로드를 다시 시작할 수 있습니다.
PD 비동기 복제를 사용하여 워크로드 수준 대신 인프라 수준에서 Compute Engine 워크로드 복제를 관리할 수 있습니다.
개요
Persistent Disk 비동기 복제는 실행 중인 워크로드에 연결된 디스크(기본 디스크)의 데이터를 다른 리전에 있는 별도의 디스크에 복제합니다. 복제된 데이터를 수신하는 디스크를 보조 디스크라고 합니다.
기본 디스크가 있는 리전을 기본 리전이라고 부르고 보조 디스크가 있는 리전을 보조 리전이라고 부릅니다. 기본 리전과 보조 리전을 리전 쌍이라고 합니다.
디스크 요구사항을 충족하는 모든 디스크를 기본 디스크로 사용할 수 있습니다. 기본 디스크가 있으면 기본 디스크를 참조하는 보조 디스크를 만들고 기본 디스크에서 보조 디스크로 복제를 시작할 수 있습니다.
언제든지 기본 디스크에서 복제를 중지하고 나중에 복제를 다시 시작하려면 새 보조 디스크를 만들어서 복제를 다시 시작해야 합니다.
일관성 그룹
일관성 그룹을 사용하면 여러 디스크 간에 재해 복구(DR) 및 DR 테스트를 수행할 수 있습니다. 일관성 그룹은 다음을 수행하는 리소스 정책입니다.
- 기본 디스크 전반의 복제를 조정하고 모든 디스크에 DR에 사용되는 공통 시점의 복제 데이터가 포함되는지 확인합니다.
- 보조 디스크의 디스크 클론을 조정하고 모든 디스크 클론에 DR 수행에 사용되는 공통 시점의 데이터가 포함되는지 확인합니다.
여러 디스크에 걸쳐서 복제 기간을 조정하려면 일관성 그룹에 기본 디스크를 추가합니다. 여러 디스크를 클론하고 이러한 클론에 공통 시점의 데이터가 포함되도록 하려면 일관성 그룹에 보조 디스크를 추가합니다. 일관성 그룹은 복제 또는 클론에 사용할 수 있지만 동시에 사용할 수 없습니다.
기본 디스크를 일관성 그룹에 추가하려면 복제를 시작하기 전에 일관성 그룹에 디스크를 추가해야 합니다. 언제든지 일관성 그룹에 보조 디스크를 추가할 수 있습니다.
장애 조치 및 장애 복구
기본 리전에 중단이 발생하면 사용자가 중단을 식별하고 보조 리전에 있는 보도 디스크를 사용하여 장애 조치하고 워크로드를 다시 시작해야 합니다. PD 비동기 복제는 중단 모니터링을 제공하지 않습니다. RPO 측정항목, 상태 점검, 애플리케이션 특정 측정항목을 사용하고 Cloud Customer Care 연락을 통해 중단을 식별할 수 있습니다.
장애 조치 프로세스에는 다음 태스크가 포함됩니다.
- 복제를 중지합니다.
- 보조 리전의 VM에 보도 디스크를 연결합니다.
디스크를 장애 조치한 후에는 사용자가 보조 리전에서 애플리케이션 워크로드를 검증 및 다시 시작하고 보조 리전을 가리키도록 애플리케이션 액세스에 사용되는 네트워크 주소를 다시 구성해야 합니다.
기본 리전에서 보조 리전으로 장애 조치를 수행한 후에는 보조 리전이 기본 리전으로 작동합니다. 중단 또는 재해가 해결된 다음에는 원래 보조 리전(작동 중인 기본 리전)에서 원래 기본 리전으로 복제를 시작하도록 장애 복구를 시작할 수 있습니다. 선택적으로 이 프로세스를 반복하여 워크로드를 다시 처음 기본 리전으로 이동할 수 있습니다.
장애 복구 프로세스에는 다음 태스크가 포함됩니다.
새로운 기본 리전과 원래 기본 리전 사이에 복제를 구성합니다.
- 원래 보조 디스크가 이제 새로운 기본 디스크이고 원래 기본 리전에 있는 새로운 보조 디스크에 복제하도록 구성합니다.
- 새 기본 디스크(원래 보조 디스크)가 원래 기본 리전에 있는 새로운 보조 디스크 집합에 일관적으로 복제할 수 있도록 새 기본 리전에서 새로운 일관성 그룹 리소스 정책을 만들 수 있습니다.
(선택사항) 최초 복제가 수행된 다음에는 장애 조치 프로세스를 반복하여 워크로드를 원래 기본 리전으로 되돌릴 수 있습니다.
디스크 암호화
기본 및 보조 디스크는 고객 제공 암호화 키(CSEK)를 지원하지 않습니다. 대신 Google 소유 및 Google 관리 키 또는 고객 관리 암호화 키 (CMEK)를 사용하세요. 기본 디스크에서 CMEK를 사용하는 경우 보조 디스크에서도 CMEK를 사용해야 합니다. 두 디스크에는 서로 다른 CMEK를 사용할 수 있습니다.
보조 디스크 맞춤설정
보조 디스크를 만들면 Compute Engine은 기본 디스크의 속성을 보조 디스크에 복사합니다. 이러한 속성에는 기본 디스크의 설명, 디스크 유형, 라벨이 포함됩니다.
기본 디스크가 부팅 디스크인 경우 보조 디스크에도 기본 디스크의 부팅 구성이 있습니다. 부팅 구성에는 운영체제 (OS) 아키텍처, OS 라이선스, 게스트 OS 기능에 대한 정보가 포함됩니다.
보조 디스크의 특정 속성을 기본 디스크와 다르게 변경할 수 있습니다. 예를 들어 기본 디스크와 보조 디스크의 크기와 암호화 키는 동일해야 하지만 보조 디스크에 라벨을 추가로 할당할 수 있습니다.
부팅 디스크의 경우 추가 게스트 OS 기능을 지정하여 보조 디스크에서 추가 보안 또는 네트워킹 옵션을 사용 설정할 수 있습니다. 하지만 기본 디스크의 게스트 OS 기능은 삭제할 수 없습니다. Compute Engine은 지정된 새 기능을 기본 디스크의 기존 게스트 OS 기능과 병합합니다.
예시
게스트 OS 기능([GVNIC, UEFI_COMPATIBLE]
)이 있는 disk-1
이라는 부팅 디스크가 있다고 가정해 보겠습니다.
disk-1
에서 보조 디스크를 만들면 추가 기능만 지정할 수 있습니다. UEFI_COMPATIBLE
및 GVNIC
기능은 삭제할 수 없습니다.
따라서 보조 디스크를 만들 때 MULTI_IP_SUBNET
을 지정하면 새 기능이 기본 디스크의 기능과 병합되므로 보조 디스크의 게스트 OS 기능은 GVNIC
, UEFI_COMPATIBLE
, MULTI_IP_SUBNET
이 됩니다.
보조 디스크를 맞춤설정하는 방법을 알아보려면 커스텀 보조 디스크 만들기를 참조하세요.
PD 비동기 복제 및 리전 영구 디스크
리전 영구 디스크와 함께 PD 비동기 복제를 사용하여 고가용성(HA)과 재해 복구(DR) 목표를 달성할 수 있습니다.
리전 영구 디스크는 PD 비동기 복제 디스크 쌍에서 기본 디스크 또는 보조 디스크로 사용될 수 있습니다. 디스크 쌍은 보조 디스크에 복제되는 기본 디스크입니다.
리전 디스크를 기본 디스크로 사용하면 영역 중 하나에 중단이 발생하더라도 복제가 중단되지 않습니다. 리전 기본 디스크가 정상 영역에서 보조 디스크로 계속 데이터를 복제합니다. 마찬가지로 리전 디스크가 보조 디스크로 사용되는 경우 영역 중 하나에 중단이 발생하더라도 복제가 계속됩니다. 리전 디스크를 보조 디스크로 사용하면 보조 디스크가 새 기본 디스크로 전환되는 장애 조치 시 영역 전반에서 고가용성을 지원하도록 워크로드를 준비할 수 있습니다.
제한사항
- PD 비동기 복제는 균형 있는 영구 디스크 및 성능(SSD) 영구 디스크에만 지원됩니다.
- 읽기 전용 디스크 및 멀티 작성자 디스크는 지원되지 않습니다.
- 각 디스크의 최대 크기는 32TiB까지 가능합니다.
- 기본 디스크 또는 보조 디스크를 삭제하려면 먼저 복제를 중지해야 합니다.
- VM의 부팅 디스크에 대한 복제가 진행 중인 경우 복제를 중지할 때까지 VM을 삭제할 수 없습니다.
- 기본 디스크가 VM에 비부팅 디스크로 연결되어 있고 디스크가 VM과 함께 삭제되도록 구성된 경우 복제를 중지하거나 VM에서 기본 디스크를 분리할 때까지 VM 또는 디스크를 삭제할 수 없습니다. 복제를 중지할 때까지 VM을 삭제하려고 하면 실패합니다.
각 프로젝트는 각 리전 쌍에 디스크 쌍을 최대 1,000개까지 보유할 수 있습니다.
예를 들어 특정 프로젝트인
project-1
에는 아이오와-오리건 리전 쌍의 디스크 쌍이 최대 1,000개까지 있을 수 있습니다. 또한project-1
에는 벨기에-프랑크푸르트 리전 쌍의 디스크 쌍이 최대 1,000개까지 있을 수 있습니다.
지원되는 리전
PD 비동기 복제는 다음 대륙의 모든 리전에서 사용할 수 있습니다.
- 아시아(인도네시아 제외)
- 유럽
- 북미
- 오세아니아
지정된 리전의 기본 디스크를 동일한 대륙 내에서 사용 가능한 리전의 보조 디스크에 복제할 수 있습니다. 즉, 동일한 대륙 내의 두 리전에서 리전 쌍을 만들 수 있습니다.
예를 들어 프랑크푸르트(europe-west3
)에 기본 디스크가 있다고 가정해 보겠습니다. 이 디스크는 유럽 어디서나 보조 디스크에 복제할 수 있지만 북미 리전에는 복제할 수 없습니다.
Compute Engine의 모든 리전 목록은 사용 가능한 영역 및 리전을 참조하세요.
성능
복구 지점 목표(RPO) 또는 보조 사이트에서 데이터를 사용할 수 있을 때까지의 시간 지연은 디스크 변경 비율에 따라 달라집니다. PD 비동기 복제는 일반적으로 목표 RPO 1분으로 분당 최대 12.5GB까지 압축된 변경 블록 데이터를 복제합니다. 복제되는 디스크 블록 세부 단위는 4KB입니다. 제공된 블록이 복제 작업 중 여러 번 변경된 경우 최근에 변경된 내용만 보조 디스크에 복제됩니다. 디스크 변경 비율이 높으면 RPO가 1분보다 커질 수 있고 일반적으로 디스크 변경 비율 증가에 따라 커집니다. RPO는 구성할 수 없습니다.
다음과 같은 경우에는 RPO가 1분을 초과할 수 있습니다.
- 디스크 복제가 시작되는 경우. 초기 복제 중에는 PD 비동기 복제가 기본 디스크에서 사용된 모든 블록을 보조 디스크로 복제합니다. 초기 복제는 Cloud Monitoring에서
disk/async_replication/time_since_last_replication
측정항목을 사용할 수 있을 때 완료됩니다. - 디스크 변경 비율이 분당 12.5GB의 압축된 변경 블록보다 큰 경우. 디스크 변경이 급증한 후에는 복제가 이를 따라잡느라 이후 복제 주기에 대한 RPO가 1분을 초과할 수 있습니다.
- VM에서 디스크를 분리하거나 디스크가 복제되는 동안 VM을 다시 시작하는 경우. VM에서 분리되는 복제가 진행되는 디스크에서는 RPO가 단시간 동안 최대 5분까지 증가할 수 있습니다.
디스크의 RPO를 확인하는 방법은 Persistent Disk 비동기 복제 성능 측정항목을 참조하세요.
장애 조치 중 복구 시간 목표(RTO)는 워크로드를 새 리전으로 장애 조치하는 것과 관련된 여러 태스크를 완료하는 데 걸리는 시간에 따라 달라집니다. 복제 중지와 보조 리전에서 VM에 디스크 연결과 같은 태스크는 완료하는 데 몇 분 밖에 걸리지 않습니다. 장애 조치가 수행될 때 VM 시작을 기다릴 필요가 없도록 보조 리전에서 VM이 실행 중인지 확인하여 RTO를 높일 수 있습니다.
다음 단계
- 복제 구성 방법 알아보기
- 복제 관리 방법 알아보기
- 일관성 그룹 관리 방법 알아보기
- 장애 조치 및 장애 복구 방법 알아보기
- PD 비동기 복제를 사용하는 디스크 관리 방법 알아보기
- Persistent Disk 비동기 복제 성능 모니터링 방법 알아보기