Persistent Disk 비동기 복제 정보


Persistent Disk 비동기 복제(PD 비동기 복제)는 리전 간 활성-수동 재해 복구(DR)를 위해 낮은 복구 지점 목표(RPO)와 낮은 복구 시간 목표(RTO) 블록 스토리지 복제 기능을 제공합니다.

PD 비동기 복제는 두 리전 사이에 비동기 데이터 복제 기능을 제공하는 스토리지 옵션입니다. 드물게 발생하는 리전 중단의 경우에도 PD 비동기 복제를 사용하면 데이터를 보조 리전으로 장애 조치하고 이 리전에서 워크로드를 다시 시작할 수 있습니다.

PD 비동기 복제를 사용하여 워크로드 수준 대신 인프라 수준에서 Compute Engine 워크로드 복제를 관리할 수 있습니다.

개요

Persistent Disk 비동기 복제는 실행 중인 워크로드에 연결된 디스크(기본 디스크)의 데이터를 다른 리전에 있는 비어 있는 개별 디스크(보조 디스크)에 복제합니다. 기본 디스크가 있는 리전을 기본 리전이라고 부르고 보조 디스크가 있는 리전을 보조 리전이라고 부릅니다.

디스크 요구사항을 충족하는 모든 디스크를 기본 디스크로 사용할 수 있습니다. 기본 디스크가 있으면 기본 디스크를 참조하는 보조 디스크를 만들고 기본 디스크에서 보조 디스크로 복제를 시작할 수 있습니다.

언제든지 기본 디스크에서 복제를 중지하고 나중에 복제를 다시 시작하려면 새 보조 디스크를 만들어서 복제를 다시 시작해야 합니다.

일관성 그룹

일관성 그룹을 사용하면 여러 디스크 간에 재해 복구(DR) 및 DR 테스트를 수행할 수 있습니다. 일관성 그룹은 다음을 수행하는 리소스 정책입니다.

  • 기본 디스크 전반의 복제를 조정하고 모든 디스크에 DR에 사용되는 공통 시점의 복제 데이터가 포함되는지 확인합니다.
  • 보조 디스크의 디스크 클론을 조정하고 모든 디스크 클론에 DR 수행에 사용되는 공통 시점의 데이터가 포함되는지 확인합니다.

여러 디스크에 걸쳐서 복제 기간을 조정하려면 일관성 그룹에 기본 디스크를 추가합니다. 여러 디스크를 클론하고 이러한 클론에 공통 시점의 데이터가 포함되도록 하려면 일관성 그룹에 보조 디스크를 추가합니다. 일관성 그룹은 복제 또는 클론에 사용할 수 있지만 동시에 사용할 수 없습니다.

기본 디스크를 일관성 그룹에 추가하려면 복제를 시작하기 전에 일관성 그룹에 디스크를 추가해야 합니다. 언제든지 일관성 그룹에 보조 디스크를 추가할 수 있습니다.

장애 조치 및 장애 복구

기본 리전에 중단이 발생하면 사용자가 중단을 식별하고 보조 리전에 있는 보도 디스크를 사용하여 장애 조치하고 워크로드를 다시 시작해야 합니다. PD 비동기 복제는 중단 모니터링을 제공하지 않습니다. RPO 측정항목, 상태 점검, 애플리케이션 특정 측정항목을 사용하고 Cloud Customer Care 연락을 통해 중단을 식별할 수 있습니다.

장애 조치 프로세스에는 다음 태스크가 포함됩니다.

  1. 복제를 중지합니다.
  2. 보조 리전의 VM에 보도 디스크를 연결합니다.

디스크를 장애 조치한 후에는 사용자가 보조 리전에서 애플리케이션 워크로드를 검증 및 다시 시작하고 보조 리전을 가리키도록 애플리케이션 액세스에 사용되는 네트워크 주소를 다시 구성해야 합니다.

기본 리전에서 보조 리전으로 장애 조치를 수행한 후에는 보조 리전이 기본 리전으로 작동합니다. 중단 또는 재해가 해결된 다음에는 원래 보조 리전(작동 중인 기본 리전)에서 원래 기본 리전으로 복제를 시작하도록 장애 복구를 시작할 수 있습니다. 선택적으로 이 프로세스를 반복하여 워크로드를 다시 처음 기본 리전으로 이동할 수 있습니다.

장애 복구 프로세스에는 다음 태스크가 포함됩니다.

  1. 새로운 기본 리전과 원래 기본 리전 사이에 복제를 구성합니다.

    • 원래 보조 디스크가 이제 새로운 기본 디스크이고 원래 기본 리전에 있는 새로운 보조 디스크에 복제하도록 구성합니다.
    • 새 기본 디스크(원래 보조 디스크)가 원래 기본 리전에 있는 새로운 보조 디스크 집합에 일관적으로 복제할 수 있도록 새 기본 리전에서 새로운 일관성 그룹 리소스 정책을 만들 수 있습니다.
  2. (선택사항) 최초 복제가 수행된 다음에는 장애 조치 프로세스를 반복하여 워크로드를 원래 기본 리전으로 되돌릴 수 있습니다.

디스크 암호화

기본 및 보조 디스크는 고객 제공 암호화 키(CSEK)를 지원하지 않습니다. 대신 Google 관리 암호화 키 또는 고객 관리 암호화 키(CMEK)를 사용하세요. 기본 디스크에서 CMEK를 사용하는 경우 보조 디스크에서도 CMEK를 사용해야 합니다. 두 디스크에는 서로 다른 CMEK를 사용할 수 있습니다.

보조 디스크 맞춤설정

보조 디스크를 만들면 설명, 디스크 유형, 라벨과 같은 기본 디스크의 속성이 상속됩니다. 기본 디스크가 부팅 디스크인 경우 보조 디스크는 기본 디스크의 부팅 구성을 상속합니다. 부팅 구성에는 운영체제(OS) 아키텍처, OS 라이선스, 게스트 OS 기능에 대한 정보가 포함됩니다.

보조 디스크의 특정 속성을 기본 디스크와 다르게 변경할 수 있습니다. 예를 들어 기본 디스크와 보조 디스크의 크기와 암호화 키가 동일해야 하지만 보조 디스크에 추가 라벨을 할당할 수 있습니다.

부팅 디스크의 경우, 추가 게스트 OS 기능을 지정하여 보조 디스크에 추가 보안 또는 네트워킹 옵션을 사용 설정할 수 있습니다. 그러나 기본 디스크의 게스트 OS 기능은 삭제할 수 없습니다. Compute Engine은 사용자가 지정하는 새 기능과 기본 디스크의 기존 게스트 OS 기능을 병합합니다.

게스트 OS 기능([GVNIC, UEFI_COMPATIBLE])이 있는 disk-1이라는 부팅 디스크가 있다고 가정해 보겠습니다.

disk-1에서 보조 디스크를 만들 경우 추가 기능만 지정할 수 있습니다. UEFI_COMPATIBLEGVNIC 기능은 삭제할 수 없습니다. 따라서 보조 디스크를 만들 때 MULTI_IP_SUBNET을 지정하면 새 기능이 기본 디스크의 기능과 병합되므로 보조 디스크의 게스트 OS 기능은 GVNIC, UEFI_COMPATIBLE, MULTI_IP_SUBNET이 됩니다.

보조 디스크를 맞춤설정하는 방법을 알아보려면 커스텀 보조 디스크 만들기를 참조하세요.

PD 비동기 복제 및 리전 영구 디스크

리전 영구 디스크와 함께 PD 비동기 복제를 사용하여 고가용성(HA)과 재해 복구(DR) 목표를 달성할 수 있습니다.

리전 영구 디스크는 PD 비동기 복제 디스크 쌍에서 기본 디스크 또는 보조 디스크로 사용될 수 있습니다. 디스크 쌍은 보조 디스크에 복제되는 기본 디스크입니다.

리전 디스크가 기본 디스크로 사용되는 경우에는 기본 디스크 영역 중 하나에 중단이 발생해도 복제가 중단되지 않습니다. 리전 기본 디스크가 정상 영역에서 보조 디스크로 계속 복제를 수행합니다.

리전 디스크가 보조 디스크로 사용되는 경우에는 보조 디스크 영역 중 하나에 중단이 발생할 경우 복제가 일시중지됩니다. 이 경우 보조 디스크의 정상 영역으로 복제가 계속되지 않습니다. 그러나 리전 디스크를 보조 디스크로 사용하면 보조 디스크가 새로운 기본 디스크가 되었을 때의 장애 조치 시에 영역 간 HA를 지원하도록 워크로드를 준비할 수 있습니다.

제한사항

  • PD 비동기 복제는 균형 있는 영구 디스크 및 성능(SSD) 영구 디스크에만 지원됩니다.
  • 읽기 전용 디스크 및 멀티 작성자 디스크는 지원되지 않습니다.
  • 디스크 크기는 최대 5TiB까지 가능합니다.
  • PD 비동기 복제는 프로젝트당 각 리전 쌍에서 100개의 디스크 쌍을 지원합니다.

  • PD 비동기 복제에서는 프로젝트별로 각 리전 쌍에서 최대 디스크 쌍 수를 지원합니다. 최대 디스크 쌍 수는 리전 쌍에 따라 다릅니다. 예를 들어 특정 프로젝트인 project-1에는 아이오와-오리건 리전 쌍의 디스크 쌍이 최대 100개까지 있을 수 있습니다. 또한 project-1에는 벨기에-프랑크푸르트 리전 쌍의 디스크 쌍이 최대 100개까지 있을 수 있습니다.

지원되는 리전 쌍

Persistent Disk 비동기 복제는 특정 Google Cloud 리전 간 복제를 지원합니다. 리전 쌍의 각 리전에 있는 디스크에 대해 복제를 수행할 수 있습니다.

다음 표에는 지원되는 PD 비동기 복제 리전 쌍, 즉 지원되는 각 리전과 사용 가능한 보조 리전이 나열되어 있습니다.

리전 사용 가능한 보조 리전
asia-east1(타이완 창후아 카운티) asia-southeast1(싱가포르 주롱웨스트)
asia-east2(아시아 태평양 홍콩) asia-southeast1(싱가포르 주롱웨스트)
asia-northeast1(일본 도쿄) asia-northeast2(일본 오사카)
asia-northeast2(일본 오사카) asia-northeast1(일본 도쿄)
asia-south1(인도 뭄바이) asia-south2(인도 델리)
asia-south2(인도 델리) asia-south1(인도 뭄바이)
asia-southeast1(싱가포르 주롱웨스트) asia-east1(타이완 창후아 카운티)
asia-east2(아시아 태평양 홍콩)
australia-southeast1(오스트레일리아 시드니) australia-southeast2(오스트레일리아 멜버른)
australia-southeast2(오스트레일리아 멜버른) australia-southeast1(오스트레일리아 시드니)
europe-southwest1(스페인 마드리드) europe-west1(벨기에 셍기슬랑)
europe-west1(벨기에 셍기슬랑) europe-southwest1(스페인 마드리드)
europe-west2(영국 런던)
europe-west3(독일 프랑크푸르트)
europe-west4(네덜란드 엠스하벤)
europe-west9(프랑스 파리)
europe-west2(영국 런던) europe-west1(벨기에 셍기슬랑)
europe-west4(네덜란드 엠스하벤)
europe-west3(독일 프랑크푸르트) europe-west1(벨기에 셍기슬랑)
europe-west4(네덜란드 엠스하벤)
europe-west8(이탈리아 밀라노)
europe-west10(독일 베를린)
europe-west4(네덜란드 엠스하벤) europe-west1(벨기에 셍기슬랑)
europe-west2(영국 런던)
europe-west3(독일 프랑크푸르트)
europe-west6(스위스 취리히)
europe-west6(스위스 취리히) europe-west4(네덜란드 엠스하벤)
europe-west8(이탈리아 밀라노) europe-west12(이탈리아 토리노)
europe-west3(독일 프랑크푸르트)
europe-west9(프랑스 파리) europe-west1(벨기에 셍기슬랑)
europe-west10(독일 베를린) europe-west3(독일 프랑크푸르트)
europe-west12(이탈리아 토리노) europe-west8(이탈리아 밀라노)
northamerica-northeast1(퀘벡 주 몬트리올) us-east1(사우스캐롤라이나 주 몽크스 코너)
us-central1(아이오와 주 카운슬 블러프스) us-east1(사우스캐롤라이나 주 몽크스 코너)
us-east4(버지니아 주 애쉬번)
us-east5(오하이오 주 콜럼부스)
us-west1(오리건 주 더 댈러스)
us-east1(사우스캐롤라이나 주 몽크스 코너) us-central1(아이오와 주 카운슬 블러프스)
northamerica-northeast1(퀘벡 주 몬트리올)
us-east4(버지니아 주 애쉬번) us-central1(아이오와 주 카운슬 블러프스)
us-east5(오하이오 주 콜럼부스) us-central1(아이오와 주 카운슬 블러프스)
us-west1(오리건 주 더 댈러스) us-central1(아이오와 주 카운슬 블러프스)
us-west2 (캘리포니아 주 로스앤젤레스)
us-west2(캘리포니아 주 로스앤젤레스) us-west1(오리건 주 더 댈러스)

성능

복구 지점 목표(RPO) 또는 보조 사이트에서 데이터를 사용할 수 있을 때까지의 시간 지연은 디스크 변경 비율에 따라 달라집니다. PD 비동기 복제는 일반적으로 목표 RPO 1분으로 분당 최대 250MB까지 압축된 변경 블록 데이터를 복제합니다. 복제되는 디스크 블록 세부 단위는 4KB입니다. 제공된 블록이 복제 작업 중 여러 번 변경된 경우 최근에 변경된 내용만 보조 디스크에 복제됩니다. 디스크 변경 비율이 높으면 RPO가 1분보다 커질 수 있고 일반적으로 디스크 변경 비율 증가에 따라 커집니다. RPO는 구성할 수 없습니다.

다음과 같은 경우에는 RPO가 1분을 초과할 수 있습니다.

  • 디스크 복제가 시작되는 경우. 초기 복제 중에는 PD 비동기 복제가 기본 디스크에서 사용된 모든 블록을 보조 디스크로 복제합니다. 초기 복제는 Cloud Monitoring에서 disk/async_replication/time_since_last_replication 측정항목을 사용할 수 있을 때 완료됩니다.
  • 디스크 변경 비율이 분당 250MB의 압축된 변경 블록보다 큰 경우. 디스크 변경이 급증한 후에는 복제가 이를 따라잡느라 이후 복제 주기에 대한 RPO가 1분을 초과할 수 있습니다.
  • VM에서 디스크를 분리하거나 디스크가 복제되는 동안 VM을 다시 시작하는 경우. VM에서 분리되는 복제가 진행되는 디스크에서는 RPO가 단시간 동안 최대 5분까지 증가할 수 있습니다.

디스크의 RPO를 확인하는 방법은 Persistent Disk 비동기 복제 성능 측정항목을 참조하세요.

장애 조치 중 복구 시간 목표(RTO)는 워크로드를 새 리전으로 장애 조치하는 것과 관련된 여러 태스크를 완료하는 데 걸리는 시간에 따라 달라집니다. 복제 중지와 보조 리전에서 VM에 디스크 연결과 같은 태스크는 완료하는 데 몇 분 밖에 걸리지 않습니다. 장애 조치가 수행될 때 VM 시작을 기다릴 필요가 없도록 보조 리전에서 VM이 실행 중인지 확인하여 RTO를 높일 수 있습니다.

다음 단계