SAP HANA 재해 복구 계획 가이드

이 가이드에서는 Google Cloud에 배포된 SAP HANA 시스템의 재해 복구 옵션을 간략하게 설명합니다.

이 가이드는 표준 SAP 문서를 대체하지 않습니다.

재해 복구 준비

재해에 대비하려면 SAP HANA 시스템 복제 기능을 사용하여 보조 SAP HANA 시스템에 복제하거나 복구가 가능하도록 SAP HANA의 백업을 만들거나 두 가지 작업을 모두 수행합니다.

빠른 복구가 필요한 업무상 중요한 워크로드의 경우 HANA 시스템 복제 기능을 사용하면 다운타임을 최소화할 수 있습니다. 백업을 사용하여 시스템을 복구하면 새 시스템이 생성된 다음 과거 원하는 시점으로 복구하기 위해 새 시스템으로 백업을 복원해야 하므로 비용은 적게 들지만 시간이 오래 걸릴 수 있습니다.

두 경우 모두 SAP HANA 시스템을 사용하는 클라이언트 애플리케이션을 교체 시스템(제공된 경우)의 IP 주소로 리디렉션하기 위해 네트워크 기반 리디렉션을 사용해야 합니다. 자세한 내용은 SAP HANA 관리 가이드를 참조하세요.

SAP HANA SPS09부터는 SAP HANA에 포함된 Python 기반 API를 사용하여 자체 고가용성/재해 복구(HA/DR) 공급자를 만들고 이를 SAP HANA 시스템 복제 인계 프로세스에 통합하여 인계 후 기본 시스템과 보조 시스템 간의 데이터베이스 클라이언트 연결 리디렉션과 같은 작업을 자동화할 수 있습니다. 자세한 내용은 HA/DR 공급자 구현을 참조하세요.

동기 복제를 위한 거리 제한과 같이 SAP에서 정의한 제한사항도 Google Cloud 적용된다는 점에 유의하세요.

기본 재해 복구 옵션 대신 리전 간 활성-수동 재해 복구(DR)에 영구 디스크 비동기 복제(PD 비동기 복제)를 사용할 수 있습니다. PD 비동기 복제는 두 Google Cloud 리전 간 데이터의 비동기 복제를 제공합니다.

SAP HANA 시스템 복제를 사용하여 재해 복구

인프라 리소스 사용률을 극대화하고 DR 솔루션 비용을 최적화하려면 개발 또는 QA 시스템과 같이 프로덕션 이외의 사용 사례에 보조 시스템을 사용하면 됩니다. 이 경우 보조 시스템에는 데이터가 미리 로드되지 않으므로 보조 시스템에 데이터가 미리 로드되어 기본 시스템과 동기화를 유지하는 경우보다 장애 조치에 걸리는 시간이 길어집니다.

HANA 2 SPS00에는 활성/활성(읽기 지원) 구성 모드에 대한 지원이 포함되어 있으며, 이를 통해 SAP HANA 시스템 복제를 사용 설정하여 보조 시스템에서 읽기 액세스를 지원할 수 있습니다. 자세한 내용은 활성/활성(읽기 지원)을 참조하세요.

Google Cloud에서 SAP HANA 시스템 복제를 사용할 때 동기 복제와 비동기 복제가 모두 지원됩니다.

SQL 트랜잭션이 대기 인스턴스에 커밋될 때까지 기본 데이터베이스 인스턴스에는 커밋되지 않는 경우, 가능하다면 동기 복제를 사용하는 것이 좋습니다. 이렇게 하면 대기 인스턴스가 100% 동기화되므로 복구 지점 목표를 0으로 유지할 수 있습니다. 동기 복제는 어떤 영역에 있든 동일한 리전에 있는 인스턴스에 사용할 수 있습니다.

SystemReplication-preload1

대기 시스템이 기본 시스템과 다른 리전에 있는 경우 기본 인스턴스에 커밋하기 전 대기 인스턴스에서 데이터를 확인할 필요가 없다면 비동기 복제를 사용합니다. 이 경우 재해 발생 시 소량의 데이터가 손실될 수 있습니다. 단점은 비동기 복제로 인해 복구 지점 목표가 0보다 커진다는 점입니다.

SystemReplication-preload2

모든 복제 시나리오에서 재해 복구를 시작하려면 대기 시스템에서의 인계 작업을 수동으로 수행해야 합니다. 또한 SAP HANA 데이터베이스를 사용하는 모든 애플리케이션을 대기 시스템에서 장애 조치된 인스턴스로 직접 리디렉션해야 합니다.

복구 시간 목표(RTO)와 복구 지점 목표(RPO) 같은 비즈니스 요구사항에 가장 적합한 HANA 시스템 복제를 선택합니다. 자세한 내용은 SAP HANA 시스템 복제를 위한 복제 모드를 참조하세요.

미리 로드를 사용하는 SAP HANA 시스템 복제

이 시나리오에서는 SAP HANA 시스템이 전용 대기 시스템에 복제됩니다. SAP HANA 데이터베이스는 호스트 이름이 고유하고 자체 영구 디스크가 연결된 Compute Engine VM에 복제됩니다. 모든 SAP HANA 데이터는 대기 시스템의 메모리에 로드됩니다. 모든 데이터가 미리 로드되기 때문에 장애 조치를 완료하는 데 90초면 충분합니다.

미리 로드를 사용하는 SAP HANA 시스템 복제에 대한 자세한 내용은 SAP HANA – 고가용성에서 시스템 복제 섹션을 참조하세요.

미리 로드를 사용하지 않는 SAP HANA 시스템 복제

이 시나리오에서는 SAP HANA 시스템이 전용 대기 시스템에 복제됩니다. SAP HANA 데이터베이스는 호스트 이름이 고유하고 자체 영구 디스크가 연결된 Compute Engine VM에 복제됩니다. SAP HANA 데이터가 대기 시스템의 메모리에 미리 로드되지 않습니다. 데이터세트의 크기에 따라 장애 조치를 완료하는 데 수분에서 수시간까지 걸릴 수 있습니다.

데이터를 미리 로드하지 않는 경우 SAP HANA 데이터베이스를 호스팅하는 Compute Engine VM의 메모리 요구사항이 훨씬 작아집니다. 최신 크기 조정 안내는 '보조 시스템 복제 사이트의 메모리 사용률에 적용되는 규칙'에서 SAP Note 1999880 - FAQ: SAP HANA System Replication(FAQ: SAP HANA 시스템 복제)을 참조하세요.

다음 쿼리를 실행하여 rowstore 메모리 사용 공간에 대한 정보를 확인할 수 있습니다.

SELECT round (sum(USED_FIXED_PART_SIZE + USED_VARIABLE_PART_SIZE)/1024/1024) AS "Row Tables MB" FROM M_RS_TABLES;

메모리 요구사항이 낮을 경우 Compute Engine 머신 유형을 선택할 때 비용 절감 옵션을 선택할 수 있습니다.

  • 대기 시스템에서 SAP HANA 데이터베이스를 호스팅하기 위해 메모리 사양이 낮은 머신 유형을 사용하면 실행 비용을 줄일 수 있습니다. 프로덕션 시스템의 SAP HANA에는 메모리 사양이 낮은 VM이 지원되지 않습니다. 단, 재해 복구 시나리오에서는 인계를 수행하는 데 이 저비용의 VM을 사용한 이후에 지원되는 메모리 용량을 갖춘 머신 유형으로 변경할 수 있습니다. 이렇게 하려면 업그레이드를 수행하기 위해 VM을 중지해야 해야 하므로 SAP HANA 시스템이 사용 가능해질 때까지 추가 다운타임이 발생하게 됩니다.

  • 대기 시스템에서 SAP HANA 데이터베이스를 호스팅하기 위해 높은 메모리 머신 유형을 사용하고 이를 개발 또는 테스트 시스템과 공유하여 투자 수익을 개선할 수 있습니다. 전역 메모리 할당 한도 변경의 안내에 따라 SAP HANA 데이터베이스의 전역 할당 한도를 64GB로 설정할 수 있으며, 이때 나머지 메모리는 다른 시스템에서 사용할 수 있도록 남겨 둡니다. 대기 시스템이 필요하면 개발 및 테스트 운영을 종료하고, 인계를 수행한 다음 전역 할당 한도를 제거하세요.

미리 로드를 사용하지 않고 동기 및 비동기 복제 중 하나를 사용할 수 있습니다. 그러나 동기 복제를 사용하려면 소스 및 대상 인스턴스가 동일한 Google Cloud 리전에 있어야 합니다.

보조 호스트에서 개발 또는 테스트 시스템이 종료되는 문제 등을 해결하기 위해 HA/DR 공급자를 사용해도 됩니다.

인계 트리거

재해 복구를 호출하려면 대기 시스템에서 SAP HANA 시스템 복제 인계 절차를 트리거해야 합니다. SAP Note 2063657에는 가장 적합한 인계 옵션을 판단하는 데 도움이 되는 가이드라인이 나와 있습니다.

인계를 트리거하려면 표준 SAP HANA 인계 프로세스를 따르세요. 이 절차에 대한 자세한 내용은 SAP HANA 2.0용 시스템 복제 수행 방법을 참조하세요.

데이터 문제 또는 소프트웨어 오류 발생 시 인계를 수행할 수 있도록 자동 알림이 전송되지 않을 수 있습니다. Cloud Monitoring 또는 HANA 모니터링 도구를 사용하여 알림을 보내려면 커스텀 솔루션을 만들어 보세요.

SAP HANA 백업을 사용하여 재해 복구

더 긴 복구 시간 목표가 허용되고 복구 지점 목표가 15분보다 길면 재해 발생 시 백업에서 복원하여 복구할 수 있습니다. 백업을 사용하여 성공적으로 복구하려면 백업 파일, 특히 로그 백업의 복사본을 Cloud Storage 버킷이나 SAP HANA 시스템이 실행되는 리전 밖의 다른 장기 스토리지 위치에 여러 개 만들어야 합니다. 기본 시스템의 인프라를 문서화하고 백업을 복원할 대체 시스템을 신속하게 만들 수 있도록 스크립트를 만드는 것이 좋습니다.

자세한 내용은 SAP HANA 운영 가이드를 참조하세요.

PD 비동기 복제를 사용한 재해 복구

Google Cloud에서 실행되는 SAP 워크로드의 경우 PD 비동기 복제는 두 Google Cloud 리전 간에 데이터를 복제하여 재해 복구를 지원합니다. PD 비동기 복제는 리전 간 활성-수동 재해 복구를 위해 낮은 복구 지점 목표(RPO) 및 낮은 복구 시간 목표(RTO) 블록 스토리지 비동기 복제를 제공합니다. 드물게 발생하는 리전 중단의 경우에도 PD 비동기 복제를 사용하면 SAP 데이터를 보조 리전으로 장애 조치하고 이 리전에서 SAP 워크로드를 다시 시작할 수 있습니다.

SAP HANA 시스템 복제와 같은 SAP 워크로드 수준 대신 인프라 수준에서 Compute Engine 기반 SAP 워크로드의 복제를 관리하려면 PD 비동기 복제를 사용하면 됩니다.

PD 비동기 복제는 실행 중인 워크로드에 연결된 기본 디스크에서 다른 리전에 있는 보조 빈 디스크에 SAP 데이터를 복제합니다. 자세한 내용은 영구 디스크 비동기 복제 정보를 참조하세요.

PD 비동기 복제 제한사항

PD 비동기 복제의 경우 지원되는 리전 쌍에서 균형 있는 영구 디스크(pd-balanced) 및 성능(SSD) 영구 디스크(pd-ssd)만 사용할 수 있습니다. 자세한 내용은 제한사항을 참조하세요.

영구 디스크 비동기 복제 성능 검토에 설명된 대로 기기 쌍의 모니터링 측정항목을 검토하여 PD 비동기 복제 기능에 대한 워크로드 변경 속도를 모니터링하고 평가합니다.

async_replication/sent_bytes_count 측정항목은 리전 간 네트워크를 통해 전송된 바이트 수의 델타를 나타내므로 전송되는 데이터 양이 지속적으로 증가하지 않을 것으로 예상됩니다.