이 페이지에서는 AlloyDB Omni 데이터베이스를 데이터 손실 없이 또는 최소한의 데이터 손실로 적시에 복원할 수 있도록 하는 데 사용할 수 있는 AlloyDB Omni 가용성 아키텍처를 소개합니다.
비즈니스 연속성을 보장하고 데이터 손실을 최소화하려면 고가용성 (HA) 및 재해 복구 (DR)가 AlloyDB Omni의 중요한 데이터 보호 전략입니다. HA는 데이터베이스 가용성을 유지하고 복구 시간 목표 (RTO)를 최소화하는 데 중점을 두는 반면 DR은 심각한 이벤트로부터 복구하고 복구 지점 목표 (RPO)를 최소화하는 데 중점을 둡니다.
RTO와 RPO는 비즈니스 요구사항에 부합하며 다음과 같이 정의됩니다.
- RTO 는 데이터베이스가 다운되거나 사용할 수 없게 되어 수익 또는 생산성 손실과 같은 비즈니스에 허용되지 않는 결과가 발생하기 전까지의 최대 시간입니다.
- RPO는 비즈니스 요구사항에 영향을 미치기 전에 비즈니스에서 경험할 수 있는 최대 데이터 손실량입니다. 예를 들어 전체 감사 추적이 필요한 인벤토리 시스템에는 데이터 손실이 없어야 한다는 요구사항이 있을 수 있습니다.
AlloyDB Omni는 가용성 수준을 높이는 다음 가용성 참조 아키텍처를 제공합니다.
- 표준 가용성: 백업을 사용하여 데이터를 보호합니다.
- 가용성 향상: 리전의 영역 복제 (HA)를 사용하여 데이터를 보호합니다.
- Premium 가용성: 영역 및 리전 복제 (HA 및 DR)를 사용하여 데이터를 보호합니다.
가용성 메커니즘
다음은 가용성을 보장하는 주요 메커니즘입니다.
- 데이터베이스 백업
- 데이터베이스 복제
데이터베이스 백업
데이터 보호의 기본 측면인 데이터베이스 백업에는 데이터베이스 데이터 파일의 실제 복사본을 만드는 작업이 포함됩니다. 전체, 증분, 차등 등 다양한 백업 유형은 복구 지점 목표 (RPO), 백업 크기 및 기간, 복원 시간 간에 다양한 균형을 제공합니다.
효율적인 복구를 보장하고 시스템 장애 발생 시 데이터 손실을 최소화하려면 강력한 백업 전략에 데이터베이스와 미리 쓰기 로그 (WAL) 파일 백업이 모두 포함되어야 합니다. 데이터 파일의 정기적인 (일반적으로 매일) 백업은 매우 중요합니다. 또한 데이터베이스 수정사항을 기록하고 PITR(point-in-time recovery)에 중요하며 복원 중에 데이터 무결성을 유지하는 WAL 파일을 백업해야 합니다.
데이터베이스 복제
PostgreSQL은 안정성을 높이기 위해 복제본 서버를 제공합니다. 이러한 복제본은 애플리케이션 연결을 허용하지 않는 웜 대기 또는 읽기 전용 모드로 작동하는 핫 대기로 분류됩니다. 기본 데이터베이스의 변경사항은 복제본에 지속적으로 적용되어 복제본의 데이터를 최신 상태로 유지합니다. 기본 데이터베이스가 실패하면 복제본이 기본 상태로 승격되어 기본 데이터베이스의 책임을 맡습니다.
데이터베이스 복제본은 기본 인스턴스와 동일한 영역 또는 데이터 센터, 다른 영역, 다른 리전 또는 이러한 위치의 조합에 배치할 수 있습니다. 복제본이 기본 데이터베이스에서 멀리 떨어져 있을수록 복제본을 최신 상태로 유지하기 위해 변경사항을 전송할 때 지연 시간이 길어집니다. 지역 장애와 같은 대규모 장애를 완화하기 위해 멀리 떨어진 위치에 배포하는 경우 데이터 복제는 일반적으로 비동기식으로 실행됩니다. 이 방법을 사용하면 이러한 설정에서 발생할 수 있는 성능 저하를 방지할 수 있습니다.
고가용성 배포에서 복제본은 일반적으로 기본 데이터베이스와 가까운 곳에 배포됩니다. 예를 들어 동일한 데이터 센터 내의 다른 영역에 배포된 복제본은 RTO가 낮고 RPO가 0에 가깝습니다. 반면 재해 복구 구성에서는 중단에 대한 보호 수준에 따라 복제본이 별도의 데이터 센터나 리전에 배포됩니다. 이 접근 방식은 복제가 비동기식일 수 있으므로 RPO가 높아지고 RTO가 다양해집니다.
다음 표에는 AlloyDB Omni 가용성 참조 아키텍처에 사용되는 메커니즘이 요약되어 있습니다.
기능 | Standard | 고급 | 프리미엄 |
---|---|---|---|
백업 | ✔ | ✔ | ✔ |
영역 복제본 | ❌ | ✔ | ✔ |
교차 영역 복제본 | ❌ | ✔ | ✔ |
리전 복제본 | ❌ | ❌ | ✔ |
표 1. 지원되는 AlloyDB Omni 가용성 메커니즘
데이터베이스 실패 및 복구 시나리오
데이터베이스 오류는 다음 수준에서 발생할 수 있습니다.
- 인스턴스 (노드 또는 서버) 장애: 데이터베이스 자체에 장애가 발생합니다.
- 서버 오류: 데이터베이스를 호스팅하는 서버에 오류가 발생합니다.
- 영역 장애: 서버가 있는 전체 데이터 센터에 장애가 발생합니다.
- 리전 장애: 홍수나 대규모 지진 등으로 여러 데이터 센터(가용성 영역)가 포함된 전체 리전을 사용할 수 없습니다.
이벤트가 적고 이러한 이벤트를 방지하는 비용이 증가하면 재해 발생 가능성과 위험이 감소합니다. 비즈니스에서는 위험 허용 범위를 결정하고 잠재적인 중단을 수용할지 아니면 위험을 최소화하기 위해 복원력이 뛰어난 아키텍처에 투자할지 선택해야 합니다.
다음 표에는 AlloyDB Omni 참조 아키텍처에서 지원하는 복구 시나리오가 요약되어 있습니다.
재해 유형 | Standard | 고급 | 프리미엄 |
---|---|---|---|
VM/인스턴스 실패 | ✔ | ✔ | ✔ |
노드/서버 장애 | ✔ | ✔ | ✔ |
영역 장애 | ❌ | ✔ | ✔ |
리전 장애 | ❌ | ❌ | ✔ |
표 2. 지원되는 복구 시나리오
비즈니스에 중요한 애플리케이션의 경우 가용성이 99.99%에 달하고 복구 시 데이터 손실이 없어야 하는 등 AlloyDB Omni 데이터베이스의 비즈니스 목표를 고려하세요. 가용성 참조 아키텍처의 목표는 RTO 및 RPO 요구사항을 해결하는 것입니다.
AlloyDB Omni는 계획된 중단과 계획되지 않은 중단으로부터 데이터베이스를 보호하기 위해 표준, 고급, 프리미엄 가용성 아키텍처를 제공하여 다양한 비즈니스 요구사항에 부합합니다. 예를 들어 개발 환경에서는 백업을 통한 기본 보호를 사용할 수 있지만, 미션 크리티컬 애플리케이션에서는 고가용성 및 재해 복구 설정을 사용할 수 있습니다.
다음 단계
AlloyDB Omni 가용성 참조 아키텍처에 대해 자세히 알아보세요.