비즈니스 연속성 계획 및 재해 복구

이 페이지는 ApigeeApigee Hybrid에 적용됩니다.

Apigee Edge 문서 보기

Apigee는 전 세계 여러 리전에 있는 여러 데이터 센터에서 완전한 중복성(라이브/라이브) 구성으로 실행되는 멀티 테넌트, 셀프서비스 방식의 클라우드 기반 플랫폼입니다. Apigee는 해당 클라우드 기반 플랫폼으로 Google Cloud를 사용합니다. Google Cloud에서 빌드하는 서비스의 일부로 Google은 이러한 데이터 센터 간 고객을 위해 각 리전 및 서비스 라이브 트래픽 내에서 여러 데이터 센터를 사용합니다. Google은 '라이브' 데이터 센터와 '대기'(또는 '보조' 또는 '장애 조치') 데이터 센터를 운영하지 않습니다. Google은 전 세계적으로 각 리전에서 고객 트래픽을 지속적으로 그리고 동시에 처리하는 2개(이상)의 데이터 센터를 갖고 있습니다.

BCP/DR 계획

Apigee 비즈니스 연속성 계획 및 재해 복구(BCP/DR)는 플랫폼 전체 계획이며 개별 고객들에 대한 세부 태스크를 포함하지 않습니다. 오히려 플랫폼은 서비스 방해 및 중단에 관계없이 고객 데이터 요청을 처리할 수 있도록 구성됩니다. 전체 데이터 센터가 오프라인이 되어도 데이터는 계속 전송됩니다. 전체 리전이 오프라인으로 전환되면 단일 리전 고객이 API 처리 서비스 중단을 경험할 수 있습니다. '리전 내' 중복 서비스 이상이 필요한 고객을 위해서는 전체 리전이 오프라인으로 전환되어도 데이터가 계속 전송될 수 있도록 여러 리전 또는 국가에서 트래픽이 처리될 수 있는 전 세계적인 중복 수준의 중복 데이터 센터로 제공되는 Apigee가 있습니다.

단일 리전 고객 서비스는 데이터 처리 및 액세스에 대한 지리적 제한으로 인해 다른 리전으로 자동으로 전송되지 않습니다. Apigee 서비스는 해당 고객이 지정한 리전의 고객을 위해 호스팅됩니다. 데이터의 지리적 위치에 관해 해당 사용자에 대한 특정 규제 또는 고객 약정이 있을 수 있기 때문에 서비스가 대체 리전으로 자동으로 이동되지 않으며, 그 결과 해당 고객에 대한 Google 약정 또는 고객사의 고객에 대한 Google 고객사의 약정이 훼손될 수 있습니다.

Google은 고객에 대한 내부 민감한 정보 및 참조가 포함되는 전체 BCP/DR 계획을 개별 고객과 공유하지 않습니다. Google 개인정보처리방침은 다른 고객 이름을 노출할 가능성이 있는 플랫폼 BCP/DR 계획을 개별 고객과 공유하지 않도록 방지합니다. Google은 각 고객에게 동일한 수준의 개인 정보 보호 기능을 제공합니다.

BCP/DR 관리

Google 정보 보안팀은 비즈니스 탄력성 프로그램의 감독을 책임지고 순환 배치되는 이슈 책임자는 모든 이슈의 관리 및 해결을 담당합니다. 이슈 책임자는 조치가 필요할 수 있는 모든 작업에 대한 플레이북과 함께 항상 지원 서비스를 제공하는 운영 및 엔지니어링 인력을 관리합니다.

BCP/DR 테스트

Google은 연간 정규 BCP/DR 테스트보다 자주 플랫폼에 대한 BCP/DR 테스트를 지원하는 운영 프로세스를 수행합니다. Google은 매월 라이브/라이브 환경에서 로드 스윙을 수행하고, 서비스 실행 시스템에 업데이트를 수행합니다. 이러한 프로세스에는 피어 데이터 센터에서 로드를 처리하는 동안 시스템에 해당하는 하나의 전체 데이터 센터를 작동 중지하는 과정이 포함됩니다. 이 프로세스를 수행하는 동안에는 업데이트가 수행된 후 첫 번째 데이터 센터가 백업되고 서비스가 다시 라이브/라이브로 실행되어 발생한 이슈가 없는지 확인합니다. 그런 후 피어 데이터 센터가 동일 업데이트를 위해 작동 중지되고 다시 온라인으로 전환됩니다. Google은 트래픽을 드레이닝하고 트래픽 중 일부를 최근에 업데이트된 서비스로 전송하여 이슈 또는 오류가 있는지 확인한 후에 전체 로드 처리로 돌아갈 수 있게 해주는 도구 및 기술을 사용합니다.

이러한 일관된 운영 프로세스는 운영 태스크를 보다 자주 수행하여 업계 표준의 2년에 한 번 있는 서비스 복원력 '테스트'를 초과합니다.

위에서 설명한 운영 프로세스 외에도 Google은 최소 1년에 한 번 이상 BCP/DR 훈련을 수행합니다. 이 때 엔지니어링 및 운영팀 구성원은 실제 재해 시나리오를 테스트합니다. 이러한 운영 방식을 통해 Google 인력은 서비스 자체는 물론 전체 기업에 대한 대규모 BCP/DR 계획에 대한 추가적인 훈련 및 경험을 얻을 수 있습니다.

Google에서 수행되는 BCP/DR 테스트에는 실행 시스템에 모두 기본 제공되기 때문에 '장애 조치 연습' 또는 '보조 위치'가 사용되지 않습니다.

Google은 모든 운영 및 엔지니어링팀에서 사용할 수 있는 플레이북을 관리하고 있습니다. 이러한 플레이북은 최소 1년에 한 번 검토 및 업데이트되며 모든 BCP/DR 테스트 및 훈련 연습에 사용됩니다.

연간 BCP/DR 테스트 보고서는 고객들에게도 제공됩니다. 또한 운영 태스크 및 연간 DR 훈련 테스트 보고서 결과를 타사 감사관과 공유하며, 이러한 결과는 감사관이 PCI, HIPAA, ISO, 계약, 기타 요구사항에 대한 규정 준수 상태를 검토할 때 기준으로 사용됩니다.

고객 BCP/DR 테스트

고객은 자신의 고유 DR 계획에 Apigee 서비스를 포함하도록 권장됩니다. 고객 데이터 센터가 중단되었거나 다른 재해가 발생한 경우에도 최종 사용자 서비스를 유지해야 하는 고객의 경우 Apigee가 필요에 따라 트래픽을 리디렉션할 수 있는 방법을 확인할 수 있고 이를 고려해야 합니다. 하지만 이 수준의 테스트는 Apigee DR 계획의 범위를 벗어납니다. 여기에서는 고객이 자신의 고유 애플리케이션에 대해 BCP/DR 테스트를 수행하고 테스트에 Apigee를 포함하도록 권장합니다.

RTO/RPO

Apigee는 고객에 대해 또는 BCP/DR 활동 관련 계약에서 복구 지점 및 복구 시간 목표(RPO/RTO)를 제공하지 않습니다. SLA는 클라우드에 상응하는 RTO/RPO 데이터 포인트입니다. Apigee가 중복 라이브 서비스로 설계된 관리 및 런타임 서비스를 모두 포함하는 클라우드 기반 중복 서비스이기 때문에 RTO 및 RPO는 모두 '실시간'으로 표시될 수 있습니다. 단일 리전 고객은 동일 리전 내에 있는 여러 데이터 센터에서 최소한의 중복 서비스만 받습니다. 더 높은 수준의 중복성이 필요한 고객은 멀티 리전 서비스를 선택할 수 있습니다.

팬데믹 계획

Google은 전체 BCP/DR 계획 및 프로세스의 일부에 팬데믹 계획을 포함합니다. 지원과 같은 비즈니스 운영을 위해 Google은 여러 사무소 및 원격 위치에서 연중무휴로 전 세계 지원팀을 운영하고 있습니다. 전 세계에 분포된 Google 지원 위치 중 한 곳이 팬데믹의 영향을 크게 받는 경우, 다른 사무소에 알림이 제공되고 해당 사무소에서 일반적으로 처리되는 업무를 지원하게 됩니다. 영업과 같은 다른 비즈니스 서비스의 경우에는 인력이 전 세계적으로 분산되어 있습니다. Google의 모든 팀은 필요에 따라 원격 근무를 위한 장비가 지급되어 있습니다. 사용되는 도구는 클라우드를 기반으로 하며 자연스럽게 팬데믹 대응 계획에 도움이 됩니다.

업데이트

Google은 BCP/DR 계획을 최소한 1년에 한 번 이상 검토하고 업데이트합니다. 계획 업데이트를 위해서는 이슈, 제품 변경, 업계 표준, 위험 분석 활동, BCP/DB 테스트로부터 수집된 정보가 활용됩니다.

비즈니스 영향 분석 및 위험 평가

Google은 비즈니스 영향 분석 및 위험 평가를 매년 수행합니다. BIA 및 RA 결과는 다른 결과보다 우선적용되고 이슈 추적 시스템에 기록됩니다.