Spanner 운영 가이드라인

이 페이지에서는 Spanner 인스턴스의 중단을 유발하여 'Google의 합리적인 통제 범위를 벗어난 요인으로 인해 발생하는' 중단을 제외하는 Spanner 서비스수준계약(SLA)에서 제외될 수 있는 사용자 제어 구성을 설명합니다. 이러한 구성을 방지하는 방법에 대한 가이드라인도 제공합니다.

Spanner는 데이터 분할 및 재분배, 복제, 장애 조치, 모든 하드웨어 및 소프트웨어 업데이트와 같은 데이터베이스 작업의 여러 측면을 관리합니다. 기본 제공 설정과 관리 API를 사용하여 이러한 동작 다수를 구성할 수 있습니다. 워크로드는 Spanner 외에도 애플리케이션 및 네트워크와 같은 다른 구성요소에도 종속됩니다. 이러한 고객 제어 구성은 데이터베이스 부하 및 기타 구성 파라미터에 따라 인스턴스 다운타임 위험을 증가시킬 수 있습니다.

인스턴스가 비정상 상태가 되고 Google에서 인스턴스가 이 페이지에 설명된 작업 제한을 준수하지 않는다고 확인하면 결과적으로 발생하는 다운타임에 Spanner SLA가 적용되지 않을 수 있습니다(또는 계산에 포함되지 않음).

Spanner SLA에서 제외되는 구성

다음 구성은 Spanner SLA에서 제외됩니다.

인스턴스가 구성되고 워크로드가 인스턴스에 과부하를 초래하는 방식으로 사용되는 경우에는 SLA가 적용되지 않습니다.
자발적인 행위 또는 비활동으로 인해 발생하는 인스턴스 다운타임에는 SLA가 적용되지 않습니다.
Spanner API 또는 Spanner를 만들고 연결하는 데 필요한 기타 Google Cloud API를 사용 중지하면 SLA가 적용되지 않습니다.
프록시 및 방화벽 규칙과 같은 네트워크 구성으로 인한 Spanner API 사용 불가는 SLA에 포함되지 않습니다.
오래되었거나 잘못 구성된 클라이언트로 인한 애플리케이션 사용 불가는 SLA에 포함되지 않습니다. 특히 지원되는 종속 항목이 있는 최신 클라이언트 버전을 사용하고 있는지 확인합니다. 예를 들어 Java 애플리케이션은 Gradle 또는 Maven과 같은 패키지 관리자와 함께 Google의 BOM(자재명세서)을 사용해야 합니다.

Cloud Monitoring을 사용하여 알림과 모니터링을 설정하는 것이 좋습니다.

피해야 할 구성

Spanner SLA 적용 범위를 유지하려면 다음 구성을 피해야 합니다.

CPU 과부하: CPU 사용률이 지속적으로 높으면 인스턴스 크기가 워크로드에 맞게 조정되지 않으며 인스턴스에 SLA가 적용되지 않을 수 있습니다. Spanner CPU 사용률 권장사항은 장애 조치 이벤트의 오버헤드를 제공합니다. 여기서 나머지 컴퓨팅 리소스는 인스턴스의 사용할 수 없는 부분에서 발생하는 트래픽을 수용하는 데 도움이 됩니다. Spanner CPU 사용률 측정항목을 사용하여 CPU 사용률을 모니터링할 수 있습니다.
전체 스토리지: Spanner는 사용한 스토리지에 대한 요금만 청구합니다. 하지만 각 노드나 컴퓨팅 단위에는 관리할 수 있는 스토리지 양에 대한 한도가 있습니다. 인스턴스 크기가 노드당 주소 지정 가능 스토리지에 맞게 조정되지 않으면 인스턴스에 SLA가 적용되지 않을 수 있습니다. Spanner 스토리지 사용률 측정항목을 사용하여 스토리지 사용률을 모니터링할 수 있습니다.
할당량 한도: 노드 리소스는 사용자별 할당량에 따라 제한됩니다. 할당량 증가를 미리 요청하지 않으면 컴퓨팅 리소스가 과부하되어 SLA가 적용되지 않을 수 있습니다. Google의 승인이 필요한 할당량 상향 요청은 일반적으로 하루 이내에 처리됩니다.
프로비저닝되지 않은 세션: Spanner 클라이언트는 gRPC 채널을 사용하여 쿼리 및 관리에 사용되는 Google Cloud 엔드포인트와 통신합니다. 클라이언트 환경에서 워크로드의 요청 볼륨을 지원할 만큼 충분한 채널을 제공하지 않으면 애플리케이션에서 긴 지연 시간과 낮은 요청 처리량이 발생하고 SLA가 적용되지 않을 수 있습니다.
연결 과부하: 쿼리의 트랜잭션 교착 상태, 네트워크 문제 또는 관리 API의 비율 제한과 같은 일시적인 오류가 발생할 경우 여러 Spanner API를 안전하게 재시도할 수 있습니다. 지나치게 공격적인 재시도는 기존 연결을 압도하여 리소스 소진이나 추가 제한을 유발할 수 있습니다. 지연 시간 증가 또는 처리량 감소는 SLA에 해당되지 않을 수 있습니다. 자세한 내용은 클라이언트 제한 시간 및 재시도 관리를 참조하세요.
하드 디스크 드라이브(HDD) 과부하: 계층형 스토리지를 사용하면 솔리드 스테이트 드라이브(SSD)와 하드 디스크 드라이브(HDD)를 혼합하여 Spanner 데이터를 저장할 수 있습니다. HDD 스토리지의 디스크 부하가 100%에 도달하면 Spanner 인스턴스의 지연 시간이 크게 늘어나 SLA가 적용되지 않을 수 있습니다. Spanner 계층화된 스토리지 측정항목을 사용하여 디스크 부하를 모니터링할 수 있습니다.

다음 단계

출시 체크리스트를 사용하여 Spanner 성능 및 가용성을 향상시키기 위한 권장사항 알아보기