할당량 관리 권장사항

이 페이지에서는 Cloud Healthcare API 할당량 관리에 대한 권장사항을 설명합니다. Google Cloud 프로젝트에 대규모 트래픽이 포함되어 있거나 포함될 수 있고 Cloud Healthcare API로 기본 제공되는 것보다 많은 할당량이 필요하면 이 페이지의 안내를 따르세요.

Cloud Healthcare API 기본 할당량

기본 Cloud Healthcare API 할당량은 모든 사용 사례에 맞게 설계된 것은 아니며, 특히 Google Cloud 프로젝트에 많은 트래픽이 있는 경우에는 잘 맞지 않습니다. Cloud Healthcare API는 할당량을 자동으로 확장하지 않습니다. 사용자가 할당량 사용량을 계획하고 모니터링해야 합니다.

할당량 모니터링 및 보기 권장사항

할당량 사용 보기를 위한 몇 가지 방법이 있습니다. Cloud Healthcare API에 대한 할당량을 예측하고 볼 때 서비스 할당량 모델을 사용하는 것이 좋습니다. 이 모델을 사용하면 다음 기준에 따라 사용 가능한 할당량을 정확하게 평가할 수 있습니다.

  • 관리자 재정의가 존재하는지 여부. 조직의 할당량 관리자 역할이 부여된 주 구성원이 조직 내 Google Cloud 프로젝트의 할당량에 관리자 재정의를 적용할 수 있습니다. 관리자 재정의는 기본 한도 및 제작자 재정의를 대체합니다.
  • 제작자 재정의가 있는지 여부. 서비스 소유자가 서비스 소비자에게 제작자 재정의를 부여합니다. Google Cloud는 Cloud Healthcare API 서비스의 서비스 소유자입니다. Google Cloud에서 제공하는 모든 할당량 재정의는 제작자 재정의입니다.

  • 소비자 재정의가 있는지 여부. Cloud Healthcare API에 요청을 수행하는 사용자는 Cloud Healthcare API 서비스의 소비자입니다. Google Cloud 프로젝트의 할당량을 한도 초과 방지를 위한 비용 관리 수단으로 제한하는 등 다양한 상황에 소비자 재정의를 적용할 수 있습니다.

이러한 재정의가 적용되는 경우 소비자 할당량 한도를 계산하여 사용 가능한 할당량을 정확하게 평가할 수 있습니다.

추가 할당량 요청 권장사항

Google Cloud에는 할당량 상향을 요청하는 절차가 있습니다. 할당량 상향 조정 요청이 처리되는 방식은 할당량 상향 요청 정보를 참조하세요.

추가 할당량을 요청하기 전에 다음 두 가지를 모두 구현했는지 확인하세요.

이러한 구현으로 인해 다음과 같은 이유로 필요한 할당량이 줄어들 수 있습니다.

  • 두 구현 모두 부하 급증이 몇 초가 아닌 몇 시간 또는 몇 분에 걸쳐 분산됩니다.
  • 두 구현 모두 24시간 동안 할당량을 효율적으로 사용합니다. 기본 할당량을 크게 초과하는 요청이 24시간 동안 일관적인 경우 Cloud Healthcare API 서비스에 더 큰 리소스 풀을 할당할 수 있습니다. 추가 리소스 할당은 요청별로만 수행되며 사례별로 결정됩니다.
  • 일관된 리소스 사용을 통해 Google Cloud에서 할당량 요구사항을 더 쉽게 이해하고 필요한 할당량을 제공할 수 있습니다.

용량 및 할당량을 효과적으로 관리하려면 조직의 용량 요구사항을 알아야 합니다. 용량 요구사항을 계획하고 있으며 Google Cloud 프로젝트가 프로덕션 단계에 있을 때 할당량을 크게 늘려야 한다고 생각되면 Google Cloud 고객 관리에 상향 조정을 요청하세요. 고객 관리는 Google Cloud 프로젝트의 테스트 및 출시 단계에서 할당량을 할당하고 늘리는 데 도움을 줄 수 있습니다.

유료 고객 관리 서비스를 사용하지 않아도 할당량 상향을 요청할 수 있습니다. 일부 할당량 상향 조정 요청은 영업일 기준 2~3일 이내에 완료되지만 더 여유를 두고 계획하는 것이 좋습니다. 할당량 증가가 큰 경우 할당량 상향 요청이 완료되는 데 영업일 기준 10일 이상이 걸릴 수 있습니다. 계획의 일부에는 고객 질문에 응답하거나 요청과 관련된 미해결 문제를 해결하기 위해 고객 관리에 시간을 할당하는 작업이 필요합니다. 초기 할당량 상향 요청이 충분히 자세한 경우 요청 이행을 기다리는 데 소요되는 시간을 줄일 수 있습니다.

할당량 요구를 위한 권장사항

Google Cloud 프로젝트를 프로덕션으로 전환하기 전에 필요한 할당량을 예측하고 계획하세요. 할당량 요구사항을 계획하면 나중에 리소스 소비가 예기치 않게 제한되는 것을 방지할 수 있습니다.

다음 섹션에서는 할당량을 계획할 때 고려해야 할 사항을 설명합니다.

모든 데이터 스토어 및 클라이언트의 총 사용량 예측

모든 Cloud Healthcare API 데이터 스토어의 총 사용량을 이해하고 Google Cloud 프로젝트에 요청을 수행하는 모든 클라이언트의 총 사용량을 이해해야 합니다.

  • 일부 Google Cloud 프로젝트는 여러 Cloud Healthcare API 사용 사례를 구현합니다. 예를 들어 Google Cloud 프로젝트는 여러 유형의 데이터에 여러 Cloud Healthcare API 데이터 세트와 데이터 스토어를 사용하여 총 할당량 사용량을 늘릴 수 있습니다.
  • 할당량은 Google Cloud 프로젝트 및 리전 단위로 적용됩니다. 여러 리전에서 필요한 할당량을 정확하게 측정했는지 확인하세요. Google Cloud 프로젝트가 여러 개이면 프로젝트 간에 더욱 정확한 측정값이 필요할 수 있습니다. 리전별 할당량 계획에 대한 자세한 내용은 리전별 사용량 예상을 참조하세요.
  • Cloud Healthcare API는 클라이언트, 데이터 세트, 데이터 스토어 간에 할당량을 부하 분산하지 않습니다. 클라이언트는 가장 중요한 트래픽에 429 RESOURCE_EXHAUSTED 오류가 발생하지 않도록 우선순위 스키마를 구현할지 여부를 결정해야 합니다.

리전별 사용량 예상

Cloud Healthcare API는 Google Cloud 프로젝트 및 리전 단위로 할당량을 측정합니다. 할당량은 일반적으로 분 단위로 측정되므로 초당 요청 수가 급증하면 분 단위로 분산됩니다.

Google Cloud 프로젝트에서 여러 리전을 사용하는 경우 리전별 할당량을 설정할 수 있습니다.

Cloud Healthcare API 데이터 세트가 us 멀티 리전 위치에 있고 추가 할당량을 요청하려는 경우, 할당량이 '미국 메타 리전'용이라는 것을 할당량 요청에 명시하세요. us 멀티 리전 위치는 다음 하위 리전으로 구성됩니다.

  • us-central1
  • us-east1
  • us-west1

us- 하위 리전의 할당량을 사용하는 Cloud Healthcare API 트래픽이 이미 있는 경우 us 멀티 리전의 할당량 상향 요청을 수행할 때 해당 하위 리전의 기존 트래픽을 고려해야 합니다. 예를 들어 us-central1us에 데이터 세트가 있고 us에 할당량 증가를 요청하면 요청에 us-central1에 데이터 세트가 있음을 지정하세요.

소량의 트랜잭션을 지속적으로 선호

다음 시나리오에서는 트랜잭션 간에 더 긴 간격을 두고 대용량 트랜잭션을 전송하는 대신 일관된 방식으로 소량의 트래픽을 전송하는 것이 중요한 이유를 설명합니다.

트래픽 볼륨request payload * time = traffic volume 수식을 사용하여 계산됩니다. 대용량 트랜잭션은 큰 페이로드가 포함된 짧은 간격으로 Cloud Healthcare API에 대한 하나 이상의 요청입니다. 페이로드 크기에 관계없이 짧은 간격으로 전송된 요청이 많으면 일련의 요청이 대용량으로 간주될 수도 있습니다.

클라이언트가 대량의 트랜잭션을 수집하여 Cloud Healthcare API에 5분 간격으로 버스트를 전송한다고 가정해 보겠습니다. 다음과 같은 결과가 발생합니다.

  1. 최초 트래픽 버스트는 모든 할당량이 소진될 때까지 처음 1분(분 단위로 이월됨)에 할당량을 사용합니다.
  2. 나머지 버스트 트래픽은 429 RESOURCE_EXHAUSTED 오류를 수신합니다. 구성된 경우 영향을 받는 모든 요청에 지수 백오프가 발생합니다.
  3. 초기 지수 백오프가 발생한 요청의 일부 비율은 1분 후에 다시 시도되도록 다시 예약됩니다. 일부 요청은 1분에 여러 번 시도된 후 1분에 다시 시도됩니다.
  4. 요청 볼륨이 충분히 높으면 재시도된 요청에 429 RESOURCE_EXHAUSTED 오류와 지수 백오프가 다시 발생할 수 있습니다. 특정 경우에는 트래픽 버스트가 서로 다른 시간에 지수 백오프가 발생할 수 있으며 향후 트래픽 전송 시도가 수분 내에 수렴할 수 있습니다.
  5. 요청 볼륨이 여전히 높은 경우 다음 트래픽 버스트가 시작될 때 일부 트래픽이 재시도됩니다. 기존 요청의 백로그에 트래픽이 더 추가되기 때문에 문제가 악화됩니다. 애플리케이션에서 요청의 백로그를 유지하고 이를 Cloud Healthcare API에 일관적으로 전송하는 데 어려움이 있을 수 있습니다.

이 시나리오에서는 분당 기준으로 트래픽 볼륨을 확인하는 것의 중요성을 보여줍니다. 트래픽 정량 및 백오프를 구현하여 네트워크 정체를 방지하고 애플리케이션에 재시도가 필요한 많은 오류가 발생하지 않게 하세요.

DICOM 및 FHIR 할당량 검토

FHIR과 DICOM 저장소 및 작업과 관련된 Cloud Healthcare API 할당량을 보려면 할당량 한도를 참조하세요.

할당량 관리 리소스

할당량 계획 및 관리에 대한 자세한 내용은 용량 및 할당량 관리를 참조하세요.