이 페이지에서는 Cloud Healthcare API 할당량 관리에 대한 권장사항을 설명합니다. Google Cloud 프로젝트에 대규모 트래픽이 포함되어 있거나 포함될 수 있고 Cloud Healthcare API로 기본 제공되는 것보다 많은 할당량이 필요하면 이 페이지의 안내를 따르세요.
Cloud Healthcare API 기본 할당량
기본 Cloud Healthcare API 할당량은 모든 사용 사례에 맞게 설계된 것은 아니며, 특히 Google Cloud 프로젝트에 많은 트래픽이 있는 경우에는 잘 맞지 않습니다. Cloud Healthcare API는 할당량을 자동으로 늘리지 않습니다. 사용자가 할당량 사용량을 계획하고 모니터링해야 합니다.
할당량 모니터링 및 보기 권장사항
할당량 사용량을 확인하는 방법에는 여러 가지가 있습니다. Cloud Healthcare API의 할당량을 추정하고 확인할 때는 서비스 할당량 모델을 사용하는 것이 좋습니다. 이 모델을 사용하면 다음 기준에 따라 사용 가능한 할당량을 정확하게 평가할 수 있습니다.
- 관리자 재정의가 존재하는지 여부. 조직의 할당량 관리자 역할이 부여된 주 구성원이 조직 내 Google Cloud 프로젝트의 할당량에 관리자 재정의를 적용할 수 있습니다. 관리자 재정의는 기본 한도 및 제작자 재정의를 대체합니다.
제작자 재정의가 있는지 여부. 서비스 소유자가 서비스 소비자에게 제작자 재정의를 부여합니다. Google Cloud는 Cloud Healthcare API 서비스의 서비스 소유자입니다. Google Cloud에서 제공하는 모든 할당량 재정의는 제작자 재정의입니다.
소비자 재정의가 있는지 여부. Cloud Healthcare API에 요청을 하는 사용자는 Cloud Healthcare API 서비스의 소비자입니다. 예산 초과를 방지하기 위한 비용 관리 수단으로 Google Cloud 프로젝트의 할당량을 제한하는 등 다양한 상황에 소비자 재정의를 적용할 수 있습니다.
이러한 재정의가 적용된 경우 소비자 할당량 한도를 계산하여 사용 가능한 할당량을 정확하게 평가할 수 있습니다.
추가 할당량 요청 권장사항
Google Cloud에는 할당량 상향 요청 절차가 있습니다. 할당량 상향 요청이 처리되는 방식을 알아보려면 할당량 상향 요청 정보를 참고하세요.
추가 할당량을 요청하기 전에 다음 두 가지를 모두 구현했는지 확인하세요.
이러한 구현은 다음과 같은 이유로 필요한 할당량을 줄일 수 있습니다.
- 두 구현 모두 부하 급증을 초가 아닌 몇 시간 또는 몇 분으로 분산합니다.
- 두 구현 모두 24시간 동안 할당량을 효율적으로 사용합니다. 기본 할당량을 훨씬 초과하는 요청이 24시간 동안 일관되게 발생하면 Cloud Healthcare API 서비스에 더 큰 리소스 풀이 할당될 수 있습니다. 리소스 추가 할당은 요청에 의해서만 이루어지며 케이스별로 결정됩니다.
- 일관된 리소스 사용량을 통해 Google Cloud에서 할당량 요구사항을 더 쉽게 파악하고 필요한 할당량을 제공할 수 있습니다.
용량과 할당량을 효과적으로 관리하려면 조직의 용량 요구사항을 알아야 합니다. 용량 요구사항을 계획하고 있으며 Google Cloud 프로젝트가 프로덕션 단계에 있을 때 할당량을 크게 늘려야 한다고 생각되면 Google Cloud 고객 관리에 상향 조정을 요청하세요. 고객 관리팀은 Google Cloud 프로젝트의 테스트 및 출시 단계에서 할당량을 할당하고 늘리는 데 도움을 줄 수 있습니다.
유료 고객 관리 서비스를 사용하지 않아도 할당량 상향을 요청할 수 있습니다. 일부 할당량 상향 조정 요청은 영업일 기준 2~3일 이내에 완료되지만 더 여유를 두고 계획하는 것이 좋습니다. 할당량이 크게 늘어나는 경우 할당량 상향 요청이 완료되는 데 영업일 기준 10일 이상 걸릴 수 있습니다. 계획의 일부로 고객 지원팀에 응답하여 요청과 관련된 질문이나 미해결 문제를 해결하는 데 시간을 할당해야 합니다. 초기 할당량 증가 요청을 충분히 상세하게 작성하면 요청이 처리될 때까지 기다리는 데 드는 시간을 줄일 수 있습니다.
할당량 요구사항 예측을 위한 권장사항
Google Cloud 프로젝트를 프로덕션으로 전환하기 전에 필요한 할당량을 예측하고 계획하세요. 할당량 요구사항을 계획하면 나중에 예상치 못한 리소스 소비 제한을 방지할 수 있습니다.
다음 섹션에서는 할당량을 계획할 때 고려해야 할 사항을 설명합니다.
모든 데이터 스토어 및 클라이언트의 총 사용량 예측
모든 Cloud Healthcare API 데이터 스토어의 총 사용량을 이해하고 Google Cloud 프로젝트에 요청을 수행하는 모든 클라이언트의 총 사용량을 이해해야 합니다.
- 일부 Google Cloud 프로젝트는 여러 Cloud Healthcare API 사용 사례를 구현합니다. 예를 들어 Google Cloud 프로젝트는 여러 유형의 데이터에 여러 Cloud Healthcare API 데이터 세트와 데이터 스토어를 사용하여 총 할당량 사용량을 늘릴 수 있습니다.
- 할당량은 Google Cloud 프로젝트 및 리전별로 적용됩니다. 여러 리전에서 필요한 할당량을 정확하게 측정했는지 확인하세요. Google Cloud 프로젝트가 여러 개인 경우 프로젝트 전반에서 더 정확한 측정이 필요할 수 있습니다. 리전별 할당량 계획에 관한 자세한 내용은 리전별 사용량 예상을 참고하세요.
- Cloud Healthcare API는 클라이언트, 데이터 세트, 데이터 스토어 간에 할당량을 부하 분산하지 않습니다. 클라이언트는 가장 중요한 트래픽에
429 RESOURCE_EXHAUSTED
오류가 발생하지 않도록 우선순위 스키마를 구현할지 여부를 결정해야 합니다.
리전별 사용량 예상
Cloud Healthcare API는 Google Cloud 프로젝트 및 리전별로 할당량을 측정합니다. 할당량은 일반적으로 분당으로 측정되므로 초당 요청이 소폭 급증해도 분당 기준으로 균형을 유지할 수 있습니다.
Google Cloud 프로젝트에서 여러 리전을 사용하는 경우 리전별 할당량을 설정할 수 있습니다.
Cloud Healthcare API 데이터 세트가 us
멀티 리전 위치에 있고 추가 할당량을 요청하려는 경우, 할당량이 '미국 메타 리전'용이라는 것을 할당량 요청에 명시하세요. us
멀티 리전 위치는 다음과 같은 하위 리전으로 구성됩니다.
us-central1
us-east1
us-west1
us-
하위 리전의 할당량을 사용하는 Cloud Healthcare API 트래픽이 이미 있는 경우 us
멀티 리전의 할당량 상향 요청을 수행할 때 해당 하위 리전의 기존 트래픽을 고려해야 합니다.
예를 들어 us-central1
및 us
에 데이터 세트가 있고 us
에 할당량 증가를 요청하면 요청에 us-central1
에 데이터 세트가 있음을 지정하세요.
일관적으로 낮은 볼륨의 트랜잭션 선호
다음 시나리오에서는 트랜잭션 간 간격이 긴 대량 트랜잭션을 전송하는 대신 일관되게 소량의 트래픽을 전송하는 것이 중요한 이유를 설명합니다.
트래픽 볼륨은 request payload * time = traffic volume
수식을 사용하여 계산됩니다.
대량 트랜잭션은 짧은 간격으로 Cloud Healthcare API에 요청을 하나 이상 보내고 대용량 페이로드를 포함하는 것입니다.
페이로드 크기와 관계없이 짧은 간격으로 전송되는 요청이 많은 경우 일련의 요청이 대량으로 간주될 수도 있습니다.
클라이언트가 대량의 트랜잭션을 수집하고 5분마다 일괄적으로 Cloud Healthcare API에 트랜잭션을 전송한다고 가정해 보겠습니다. 다음과 같은 일이 발생합니다.
- 최초 트래픽 버스트는 모든 할당량이 소진될 때까지 처음 1분(분 단위로 이월됨)에 할당량을 사용합니다.
- 남은 급증 트래픽에는
429 RESOURCE_EXHAUSTED
오류가 발생합니다. 구성된 경우 영향을 받는 모든 요청에 지수 백오프가 발생합니다. - 초기 지수 백오프가 발생한 요청의 일부 비율은 다음 분에 다시 시도되도록 일정이 변경됩니다. 일부 요청은 1분에 여러 번 시도된 후 다음 분에 다시 시도됩니다.
- 요청 수가 충분히 많으면 재시도된 요청에
429 RESOURCE_EXHAUSTED
오류와 지수 백오프가 다시 발생할 수 있습니다. 특정 트래픽 급증은 여러 번에 걸쳐 지수 백오프를 경험할 수 있으며, 트래픽을 다시 전송하려는 시도가 향후 동일한 분에 수렴할 수 있습니다. - 요청 수가 여전히 많으면 다음 트래픽 급증이 시작될 때 일부 트래픽이 다시 시도됩니다. 기존 요청의 백로그에 트래픽이 더 추가되기 때문에 문제가 악화됩니다. 애플리케이션에서 요청의 백로그를 유지하고 이를 Cloud Healthcare API에 일관적으로 전송하는 데 어려움이 있을 수 있습니다.
이 시나리오에서는 분당 기준으로 트래픽 볼륨을 확인하는 것의 중요성을 보여줍니다. 트래픽 정량 및 백오프를 구현하여 네트워크 정체를 방지하고 애플리케이션에 재시도가 필요한 많은 오류가 발생하지 않게 하세요.
DICOM 및 FHIR 할당량 검토
FHIR과 DICOM 저장소 및 작업과 관련된 Cloud Healthcare API 할당량을 보려면 할당량 한도를 참조하세요.