Práticas recomendadas de gerenciamento de cotas

Nesta página, descrevemos as práticas recomendadas para gerenciar a cota da API Cloud Healthcare. Use esta página se o projeto do Google Cloud tiver ou puder ter uma grande quantidade de tráfego e você precisar de mais cota do que a API Cloud Healthcare fornece por padrão.

Cotas padrão da API Cloud Healthcare

As cotas padrão da API Cloud Healthcare não foram projetadas para todos os casos de uso, principalmente se o projeto do Google Cloud tem uma grande quantidade de tráfego. A API Cloud Healthcare não aumenta a cota automaticamente. É preciso planejar e monitorar o uso da cota.

Práticas recomendadas para monitorar e visualizar cotas

Há vários métodos para consultar o uso da cota. Ao estimar e visualizar a cota da API Cloud Healthcare, recomendamos que você use o modelo de cota de serviço. O modelo permite que você avalie com precisão a cota disponível com base nos seguintes critérios:

  • Se uma substituição do administrador está presente. Um principal com o papel de administrador de cotas em uma organização pode aplicar uma modificação do administrador à cota em projetos do Google Cloud dentro da organização. Uma substituição do administrador substitui os limites padrão e as substituições do produtor.
  • Se uma modificação do produtor está presente. O proprietário de um serviço concede uma substituição de produtor a um consumidor de um serviço. O Google Cloud é o proprietário do serviço do serviço da API Cloud Healthcare. Qualquer substituição de cota oferecida pelo Google Cloud é uma modificação do produtor.

  • Se uma substituição do consumidor está presente. Alguém que faz solicitações à API Cloud Healthcare é um consumidor do serviço da API Cloud Healthcare. É possível aplicar substituições do consumidor para várias situações, como limitar cotas no projeto do Google Cloud como uma medida de controle de custos para evitar exceder o orçamento.

Se alguma dessas substituições estiver em vigor, calcule o limite de cota do consumidor para ter uma avaliação precisa da cota disponível.

Práticas recomendadas para solicitar cota adicional

O Google Cloud tem procedimentos para solicitar uma cota maior. Para saber como as solicitações de aumento de cota são processadas, consulte Sobre solicitações de aumento de cota.

Antes de solicitar uma cota extra, verifique se você implementou os seguintes itens:

Essas implementações podem reduzir a quantidade de cota necessária pelos seguintes motivos:

  • As duas implementações espalham picos de carga ao longo de várias horas ou minutos, em vez de segundos.
  • Ambas as implementações fazem uso eficiente da cota em um período de 24 horas. Se as solicitações que excederem significativamente a cota padrão forem consistentes em um período de 24 horas, será possível alocar pools maiores de recursos ao serviço da API Cloud Healthcare. A alocação extra de recursos é feita apenas por solicitação, e é determinada caso a caso.
  • O uso consistente de recursos simplifica o entendimento dos requisitos de cota e o fornecimento da cota necessária para o Google Cloud.

Para gerenciar a capacidade e a cota de maneira eficaz, você precisa conhecer os requisitos de capacidade da sua organização. Se você estiver planejando seus requisitos de capacidade e achar que precisará de um aumento grande na cota quando o projeto do Google Cloud estiver em produção, solicite um aumento ao Google Cloud Customer Care. O Customer Care pode ajudar você a alocar e aumentar a cota durante as fases de teste e lançamento do seu projeto do Google Cloud.

Você não precisa ter um serviço pago de atendimento ao cliente para solicitar um aumento de cota. Algumas solicitações de aumento de cota são concluídas em dois a três dias úteis, mas recomendamos que você planeje um período mais longo. Se o aumento de cota for grande, poderá levar 10 dias úteis ou mais para que a solicitação de aumento seja concluída. Parte do planejamento precisa envolver a alocação de tempo para responder ao Atendimento ao cliente e resolver dúvidas ou problemas em aberto sobre a solicitação. Se você garantir que a solicitação de aumento de cota inicial seja detalhada o suficiente, talvez seja possível reduzir o tempo gasto aguardando o atendimento da solicitação.

Práticas recomendadas para antecipar necessidades de cota

Antes que seu projeto do Google Cloud entre em produção, antecipe e planeje a cota necessária. Planejar os requisitos de cota impede a limitação inesperada do consumo de recursos posteriormente.

As seções a seguir explicam o que considerar ao planejar a cota.

Preveja o uso total para todos os repositórios de dados e clientes

Entenda seu uso total em todos os armazenamentos de dados da API Cloud Healthcare e entenda o uso total de todos os clientes que fazem solicitações ao seu projeto do Google Cloud.

  • Alguns projetos do Google Cloud implementam vários casos de uso da API Cloud Healthcare. Por exemplo, seu projeto do Google Cloud pode usar vários conjuntos de dados e repositórios de dados da API Cloud Healthcare para diferentes tipos de dados, aumentando assim o uso total da cota.
  • As cotas são aplicadas por projeto do Google Cloud e por região. Garanta medições precisas da cota necessária em várias regiões. Se você tiver vários projetos do Google Cloud, talvez precise de medições mais precisas em todos eles. Para mais informações sobre o planejamento de cotas por região, consulte Antecipar o uso por região.
  • A API Cloud Healthcare não faz o balanceamento de carga entre clientes, conjuntos de dados ou armazenamentos de dados. O cliente precisa determinar se um esquema de priorização precisa ser implementado para garantir que o tráfego mais crítico não encontre erros 429 RESOURCE_EXHAUSTED.

Prever o uso por região

A API Cloud Healthcare mede as cotas por projeto do Google Cloud e por região. As cotas geralmente são medidas por minuto, o que permite que pequenos picos de solicitações por segundo se equilibrem em uma escala por minuto.

Se o projeto do Google Cloud usa várias regiões, é possível definir cotas por região.

Se o conjunto de dados da API Cloud Healthcare estiver no local multirregional us e você quiser solicitar cota adicional, informe na solicitação de cota que a cota é para a "região meta dos EUA". O local multirregional us consiste nas seguintes sub-regiões:

  • us-central1
  • us-east1
  • us-west1

Se você já tiver tráfego da API Cloud Healthcare usando cota em qualquer uma das sub-regiões us-, considere o tráfego atual nessas sub-regiões ao fazer uma solicitação de aumento de cota para a multirregião us. Por exemplo, se você tiver conjuntos de dados em us-central1 e us e solicitar um aumento de cota em us, especifique na solicitação que você tem conjuntos de dados em us-central1.

Favorecer transações de baixo volume de forma consistente

O cenário a seguir explica a importância de enviar quantidades menores de tráfego de maneira consistente em vez de enviar transações de alto volume com um intervalo mais longo entre as transações.

O volume de tráfego é calculado usando a fórmula request payload * time = traffic volume. Uma transação de alto volume consiste em uma ou mais solicitações para a API Cloud Healthcare em um curto intervalo que contêm um payload grande. Uma série de solicitações também pode ser considerada de alto volume quando há muitas solicitações enviadas em um curto intervalo, independentemente do tamanho do payload.

Suponha que um cliente colete transações de alto volume e as envie para a API Cloud Healthcare em um burst a cada cinco minutos. O seguinte ocorre:

  1. O burst inicial de tráfego consome a cota no primeiro minuto (depende de acúmulos de minutos) até que toda a cota seja esgotada.
  2. Qualquer tráfego de burst restante recebe erros 429 RESOURCE_EXHAUSTED. Se configuradas, todas as solicitações afetadas encontrarão espera exponencial.
  3. Parte das solicitações que encontraram a espera exponencial inicial é reprogramada para nova tentativa no próximo minuto. Algumas solicitações são tentadas várias vezes em um único minuto, e as tentativas são feitas no minuto seguinte.
  4. Se o volume de solicitações for alto o suficiente, as solicitações repetidas poderão encontrar erros 429 RESOURCE_EXHAUSTED e espera exponencial novamente. Alguns bursts de tráfego podem encontrar espera exponencial em momentos diferentes, e as tentativas de enviar tráfego novamente podem convergir no mesmo minuto no futuro.
  5. Se o volume de solicitações ainda estiver alto, algum tráfego será repetido quando o próximo burst de tráfego começar. O problema é agravado porque mais tráfego é adicionado ao backlog de solicitações existente. Seu aplicativo pode ter dificuldade para manter o backlog de solicitações e enviá-lo de maneira consistente à API Cloud Healthcare.

Este cenário mostra a importância de conhecer o volume do tráfego por minuto. Implemente o volume de tráfego e as esperas para evitar o congestionamento da rede e garantir que o aplicativo não encontre muitas falhas que exijam novas tentativas.

Revisar cotas DICOM e FHIR

Para visualizar as cotas da API Cloud Healthcare associadas a armazenamentos e operações FHIR e DICOM, consulte Limites de cota.

Recursos de gerenciamento de cotas

Para mais informações sobre como planejar e gerenciar cotas, consulte Gerenciar capacidade e cota.