Práticas recomendadas para o gerenciamento de cotas

Esta página descreve as práticas recomendadas para gerenciar a cota da API Cloud Healthcare. Use esta página se o projeto do Google Cloud tiver ou possa ter uma grande quantidade de tráfego e você precisar de mais cota do que a API Cloud Healthcare oferece por padrão.

Cotas padrão da API Cloud Healthcare

As cotas padrão da API Cloud Healthcare não foram projetadas para todos os casos de uso, principalmente se o projeto do Google Cloud tiver uma grande quantidade de tráfego. A API Cloud Healthcare não aumenta a cota automaticamente. Você precisa planejar e monitorar o uso da cota.

Práticas recomendadas para monitorar e conferir a cota

Há vários métodos para verificar o uso da cota. Ao estimar e conferir a cota da API Cloud Healthcare, recomendamos o modelo de cota de serviço. O modelo permite avaliar com precisão a cota disponível com base nos seguintes critérios:

  • Se uma modificação de administrador está presente. Um principal que recebeu o papel de Administrador de cota em uma organização pode aplicar uma substituição de administrador à cota em projetos do Google Cloud na organização. Uma substituição de administrador substitui os limites padrão e as substituições de produtor.
  • Se uma modificação do produtor está presente. Um proprietário de serviço concede uma substituição de produtor a um consumidor de um serviço. O Google Cloud é o proprietário do serviço da API Cloud Healthcare. Qualquer substituição de cota oferecida pelo Google Cloud é uma substituição do produtor.

  • Indica se uma substituição do consumidor está presente. Quem faz solicitações para a API Cloud Healthcare é um consumidor do serviço da API Cloud Healthcare. É possível aplicar substituições do consumidor em várias situações, como limitar cotas no projeto do Google Cloud como uma medida de controle de custos para evitar que o orçamento seja excedido.

Se você tiver alguma dessas substituições em vigor, calcule seu limite de cota de consumidor para ter uma avaliação precisa da cota disponível.

Práticas recomendadas para solicitar cota extra

O Google Cloud tem procedimentos para solicitar uma cota maior. Para saber como as solicitações de aumento de cota são processadas, consulte Sobre as solicitações de aumento de cota.

Antes de solicitar cota adicional, verifique se você implementou as seguintes ações:

Essas implementações podem reduzir a quantidade de cota necessária pelos seguintes motivos:

  • Ambas as implementações distribuem os picos de carga por várias horas ou minutos, em vez de segundos.
  • As duas implementações usam a cota de forma eficiente em um período de 24 horas. Se as solicitações que excedem significativamente a cota padrão forem consistentes em um período de 24 horas, pools de recursos maiores poderão ser alocados para o serviço da API Cloud Healthcare. A alocação adicional de recursos é feita apenas por solicitação e é determinada caso a caso.
  • O uso consistente de recursos facilita a compreensão dos requisitos de cota do Google Cloud e a disponibilização da cota necessária.

Para gerenciar sua capacidade e cota de maneira eficaz, você precisa conhecer os requisitos de capacidade da sua organização. Se você estiver planejando seus requisitos de capacidade e achar que vai precisar de um grande aumento de cota quando o projeto do Google Cloud estiver em produção, solicite um aumento ao atendimento ao cliente do Google Cloud. O Atendimento ao cliente pode ajudar você a alocar e aumentar a cota durante as fases de teste e lançamento do seu projeto do Google Cloud.

Você não precisa ter um serviço pago de atendimento ao cliente para solicitar um aumento de cota. Algumas solicitações de aumento de cota são concluídas em dois a três dias úteis, mas recomendamos que você planeje um período maior. Se o aumento de cota for grande, pode levar até 10 dias úteis para que o pedido seja concluído. Parte do seu planejamento precisa envolver a alocação de tempo para responder ao atendimento ao cliente e resolver dúvidas ou problemas em aberto sobre a solicitação. Se você garantir que seu pedido inicial de aumento de cota seja suficientemente detalhado, poderá reduzir o tempo gasto aguardando a solicitação.

Práticas recomendadas para prever as necessidades de cota

Antes de colocar seu projeto do Google Cloud em produção, antecipe e planeje a quantidade de cota necessária. Planejar os requisitos de cota evita a limitação inesperada do consumo de recursos mais tarde.

As seções a seguir explicam o que considerar ao planejar a cota.

Antecipe o uso total de todos os repositórios de dados e clientes

Entenda seu uso total em todas as armazenagens de dados da API Cloud Healthcare e o uso total de todos os clientes que fazem solicitações para seu projeto do Google Cloud.

  • Alguns projetos do Google Cloud implementam vários casos de uso da API Cloud Healthcare. Por exemplo, seu projeto do Google Cloud pode usar vários conjuntos de dados e armazenamentos de dados da API Cloud Healthcare para diferentes tipos de dados, aumentando o uso total da cota.
  • As cotas são aplicadas por projeto do Google Cloud e por região. Confira se você tem medições precisas da cota necessária em várias regiões. Se você tiver vários projetos do Google Cloud, talvez precise de medições mais precisas em todos eles. Para mais informações sobre como planejar a cota por região, consulte Antecipar o uso por região.
  • A API Cloud Healthcare não carrega a cota de balanceamento entre clientes, conjuntos de dados ou armazenamentos de dados. O cliente precisa determinar se vai implementar um esquema de priorização para garantir que o tráfego mais crítico não encontre erros 429 RESOURCE_EXHAUSTED.

Antecipar o uso por região

A API Cloud Healthcare mede as cotas por projeto do Google Cloud e por região. As cotas geralmente são medidas por minuto, o que permite que pequenos picos de solicitações por segundo sejam equilibrados em uma escala por minuto.

Se o projeto do Google Cloud usar várias regiões, você poderá definir cotas por região.

Se o conjunto de dados da API Cloud Healthcare estiver no local multirregional us e você quiser solicitar uma cota extra, especifique na solicitação de cota que ela é para a "meta-região dos EUA". O local multirregional us consiste nas seguintes subregiões:

  • us-central1
  • us-east1
  • us-west1

Se você já tem tráfego da API Cloud Healthcare usando cota em qualquer uma das subregiões us-, leve em consideração o tráfego atual nessas subregiões ao fazer uma solicitação de aumento de cota para a região múltipla us. Por exemplo, se você tiver conjuntos de dados em us-central1 e us, e solicitar um aumento de cota em us, especifique na solicitação que você tem conjuntos de dados em us-central1.

Favoreça transações de baixo volume de forma consistente

O cenário a seguir explica a importância de enviar quantidades menores de tráfego de forma consistente em vez de enviar transações de alto volume com um intervalo maior entre elas.

O volume de tráfego é calculado usando a fórmula request payload * time = traffic volume. Uma transação de grande volume é uma ou mais solicitações para a API Cloud Healthcare em um curto intervalo que contém um payload grande. Uma série de solicitações também pode ser considerada de alto volume se muitas delas forem enviadas em um curto intervalo, independentemente do tamanho do payload.

Suponha que um cliente colete transações de alto volume e as envie para a API Cloud Healthcare em um intervalo de cinco minutos. O seguinte ocorre:

  1. O pico inicial de tráfego consome a cota no primeiro minuto (dependendo do retorno de minutos) até que toda a cota seja esgotada.
  2. Qualquer tráfego de pico restante recebe erros 429 RESOURCE_EXHAUSTED. Se configurado, todas as solicitações afetadas encontram uma espera exponencial.
  3. Uma porcentagem das solicitações que encontraram a espera exponencial inicial é reprogramada para ser tentada novamente no minuto seguinte. Algumas solicitações são tentadas várias vezes em um único minuto e, em seguida, são tentadas novamente no minuto seguinte.
  4. Se o volume de solicitações for alto o suficiente, as solicitações repetidas poderão encontrar erros 429 RESOURCE_EXHAUSTED e espera exponencial novamente. Certas explosões de tráfego podem encontrar uma espera exponencial em momentos diferentes, e as tentativas de enviar o tráfego novamente podem convergir no mesmo minuto no futuro.
  5. Se o volume de solicitações ainda for alto, parte do tráfego será tentado novamente quando a próxima explosão de tráfego começar. O problema é agravado porque mais tráfego é adicionado ao backlog de solicitações. Seu aplicativo pode ter dificuldade para manter o backlog de solicitações e enviá-las de forma consistente à API Cloud Healthcare.

Esse cenário mostra a importância de saber o volume do seu tráfego por minuto. Implemente o volume de tráfego e as esperas para evitar o congestionamento da rede e garantir que o aplicativo não encontre muitas falhas que exijam novas tentativas.

Analisar as cotas de DICOM e FHIR

Para conferir as cotas da API Cloud Healthcare associadas a armazenamentos e operações do FHIR e do DICOM, consulte Limites de cota.