Como trabalhar com cotas

O Google Cloud aplica cotas ao uso de recursos para proprietários do projeto. Estas cotas definem um limite absoluto sobre a quantidade de um determinado recurso do Google Cloud que seu projeto poderá usar. Há dois tipos de uso de recursos que limitamos com as cotas:

  • Cota de taxa, como solicitações de API por dia. Ela é redefinida após um período especificado, como um minuto ou um dia.
  • Cota de alocação, como o número de máquinas virtuais ou balanceadores de carga usados pelo projeto. Ela não é redefinida com o tempo, mas precisa ser liberada explicitamente quando você não quiser mais usar o recurso, como ao excluir um cluster do GKE.

As cotas são aplicadas por diversos motivos. Por exemplo, elas protegem a comunidade de usuários do Google Cloud ao prevenir picos inesperados de uso. Elas também ajudam você no gerenciamento de recursos. Por exemplo, é possível definir seus próprios limites de uso de serviços dentro da cota fornecida pelo Google enquanto você desenvolve e testa seus aplicativos. Cada limite de cota é expresso em termos de um recurso contável específico, de solicitações por dia a uma API até o número de balanceadores de carga usados por seu aplicativo.

Nem todos os projetos têm as mesmas cotas para os mesmos serviços. Por exemplo, se você estiver usando uma conta de teste gratuito para conhecer a plataforma, talvez tenha uma cota muito limitada. Cotas mais altas para alguns serviços estarão disponíveis somente depois que você ativar o faturamento do projeto. À medida que você usa mais o Google Cloud, as cotas também podem aumentar proporcionalmente. Também é possível solicitar mais cotas caso seja necessário, assim como configurar o monitoramento e alertas no Cloud Monitoring para receber avisos sobre comportamento incomum no uso da cota ou quando ela estiver acabando.

Seus limites podem ser afetados por modificações na cota aplicadas pelo proprietário do serviço/projeto ou pelo administrador de cotas. Saiba mais sobre como os limites são calculados no Modelo de cota de serviço.

Nesta página, descrevemos como trabalhar com cotas nos seus projetos, inclusive como encontrar e modificar os limites atuais, como solicitar uma cota maior e monitorar o uso. Veja como visualizar outras métricas em Como monitorar o uso da API.

Como visualizar sua cota

Existem duas formas principais de visualizar seus limites de cota atuais no Console do Google Cloud:

  • Na página Cotas, que fornece uma lista de todos os limites e uso de cota do projeto

  • No console, que fornece informações de cotas sobre uma API específica, inclusive o uso de recursos ao longo do tempo.

Os limites de cotas também estão disponíveis de maneira programática por meio da API Service Usage.

Além disso, alguns serviços oferecem acesso de linha de comando às informações de uso de cota e recursos. Por exemplo, o Compute Engine permite acessar informações de cota usando gcloud compute.

Veja como monitorar seu uso de cotas e definir alertas relacionados a elas na seção Como monitorar métricas.

Como visualizar todas as cotas do projeto

Para visualizar as cotas (uso e limites) de todos os recursos no projeto, siga estas etapas:

  1. Acesse a página Cotas do Console do Cloud em IAM e administrador.
  2. Na lista de projetos, selecione um projeto ou crie um novo. A página Cotas do projeto selecionado será exibida para listar um item de linha para cada tipo de cota disponível em cada serviço.
  3. É possível classificar e filtrar os resultados para encontrar as informações necessárias:

    • Use os filtros na parte superior da página para ajustar a lista por Tipo de cota, Serviço, Métrica e/ou Local.
    • Por padrão, a lista é classificada para mostrar a cota mais usada primeiro, em termos de pico de uso nos últimos sete dias. Isso ajuda a ver quais limites correm risco de serem excedidos. Para mostrar as menos utilizadas primeiro, selecione a seta Pico de uso em sete dias.

A lista também mostra seu Uso atual de uma determinada cota. Para cota de alocação, seu uso atual é simplesmente o quanto do recurso você está usando atualmente. Para cota de taxa por dia, é o uso até o momento atual. Para cota de taxa por minuto ou por 100 segundos, é o uso médio nas últimas 24 horas.

É possível descobrir mais sobre cotas para um serviço específico e o que elas significam na documentação delas. Por exemplo, a cota do Compute Engine é documentada em Cotas de recursos.

Cota específica da API

Para ver mais informações detalhadas sobre cotas para uma API específica, incluindo o uso ao longo de um período, acesse a página de cotas da API no Console do Cloud. Dependendo da API, estes limites podem incluir solicitações por dia, solicitações por minuto e solicitações por minuto por usuário. Algumas APIs definem limites muito baixos até você ativar o faturamento no seu projeto.

Para visualizar os limites atuais de uma API específica, siga estas etapas:

  1. Consulte a página Painel em Serviços e APIs no Console do Cloud.
  2. Na lista de projetos, selecione um projeto ou crie um novo.
  3. Clique no nome da API.
  4. Clique em Cotas. Os nomes de cota e os limites correspondentes da API escolhida são exibidos na página Cotas. Por padrão, esses limites são aqueles impostos pelo Google. Para especificar um limite menor, consulte Como limitar o uso. Se não houver um limite definido pelo Google para uma determinada cota, o limite será exibido como Ilimitado.

Nem todas as cotas aparecem na página da cota específica da API. Por exemplo, as solicitações para a API Compute Engine têm uma página de cota específica, mas isso não inclui o uso de recursos de computação do Compute Engine (cota de alocação). Além disso, ao usar o serviço em vários locais, a página da cota específica da API não mostrará os limites e o uso das cotas regional ou por zona. Consulte a página Cotas para conferir a lista completa da cota do projeto, que pode ser filtrada por local.

Como gerenciar sua cota usando o Console do Cloud

Dependendo do uso de recursos, talvez você queira aumentar ou diminuir os limites de cota do seu projeto. Nesta seção, descrevemos como alterar os limites de cota fornecidos.

Como solicitar uma cota maior

É possível solicitar uma alteração de cota para a maioria dos serviços faturáveis com um limite de cota. Faça o seguinte:

  1. Na página Cotas, use as caixas de seleção para escolher uma ou mais cotas que serão editadas e clique em EDITAR COTAS. O faturamento precisa estar ativado no projeto para que você possa marcar as caixas de seleção.
  2. No painel Editar cotas, à direita, preencha o formulário com seu Nome, E-mail e Telefone e clique em Avançar.
  3. No painel Editar cotas, selecione o serviço para expandir a visualização e edite as cotas de acordo com o limite solicitado. Clique em Concluído.
  4. Repita para editar as cotas de cada um dos serviços selecionados.
    • Um serviço com um ícone de alerta () ainda não foi editado ou tem um campo não preenchido.
    • Para adicionar cotas para edição, selecione as cotas na lista da esquerda.
    • É possível remover um serviço do painel Editar cotas, clicando no ícone de exclusão ().
  5. Quando terminar de editar as cotas, clique em Enviar solicitação.

As solicitações de cota do Google Cloud geralmente são processadas rapidamente em até dois dias úteis. O suporte do Google Cloud enviará um e-mail para confirmar sua solicitação. Se precisar de mais ajuda, responda a esse e-mail. Observe que grandes aumentos de cotas podem demorar mais tempo para serem aprovados.

Como limitar o uso

Talvez você queira limitar o uso de um recurso específico definindo seus próprios limites de cota. Por exemplo, para evitar a cobrança pelo uso além dos limites de cortesia, defina limites de solicitações diárias. A maneira mais simples de limitar a cota é editar os limites na página de cota específica da API.

  1. Acesse a página de cotas do Console do Cloud referente à API que você quer limitar.
  2. Na linha da cota que você quer alterar, clique no ícone de edição () e insira a cota total da sua preferência, até o limite especificado pelo Google.
  3. Clique em Salvar.

Se você quiser definir um limite superior ao máximo fornecido, ou limitar uma cota que não aparece nesta página, será necessário editar seus limites. Para fazer isso, siga o processo descrito em Como solicitar uma cota maior.

Como gerenciar sua cota usando a API Service Usage

É possível usar as APIs Service Usage para limitar o uso de cotas e receber os limites atuais para os serviços e as APIs do Google Cloud que são gerenciadas pelo Service Usage. Para saber mais sobre o assunto, veja estes itens:

Não é possível usar a API Service Usage para solicitar uma cota maior. Para fazer isso, é preciso usar o Console do Cloud.

Como monitorar e configurar alertas para as métricas de cota

Além de exibir informações básicas sobre cotas no Console do Cloud, o Google Cloud permite monitorar o uso de cotas, limites e erros mais profundamente com a IU e a API Cloud Monitoring, que tem métricas exibidas no Metrics Explorer. Com elas, é possível criar painéis e alertas personalizados para monitorar o uso da cota ao longo do tempo e receber alertas quando, por exemplo, o limite de uma cota estiver perto de ser alcançado.

O Cloud Monitoring é compatível com várias métricas, que podem ser combinadas com filtros e agregações para conseguir novos insights sobre o uso da cota. Por exemplo, é possível combinar uma métrica de contagem de uso da cota de alocação com um filtro quota_metric em nomes de Cloud TPUs.

Para visualizar as métricas de um recurso monitorado usando o Metrics Explorer, faça o seguinte:

  1. No Console do Google Cloud, acesse Monitoring ou use o botão
    Acessar Monitoring
  2. No painel de navegação do Monitoring, clique em Metrics Explorer.
  3. Verifique se Metric é a guia selecionada.
  4. Clique na caixa Find resource type and metric e, em seguida, insira ou selecione no menu o nome do recurso e da métrica. Use as informações a seguir para preencher os campos dessa caixa de texto:
    1. Em Resource, selecione ou informe a Consumer Quota.
    2. Em Metric, selecione ou informe a cota de monitoramento a ser alocada em Allocation quota usage. Selecione ou informe o Rate quota usage para monitorar a cota.
  5. Use os menus Filtro, Agrupar por e Agregador para modificar a exibição dos dados. Por exemplo, é possível agrupar por rótulos de recurso ou métrica. Para mais informações, consulte Como selecionar métricas.

Da mesma forma, para ver os limites de cota ou os erros por cota excedida, primeiro selecione Consumer Quota como o tipo de recurso e, em seguida, selecione Quota limit ou Quota exceeded error.

Depois de encontrar as informações de uso de cota, use o Cloud Monitoring para criar alertas e painéis personalizados que ajudarão você a continuar monitorando para ter um aplicativo robusto. Descubra como fazer isso nas seguintes páginas:

Para encontrar mais informações, incluindo exemplos de políticas de alertas de cotas específicas, consulte Como usar métricas de cota na documentação do Cloud Monitoring.

Veja uma referência detalhada para métricas de cota no Guia de referência do Cloud Monitoring.

Erros de cota

Caso seu projeto exceda uma determinada cota ao usar um serviço, a plataforma retornará um erro.

Em geral, o Google Cloud retornará um código de erro HTTP 429 se você estiver utilizando HTTP/REST para acessar o serviço, ou ResourceExhausted se estiver usando gRPC (em inglês). Como este erro aparece para você depende do serviço.

Se você estiver usando o Cloud Monitoring, poderá identificar a cota associada ao erro e, assim, criar alertas personalizados que serão enviados quando você receber um erro de cota, conforme descrito em Como monitorar métricas.