Como trabalhar com cotas

O Google Cloud aplica cotas ao uso de recursos para proprietários do projeto. Essas cotas definem um limite absoluto sobre a quantidade de um determinado recurso do Google Cloud que seu projeto poderá usar. Há dois tipos de uso de recursos que limitamos com as cotas:

  • Cota de taxa, como solicitações de API por dia. Ela é redefinida após um período especificado, como um minuto ou um dia.
  • Cota de alocação, como o número de máquinas virtuais ou balanceadores de carga usados pelo projeto. Ela não é redefinida com o tempo, mas precisa ser liberada explicitamente quando você não quiser mais usar o recurso, como ao excluir um cluster do GKE.

As cotas são aplicadas por diversos motivos. Por exemplo, elas protegem a comunidade de usuários do Google Cloud ao prevenir picos inesperados de uso. Elas também ajudam você no gerenciamento de recursos. Por exemplo, é possível definir seus próprios limites de uso de serviços dentro da cota fornecida pelo Google enquanto você desenvolve e testa seus aplicativos. Cada limite de cota é expresso em termos de um recurso contável específico, desde solicitações por dia a uma API até o número de balanceadores de carga usados por seu aplicativo.

Nem todos os projetos têm as mesmas cotas para os mesmos serviços. Por exemplo, se você estiver usando uma conta de avaliação gratuita para conhecer a plataforma, talvez tenha uma cota muito limitada. Cotas mais altas para alguns serviços estarão disponíveis somente depois que você ativar o faturamento do projeto. À medida que você usar mais o Google Cloud, as cotas também poderão aumentar proporcionalmente. Também é possível solicitar mais cotas caso seja necessário, assim como configurar o monitoramento e alertas no Cloud Monitoring para receber avisos sobre comportamento incomum no uso da cota ou quando ela estiver acabando.

Seus limites podem ser afetados por modificações na cota aplicadas pelo proprietário do serviço/projeto ou pelo administrador de cotas. Saiba mais sobre como os limites são calculados no Modelo de cota de serviço.

Nesta página, descrevemos como trabalhar com cotas nos seus projetos, inclusive como encontrar e modificar os limites atuais, como solicitar uma cota maior e monitorar o uso. Veja como visualizar outras métricas em Como monitorar o uso da API.

Como visualizar sua cota

Há duas formas principais de visualizar os limites de cota atuais no Console do Google Cloud:

  • Na página Cotas, que fornece uma lista de todos os limites e uso de cota do projeto.

  • No console, que fornece informações sobre as cotas de uma API específica, inclusive o uso de recursos ao longo do tempo.

Os limites de cotas também estão disponíveis de maneira programática por meio da API Service Usage.

Além disso, alguns serviços oferecem acesso de linha de comando às informações de uso de cotas e recursos. Por exemplo, o Compute Engine permite acessar informações de cota usando gcloud compute.

Veja como monitorar seu uso de cotas e definir alertas relacionados a elas na seção Como monitorar métricas.

Como visualizar todas as cotas do projeto

Para visualizar as cotas (uso e limites) de todos os recursos no projeto, siga estas etapas:

  1. Acesse a página Cotas do Console do Cloud em IAM e administrador.
  2. Na lista de projetos, selecione um projeto ou crie um novo. A página Cotas do projeto selecionado será exibida para listar um item de linha para cada tipo de cota disponível em cada serviço.
  3. É possível classificar e filtrar os resultados para encontrar as informações necessárias:

    • Use os filtros na parte superior da página para organizar a lista por Tipo de cota, Serviço, Métrica e/ou Local.
    • Por padrão, a lista é classificada para mostrar a cota mais usada primeiro, em termos de pico de uso nos últimos sete dias. Isso ajuda você a ver quais limites correm risco de serem excedidos. Para mostrar as menos utilizadas primeiro, selecione a seta Pico de uso em sete dias.

A lista também mostra seu Uso atual de uma determinada cota. Para cota de alocação, seu uso atual é simplesmente o quanto do recurso você está usando atualmente. Para cota de taxa por dia, é o uso até o momento atual. Para cota de taxa por minuto ou por 100 segundos, é o uso médio nas últimas 24 horas.

É possível descobrir mais sobre cotas de um serviço específico e o que elas significam na documentação correspondente. Por exemplo, a cota do Compute Engine é documentada em Cotas de recursos.

Cota específica de API

Para ver mais informações detalhadas sobre cotas para uma API específica, incluindo o uso ao longo de um período, acesse a página de cotas da API no Console do Cloud. Dependendo da API, esses limites podem incluir solicitações por dia, solicitações por minuto e solicitações por minuto por usuário. Algumas APIs definem limites muito baixos até você ativar o faturamento no seu projeto.

Para visualizar os limites atuais de uma API específica, siga estas etapas:

  1. Consulte a página Painel em Serviços e APIs no Console do Cloud.
  2. Na lista de projetos, selecione um projeto ou crie um novo.
  3. Clique no nome da API em que está interessado.
  4. Clique em Cotas. Os nomes de cota e os limites correspondentes da API escolhida são exibidos na página Cotas. Por padrão, esses limites são aqueles impostos pelo Google. Para especificar um limite menor, consulte Como restringir o uso. Se não houver um limite definido pelo Google para uma determinada cota, o limite será exibido como Ilimitado.

Nem todas as cotas aparecem na página da cota específica da API. Por exemplo, as solicitações para a API Compute Engine têm uma página de cota específica, mas isso não inclui o uso de recursos de computação do Compute Engine (cota de alocação). Além disso, ao usar o serviço em vários locais, a página da cota específica da API não mostrará os limites e o uso das cotas regional ou por zona. Consulte a página "Cotas" para conferir a lista completa da cota do projeto, que pode ser filtrada por local.

Como gerenciar sua cota usando o Console do Cloud

Dependendo do uso de recursos, talvez você queira aumentar ou diminuir os limites de cota do seu projeto. Nesta seção, descrevemos como alterar os limites de cota fornecidos.

Como solicitar uma cota maior

É possível solicitar uma alteração de cota para a maioria dos serviços faturáveis com um limite de cota. Faça o seguinte:

  1. Na página Cotas, use as caixas de seleção para escolher uma ou mais cotas que serão editadas e clique em EDITAR COTAS. O faturamento precisa estar ativado no projeto para que você possa selecionar as caixas de seleção.
  2. No painel Editar cotas à direita, preencha o formulário com seu Nome, E-mail e Telefone, em seguida, clique em Próxima.
  3. No painel Editar cotas, selecione um serviço para expandir a visualização e edite as cotas dele de acordo com o limite solicitado. Clique em Concluído.
  4. Repita o procedimento para editar as cotas de cada um dos serviços selecionados.
    • Um serviço com um ícone de alerta (error) ainda não foi editado ou tem um campo não preenchido.
    • Para adicionar cotas para edição, selecione as cotas na lista da esquerda.
    • Para remover um serviço do painel Editar cotas, clique no ícone de exclusão (delete).
  5. Quando terminar de editar as cotas, clique em Enviar solicitação.

As solicitações de cota do Google Cloud geralmente são processadas de rapidamente em até dois dias úteis. O suporte do Google Cloud enviará um e-mail para confirmar sua solicitação. Se você precisar de mais ajuda, responda a este e-mail. Observe que grandes aumentos de cotas podem demorar mais tempo para serem aprovados.

Como limitar o uso

Talvez convenha limitar o uso de um recurso específico definindo seus próprios limites de cota. Por exemplo, para evitar a cobrança pelo uso além dos limites de cortesia, defina limites de solicitações diárias. A maneira mais simples de limitar a cota é editar os limites na página de cota específica da API.

  1. Acesse a página de cotas do Console do Cloud referente à API que você quer limitar.
  2. Na linha da cota que você quer alterar, clique no ícone de edição (edit) e insira a cota total da sua preferência, até o limite especificado pelo Google.
  3. Clique em Salvar.

Se você quiser definir um limite superior ao máximo fornecido, ou limitar uma cota que não aparece nesta página, será necessário editar seus limites. Para fazer isso, siga o processo descrito em Como solicitar uma cota maior.

Como gerenciar sua cota usando a API Service Usage

É possível usar as APIs Service Usage para limitar o uso de cotas e receber os limites atuais para os serviços e as APIs do Google Cloud que são gerenciadas pelo Service Usage. Para saber mais sobre esse assunto, veja estes itens:

Não é possível usar a API Service Usage para solicitar uma cota maior. Para fazer isso, é preciso usar o Console do Cloud.

Como monitorar e configurar alertas para as métricas de cota

Além de exibir informações básicas sobre cotas no Console do Cloud, o Google Cloud permite monitorar o uso de cotas, limites e erros mais profundamente com a IU e a API Cloud Monitoring, que tem métricas exibidas no Metrics Explorer. Com elas, é possível criar painéis e alertas personalizados para monitorar o uso da cota ao longo do tempo e receber alertas quando, por exemplo, o limite de uma cota estiver perto de ser alcançado.

O Cloud Monitoring é compatível com várias métricas, que podem ser combinadas com filtros e agregações para conseguir novos insights sobre o uso da cota. Por exemplo, é possível combinar uma métrica de contagem de uso da cota de alocação com um filtro quota_metric em nomes de Cloud TPUs.

Para visualizar as métricas de um recurso monitorado usando o Metrics Explorer, siga estas instruções:

  1. No Console do Google Cloud, acesse o Monitoring ou use o botão:
    Acessar o Monitoring.
  2. No painel de navegação do Monitoring, clique em Metrics Explorer.
  3. Verifique se Métricas é a guia selecionada.
  4. Clique na caixa Encontrar tipo de recurso e métrica e, em seguida, insira ou selecione o nome do recurso e da métrica no menu. Use as seguintes informações para preencher os campos da caixa de texto:
    1. Em Resource, selecione ou informe a Consumer Quota.
    2. Em Metric, selecione ou informe a cota de monitoramento a ser alocada em Allocation quota usage. Selecione ou informe o Rate quota usage para monitorar a cota.
  5. Use os menus Filtrar, Agrupar por e Agregação para modificar como os dados são exibidos. Por exemplo, é possível agrupar por rótulos de recurso ou de métrica. Para mais informações, consulte o tópico Outras configurações da página "Como selecionar métricas".

Depois de encontrar as informações de uso de cota que você queria, use o Cloud Monitoring para criar painéis personalizados e alertas que ajudarão você a continuar monitorando para ter um aplicativo robusto. Da mesma forma, para ver os limites de cota ou os erros por cota excedida, primeiro selecione Consumer Quota como o tipo de recurso e, em seguida, selecione Quota limit ou Quota exceeded error. Veja como fazer isso nas seguintes páginas:

Para ver referências detalhadas de métricas de cotas, consulte a documentação do Cloud Monitoring.

Erros de cota

Caso seu projeto exceda uma determinada cota ao usar um serviço, a plataforma retornará um erro.

Em geral, o Google Cloud retornará um código de erro HTTP 429 se você estiver utilizando HTTP/REST para acessar o serviço, ou ResourceExhausted se estiver usando gRPC (em inglês). Como esse erro aparece para você depende do serviço.

Se você estiver usando o Cloud Monitoring, poderá identificar a cota associada ao erro e, assim, criar alertas personalizados que serão enviados quando você receber um erro de cota, conforme descrito em Como monitorar métricas.