Como trabalhar com cotas

O Google Cloud aplica cotas ao uso de recursos para proprietários do projeto. Estas cotas definem um limite absoluto sobre a quantidade de um determinado recurso do Google Cloud que seu projeto poderá usar. As cotas se enquadram em duas categorias:

  • Cotas de taxa, como o número de solicitações de API por dia. Essa cota é redefinida após um intervalo de tempo específico do serviço, como um minuto ou um dia.
  • Cotas de alocação, como o número de máquinas virtuais ou balanceadores de carga usados pelo projeto em um determinado momento. Ela não é redefinida com o tempo, mas precisa ser liberada explicitamente quando você não quiser mais usar o recurso, como ao excluir um cluster do GKE.

Cada limite de cota representa um recurso contável específico, como solicitações de API por dia para o número de balanceadores de carga usados simultaneamente pelo aplicativo.

As cotas são aplicadas por diversos motivos:

  • Para proteger a comunidade de usuários do Google Cloud, impedindo picos de uso imprevistos.
  • Ajudar a gerenciar recursos. Por exemplo, é possível definir seus próprios limites de uso do serviço ao desenvolver e testar seus aplicativos.

Projetos diferentes podem ter cotas diferentes para os mesmos serviços. Por exemplo, se estiver usando uma conta de avaliação gratuita para explorar a plataforma, suas cotas serão mais limitadas. Ativar o faturamento para seu projeto aumenta as cotas da maioria dos serviços. Também é possível solicitar explicitamente mais cota para um serviço específico. As cotas também podem aumentar à medida que você usa o Google Cloud.

Os limites de cota no projeto podem ser afetados pelas modificações da cota aplicadas pelo proprietário do serviço, proprietário do projeto ou administrador da cota. Saiba mais sobre como os limites de cota são calculados no Modelo de cota de serviço.

É possível configurar o monitoramento e os alertas para rastrear o uso de cotas e alertar você caso ocorra uma violação de cota ou uso incomum.

Nesta página, descrevemos como trabalhar com cotas nos seus projetos, inclusive como encontrar e modificar os limites atuais, como solicitar uma cota maior e monitorar o uso. Veja como visualizar outras métricas em Como monitorar o uso da API.

Permissões

Você precisa das permissões do IAM a seguir para visualizar a cota do projeto no Console do Google Cloud ou acessá-la de maneira programática:

  • resourcemanager.projects.get
  • resourcemanager.folders.get, se você quiser ver a cota de uma pasta inteira.
  • resourcemanager.organizations.get, se você quiser ver a cota de uma organização inteira.
  • serviceusage.quotas.get

É possível ver quais papéis incluem essas permissões por padrão na referência de permissões do IAM.

Para alterar cotas no nível do projeto, da pasta ou da organização, você também precisa da seguinte permissão:

  • serviceusage.quotas.update

Por padrão, essa permissão está incluída nos papéis a seguir: proprietário, editor, administrador de cotas e administrador do Service Usage.

Como visualizar sua cota

É possível ver os limites de cota atuais em duas áreas diferentes do Console do Google Cloud:

  • A página Cotas, que lista todo o uso e os limites das cotas para seu projeto.
  • O painel da API Console do Cloud, que lista informações de cotas de uma API específica, inclusive o uso de recursos ao longo do tempo.

Gerencie o uso da cota de maneira programática com a API Service Usage.

Além disso, alguns serviços oferecem acesso de linha de comando às informações de uso de cota e recursos. Por exemplo, o Compute Engine permite acessar informações de cota usando gcloud compute.

Veja como monitorar seu uso de cotas e definir alertas relacionados a elas na seção Como monitorar métricas.

Como visualizar todas as cotas do projeto

Para visualizar o uso e limites de cota para todos os recursos em seu projeto:

  1. Acesse a página "Cotas" do Console do Cloud no IAM e administrador, que lista um item de linha para cada tipo de cota disponível em cada serviço.

  2. Classifique e filtre os resultados para focar nas informações necessárias:

    • Para visualizar uma propriedade específica, clique em Filtrar tabela.
    • Para classificar as listas em ordem alfabética, mantenha o ponteiro do mouse sobre Serviço, Nome do limite, Status da cota ou Detalhes.
    • Por padrão, a lista é classificada para mostrar a cota mais usada primeiro, em termos de pico de uso nos últimos sete dias. Isso ajuda a ver quais limites correm risco de serem excedidos. Para ver as cotas menos usadas primeiro, alterne para a seta de Status da cota.
    • Para saber mais sobre o Uso atual de uma determinada cota, clique em Todas as cotas na coluna Detalhes.

As métricas de uso das cotas listadas na página Cotas são calculadas da seguinte maneira:

  • Cotas de taxa:
    • Para cotas de taxa de dia, o número listado representa o uso total até o momento no período de 24 horas atual.
    • Para cota por minuto ou por 100 segundos, o número listado representa o uso médio nas últimas 24 horas.
  • Cotas de alocação: o número listado representa a quantidade de recursos atualmente usada pelo projeto, como o número de balanceadores de carga.

É possível descobrir mais sobre cotas para um serviço específico e o que elas significam na documentação delas. Por exemplo, a cota do Compute Engine é documentada em Cotas de recursos.

Cota específica da API

Para ver informações mais detalhadas sobre cotas para uma API específica, incluindo o uso ao longo de um período, acesse a página de cotas da API no Console do Cloud. Dependendo da API, esses limites podem incluir solicitações por dia, solicitações por minuto e solicitações por minuto por usuário. Algumas APIs definem limites muito baixos até você ativar o faturamento no seu projeto.

É possível ver os limites atuais de uma API específica em duas áreas diferentes do Console do Cloud:

  • Na página "Cotas" do Console do Cloud, conforme descrito na seção Como ver todas as cotas do projeto.

  • Na página Painel de APIs e serviços do Console do Cloud. Nesta página, selecione seu projeto, clique no nome da API e clique em Cotas. A página Cotas mostra os nomes das cotas da API. É possível expandir todas elas para ver o uso detalhado ao longo do tempo, bem como o limite atual. Por padrão, os limites exibidos são os impostos pelo Google. É possível limitar o uso conforme descrito na seção Como limitar o uso. Se não houver um limite definido pelo Google para uma determinada cota, o limite será exibido como Ilimitado.

    • Algumas cotas não aparecem em uma página de cota específica da API. Por exemplo, as solicitações à API Compute Engine têm uma página de cota específica, mas isso não inclui o uso de recursos de computação do Compute Engine (cota de alocação). Além disso, se você estiver usando um serviço em vários locais, a página da cota específica da API não mostrará os limites e o uso das cotas regional ou por zona. Para ver uma lista completa do uso de cotas do seu projeto que pode ser filtrado por local, consulte a página Cotas do projeto.

Como gerenciar sua cota usando o Console do Cloud

Dependendo do uso de recursos, talvez você queira aumentar ou diminuir os limites de cota do seu projeto. Nesta seção, descrevemos como alterar os limites de cota fornecidos. Para ver os limites de cota, clique em TODOS OS COTAS na coluna Detalhes.

Como solicitar uma cota maior

É possível solicitar uma alteração de cota para a maioria dos serviços faturáveis com um limite de cota na página Cotas do Console do Cloud.

  1. Na coluna Status da cota, clique no aviso . O painel de cotas lista todas as suas cotas.
  2. Marque a caixa de seleção do local da cota que você quer alterar.
  3. Clique em EDITAR COTAS.
  4. Preencha o formulário de solicitação.
  5. Insira o limite de cota revisado e, opcionalmente, uma descrição.
  6. Clique em CONCLUÍDO.
  7. Clique em ENVIAR SOLICITAÇÃO.

Como alternativa, clique em Filtrar tabela para consultar sua cota por uma propriedade específica.

Você receberá um e-mail em resposta à sua solicitação.

As solicitações de cota do Google Cloud geralmente são processadas rapidamente, em dois dias úteis e confirmadas com um e-mail do Google Cloud. Se precisar de mais ajuda, responda a esse e-mail. Observe que grandes alterações de cota exigem mais tempo para serem aprovadas.

Como limitar o uso

Talvez você queira limitar o uso de um recurso específico definindo seus próprios limites de cota. Por exemplo, para evitar a cobrança pelo uso além dos limites de cortesia, defina limites de solicitações diárias. A maneira mais simples de limitar a cota é editar os limites na página de cota específica da API.

No Console do Google Cloud, acesse Cotas na página IAM e Admin.

Acessar "Cotas"

  1. Clique em Filtrar tabela para consultar sua cota por uma propriedade específica.
  2. Clique em TODOS AS COTAS para ter acesso ao uso que você quer limitar.
  3. Clique na caixa de seleção para selecionar a propriedade que você quer editar.
  4. Clique em EDITAR COTAS.
  5. Preencha o formulário de solicitação.
  6. Insira o limite de cota revisado e, opcionalmente, uma descrição.
  7. Clique em CONCLUÍDO.
  8. Clique em ENVIAR SOLICITAÇÃO.

Se você quiser limitar uma cota que não aparece nessa página ou definir um limite superior ao máximo fornecido, edite seus limites conforme descrito em Como solicitar uma cota maior.

Como gerenciar sua cota usando a API Service Usage

É possível usar as APIs Service Usage para receber cotas atuais e limitar o uso de cotas para alguns serviços e APIs do Google Cloud. Para saber mais sobre o assunto, veja estes itens:

Não é possível usar a API Service Usage para solicitar uma cota maior. Para fazer isso, é preciso usar o Console do Cloud.

Como monitorar e configurar alertas para as métricas de cota

A API e a IU do Cloud Monitoring permitem que você monitore o uso, os limites e os erros de cota com mais detalhes. Com elas, é possível criar painéis e alertas personalizados para monitorar o uso da cota ao longo do tempo e receber alertas quando, por exemplo, o limite de uma cota estiver perto de ser alcançado.

O Cloud Monitoring é compatível com várias métricas, que podem ser combinadas com filtros e agregações para conseguir novos insights sobre o uso da cota. Por exemplo, é possível combinar uma métrica para o uso da cota de alocação com um filtro quota_metric em nomes de Cloud TPU.

{ % include "monitoring/_shared/metrics-explorer/_template_metrics_explorer.html" %}

Da mesma forma, para ver os limites de cota ou os erros por cota excedida, primeiro selecione Consumer Quota como o tipo de recurso e, em seguida, selecione Quota limit ou Quota exceeded error.

Depois de encontrar as informações de uso de cota que você queria, use o Cloud Monitoring para criar painéis personalizados e alertas para ajudar você a monitorar e manter um aplicativo robusto. Saiba mais nas páginas a seguir:

Para encontrar mais informações, incluindo exemplos de políticas de alertas de cotas específicas, consulte Como usar métricas de cota na documentação do Cloud Monitoring.

Veja uma referência detalhada para métricas de cota no Guia de referência do Cloud Monitoring.

Erros de cota

Se seu projeto exceder uma cota ao usar um serviço, o Google Cloud retornará um erro com base em como você acessou o serviço:

  • Se você tiver excedido uma cota com uma solicitação HTTP/REST, o Google Cloud retornará um código de status HTTP 429 TOO MANY REQUESTS.
  • Se você exceder uma cota com uma solicitação de API, o Google Cloud retornará um código de status HTTP 413 REQUEST ENTITY TOO LARGE.
  • Se você tiver excedido uma cota usando gRPC, o Google Cloud retornará um erro ResourceExhausted. A forma como esse erro aparecerá para você depende do serviço.
  • Se você excedeu uma cota usando um comando de ferramenta de linha de comando gcloud, a ferramenta de linha de comando gcloud gerará uma mensagem de erro de cota excedida e retornará com o código de saída 1.

As cotas de taxa são redefinidas após um intervalo de tempo predefinido específico de cada serviço. Consulte a documentação de cotas de serviços específicos para informações mais detalhadas.

É possível identificar o uso da cota associado a um alerta de erro por meio do Cloud Monitoring e criar alertas personalizados para erros específicos da cota, conforme descrito em Como monitorar métricas de cota.