Como trabalhar com cotas

O Google Cloud usa cotas para restringir a quantidade de um determinado recurso compartilhado compartilhado do Google Cloud que você pode usar. Cada cota representa um recurso contável específico, como chamadas de API para um determinado serviço, o número de balanceadores de carga usados simultaneamente por seu projeto ou o número de projetos que você pode criar.

Nesta página, descrevemos como trabalhar com cotas nos seus projetos, inclusive como encontrar e modificar os limites atuais, como solicitar uma cota maior e monitorar o uso.

Para saber como ver outras métricas de uso da API, consulte Como monitorar o uso da API.

Faça um teste

Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho dos nossos produtos em situações reais. Clientes novos também ganham US$ 300 em créditos para executar, testar e implantar cargas de trabalho.

Comece a usar gratuitamente

Sobre cotas

Antes de aprender a monitorar e gerenciar sua cota, é útil entender os princípios básicos de como o sistema de cotas do Google Cloud funciona. Nesta seção, apresentamos alguns conceitos-chave de cota, incluindo tipos e limites e solicitações de aumento de cota.

Por que aplicamos cotas?

As cotas são aplicadas por diversos motivos:

  • Para proteger a comunidade de usuários do Google Cloud, prevenindo picos inesperados de uso e serviços sobrecarregados.
  • Ajudar a gerenciar recursos. Por exemplo, é possível definir seus próprios limites de uso do serviço ao desenvolver e testar seus aplicativos para evitar contas inesperadas de usar recursos caros.

Tipos de cota

Há duas categorias de cotas:

  • Cotas de taxa normalmente são usadas para limitar o número de solicitações que podem ser feitas para uma API ou um serviço. As cotas de taxa são redefinidas após um intervalo de tempo específico do serviço, por exemplo, o número de solicitações de API por dia.
  • Cotas de alocação são usadas para restringir o uso de recursos que não têm uma taxa de uso, como o número de VMs usadas pelo seu projeto em determinado momento. As cotas de alocação não são redefinidas com o tempo, em vez disso, você precisa liberar explicitamente o recurso quando não quiser mais usá-lo, por exemplo, excluindo um cluster do GKE.

Nessas categorias, algumas cotas são globais e se aplicam ao seu uso do recurso em qualquer lugar do Google Cloud, enquanto outras são regionais ou zonais e se aplicam ao uso do recurso em uma região específica do Google Cloud. (ambos os tipos de cota) ou zona (apenas cotas de alocação). Por exemplo, há limites separados para quantas instâncias de VM do Compute Engine podem ser criadas em cada região do Google Cloud.

As cotas são aplicadas por projeto, com exceção do número de projetos que podem ser criados, o que é aplicado por conta de usuário e conta de faturamento.

Como visualizar informações de cota

Há várias maneiras de visualizar e gerenciar sua cota do Google Cloud:

Veja detalhes sobre como usar essas abordagens no restante deste documento. Cada produto ou serviço também tem a própria página de cotas e limites com informações específicas sobre elas, por exemplo, a Cotas do GKE e limites de página.

Como entender os limites da cota

Muitos serviços têm cotas padrão para alguns recursos, mas o conjunto de limites de cotas que se aplicam aos seus aplicativos é específico para você, seu projeto ou sua organização. Por exemplo, se você estiver usando uma conta de avaliação gratuita para explorar a plataforma, talvez tenha uma cota muito baixa para alguns recursos em comparação com as cotas mais baixas de uma fatura. Ativar o faturamento para seu projeto aumenta as cotas para a maioria dos serviços. As cotas também podem aumentar à medida que você usa o Google Cloud.

Caso seu projeto precise de mais de um recurso específico do que o permitido pelas cotas, solicite mais cotas para um serviço específico. Saiba mais sobre como funcionam as solicitações de aumento de cota em Sobre solicitações de aumento de cota. Também é possível adicionar seus próprios limites para determinadas cotas caso você queira impor limites de gastos, especialmente ao desenvolver ou testar um aplicativo que usa recursos caros.

Algumas cotas são ilimitadas para usuários específicos. Nesse caso, você pode usar a quantidade de recurso que quiser.

Por fim, não é possível aumentar um pequeno número de cotas nos valores padrão. Por exemplo, quando o uso mais alto constitui um antipadrão ou quando os recursos são muito limitados. Normalmente, elas são documentadas na página "Cotas e limites do serviço relevante", como neste exemplo do Cloud Functions.

Cota excedida

Na maioria dos casos, se você atingir a cota da tarefa que está tentando executar, como implantar um aplicativo, criar um novo projeto ou chamar uma API, haverá uma falha e você receberá um erro de cota. A tarefa continua a falhar até que você libere recursos (para a cota de alocação), o período se redefine (para cota de taxas) ou solicita e recebe um aumento de cota.

A forma como o erro de cota aparece depende da ferramenta ou do cliente que você usa para interagir com o Google Cloud. Veja os detalhes dos erros de cota em Erros de cota.

Para evitar erros de cota, configure o monitoramento para alertar quando estiver próximo dos limites de cota. Você pode saber mais sobre como monitorar suas cotas em Como monitorar e enviar alertas sobre métricas de cota, mais adiante neste documento.

Sobre solicitações de aumento de cota

A maioria das solicitações de aumento de cota é avaliada por sistemas automatizados com base em critérios rígidos, incluindo a disponibilidade de recursos, o período de uso do Google Cloud e outros fatores. As solicitações que não atenderem a critérios específicos serão negadas. Os critérios de avaliação para avaliações automáticas não são divulgados para garantir a imparcialidade de todos os clientes e evitar tentativas de manipulação do processo. Em alguns casos, as solicitações de aumento de cota são encaminhadas para revisores humanos, que também seguem critérios rigorosos, mas podem considerar suas circunstâncias exclusivas.

Talvez você precise pagar antecipadamente por alguns aumentos de cota. Por exemplo, pode ser necessário fazer um pagamento se você solicitar mais projetos que usarão serviços de nuvem pagos. O pagamento pode ser aplicado a todas as cobranças que você gerar no futuro e será visível como um crédito na sua conta.

As solicitações de aumento de cota são processadas pelo Cloud Customer Care (não Faturamento), que processa sua solicitação, normalmente em até dois ou três dias úteis. É enviado um e-mail quando a solicitação é recebida, para que você possa responder se tiver dúvidas ou quiser fornecer informações adicionais sobre sua solicitação (por exemplo, se a solicitação de aumento for urgente). Em seguida, você receberá outro e-mail após o processamento da solicitação, notificando se o aumento da cota foi aprovado ou negado. O e-mail informa a data efetiva do aumento, se aplicável.

Saiba mais sobre como solicitar uma cota maior em Como solicitar um limite maior de cotas.

Permissões

Permissões para visualizar a cota do projeto

Para visualizar sua cota de projeto no Google Cloud Console ou acessar a cota do projeto de maneira programática, você precisa ter as seguintes permissões do IAM:

Para saber quais papéis incluem essas permissões por padrão, consulte a referência de permissões do IAM.

Permissões para alterar a cota do projeto

Para alterar sua cota no nível do projeto, da pasta ou da organização, é necessário ter a seguinte permissão:

Por padrão, essa permissão está incluída nos papéis a seguir: proprietário, editor, administrador de cotas e administrador do Service Usage.

Como visualizar sua cota no Console do Cloud

É possível ver os limites de cota atuais em duas áreas diferentes do Console do Google Cloud:

  • A página Cotas, que lista todo o uso e os limites das cotas para seu projeto.
  • O painel da API Cloud Console, que lista informações de cotas de uma API específica, inclusive o uso de recursos ao longo do tempo.

Como visualizar todas as cotas do projeto

Para visualizar o uso e limites de cota para todos os recursos em seu projeto:

  1. No Console do Google Cloud, acesse a página Cotas.

    Acessar "Cotas"

    A lista inclui um item de linha para cada tipo de cota disponível em cada serviço.

  2. Classifique e filtre os resultados para focar nas informações necessárias:

    • Para visualizar uma propriedade específica, clique em Filtrar tabela.
    • Para classificar as listas em ordem alfabética, mantenha o ponteiro do mouse sobre Serviço, Nome do limite, Status da cota ou Detalhes.
    • Por padrão, a lista é classificada para mostrar a cota mais usada primeiro, em termos de pico de uso nos últimos sete dias. Isso ajuda a ver quais limites correm risco de serem excedidos. Para ver as cotas menos usadas primeiro, alterne para a seta de Status da cota.
    • Para saber mais sobre o Uso atual de uma cota específica, na coluna Detalhes, clique em Todas as cotas.

As métricas de uso das cotas listadas na página Cotas são calculadas da seguinte maneira:

  • Cotas de taxa:
    • Para cotas de taxa de dia, o número listado representa o uso total até o momento no período de 24 horas atual.
    • Para cota por minuto ou por 100 segundos, o número listado representa o uso médio nas últimas 24 horas.
  • Cotas de alocação: o número listado representa a quantidade de recursos atualmente utilizados pelo projeto, como o número de balanceadores de carga.

Saiba mais sobre cotas para um serviço específico lendo a documentação desse serviço. Por exemplo, a cota do Compute Engine é documentada em Cotas de recursos.

Como ver uma cota específica da API

Para visualizar informações detalhadas sobre a cota de uma API específica, incluindo o uso ao longo do tempo, acesse a página de cota da API no Console do Cloud. Dependendo da API, esses limites podem incluir solicitações por dia, solicitações por minuto e solicitações por minuto por usuário. Algumas APIs definem limites muito baixos até você ativar o faturamento no seu projeto.

É possível ver os limites atuais de uma API específica em duas áreas diferentes do Console do Cloud:

  • Na página "Cotas" do Console do Cloud, conforme descrito na seção Como ver todas as cotas do projeto.

  • Na página Painel de APIs e serviços do Console do Cloud. Nesta página, selecione seu projeto, clique no nome da API e clique em Cotas. A página Cotas mostra os nomes das cotas da API. É possível expandir todas elas para ver o uso detalhado ao longo do tempo, bem como o limite atual. Por padrão, os limites exibidos são os impostos pelo Google. É possível limitar o uso conforme descrito na seção Como limitar o uso. Se não houver um limite definido pelo Google para uma determinada cota, o limite será exibido como Ilimitado.

    Algumas cotas não aparecem em uma página de cota específica da API. Por exemplo, as solicitações à API Compute Engine têm uma página de cota específica, mas isso não inclui o uso de recursos de computação do Compute Engine (cota de alocação). Além disso, se você estiver usando um serviço em vários locais, a página da cota específica da API não mostrará os limites e o uso das cotas regional ou por zona. Para ver uma lista completa do uso de cotas do seu projeto que pode ser filtrado por local, consulte a página Cotas do projeto.

Como visualizar o número de projetos que podem ser criados

Cada conta de usuário, incluindo contas de serviço, e uma conta de faturamento tem um limite para o número de projetos que podem ser criados. Se você tiver menos de 30 projetos restantes na cota, uma notificação exibirá o número de projetos restantes na cota no novo projeto. Para saber mais sobre como gerenciar essa cota, consulte Como gerenciar cotas de projetos e Solicitações de cotas de projetos.

Como gerenciar sua cota usando o Console do Cloud

Dependendo do uso de recursos, talvez você queira aumentar ou diminuir os limites de cota do seu projeto. Nesta seção, descrevemos como alterar os limites de cota fornecidos. Para ver os limites de cota, na coluna Detalhes, clique em Todas as cotas.

Como filtrar cotas

Para filtrar a lista de cotas por propriedades específicas, siga estas instruções:

  1. Acesse a página Cotas no Console do Google Cloud:

    Acessar "Cotas"

  2. Clique em Filtrar tabela para consultar sua cota por uma propriedade específica.

Como solicitar um limite de cota mais alto

É possível solicitar um aumento na maioria das cotas diretamente no Console do Google Cloud usando as etapas abaixo. Você pode encontrar uma das seguintes exceções:

  • Em alguns casos, o Console do Google Cloud redireciona você para um formulário separado a fim de solicitar um limite maior. Depois de enviar o formulário, o Google Cloud confirmará sua solicitação por e-mail.
  • Não é possível atualizar algumas cotas usando o Console do Google Cloud. Se você achar que não consegue alterar uma cota no console, solicite o aumento do Cloud Customer Care. A equipe de faturamento não lida com aumentos de limite de cota.

Para saber mais sobre como o processo de aumento de cota funciona, consulte Sobre solicitações de aumento de cota.

Para solicitar um limite de cota maior no Console do Google Cloud:

  1. Acesse a página Cotas:

    Acessar "Cotas"

  2. Selecione a cota que você quer alterar da seguinte maneira:

    1. Clique em TODAS AS COTAS na linha da cota que você quer alterar. No PAINEL DE COTA, clique na caixa de seleção Global.
    2. Como alternativa, clique no alerta de , se ele aparecer na coluna Status da cota. No PAINEL DE COTA, clique na caixa de seleção ao lado da cota que você quer alterar.
  3. Na página principal Cotas, clique em EDITAR COTAS.

  4. Preencha o formulário de solicitação que é exibido à direita da seguinte forma:

    1. No campo Novo limite, insira a cota aumentada que você está solicitando.
    2. No campo Descrição da solicitação, insira o motivo da solicitação. É útil incluir informações como planos de crescimento futuros, propagação de região ou zona e qualquer requisito ou dependência extra.
    3. Clique em PRÓXIMA.
    4. No painel Detalhes do contato, insira o número de telefone no campo Telefone.
    5. Clique em CONCLUÍDO.
  5. Clique em ENVIAR SOLICITAÇÃO.

Depois de enviar a solicitação no Console do Google Cloud, você receberá um e-mail de confirmação da solicitação. Responda a este e-mail se precisar de ajuda. O Cloud Customer Care processa sua solicitação, normalmente dentro de dois ou três dias úteis, e envia um segundo e-mail informando se o aumento da cota foi aprovado ou negado. O e-mail informa a data efetiva do aumento, se aplicável.

Como limitar o uso

Talvez você queira limitar o uso de um recurso específico definindo seus próprios limites de cota. Por exemplo, para evitar a cobrança pelo uso além dos limites de cortesia, defina limites de solicitações diárias. Para limitar a cota, edite os limites na página de cota específica da API.

  1. No Console do Google Cloud, acesse a página Cotas.

    Acessar "Cotas"

  2. Clique em Filtrar tabela para consultar sua cota por uma propriedade específica.

  3. Clique em TODOS AS COTAS para ter acesso ao uso que você quer limitar.

  4. Clique na caixa de seleção para selecionar a propriedade que você quer editar.

  5. Clique em EDITAR COTAS.

  6. Preencha o formulário de solicitação.

  7. Insira o limite de cota revisado e, opcionalmente, uma descrição.

  8. Clique em CONCLUÍDO.

  9. Clique em ENVIAR SOLICITAÇÃO.

Se você quiser limitar uma cota que não aparece nessa página ou definir um limite superior ao máximo fornecido, edite seus limites conforme descrito em Como solicitar uma cota maior.

Como gerenciar a cota usando a ferramenta de linha de comando gcloud (Alfa)

Use a ferramenta de linha de comando gcloud para receber cotas atuais e limitar o uso de cotas de alguns serviços e APIs do Google Cloud, incluindo cotas de projeto, pasta e nível da organização, quando disponíveis.

Para usar essa abordagem, primeiro verifique se você instalou e inicializou a versão mais recente do SDK do Cloud, incluindo o componente dos comandos Alfa. Se você estiver usando o Cloud Shell para interagir com o Google Cloud, o SDK do Cloud já está instalado.

Para visualizar a cota de um projeto para um serviço específico, execute o seguinte comando, substituindo o ID do projeto e o nome do serviço:

gcloud alpha services quota list \
    --service=SERVICE_NAME.googleapis.com \
    --consumer=projects/PROJECT_ID

Para visualizar os mesmos detalhes de cota do serviço em uma organização:

gcloud alpha services quota list \
    --service=SERVICE_NAME.googleapis.com \
    --consumer=organizations/ORG_ID

Para ver uma lista completa de sinalizações e comandos gcloud quota, consulte a referência do SDK do Cloud.

Além de gcloud quota, alguns serviços têm o próprio acesso à linha de comando para obter informações de uso de recursos e cotas. Por exemplo, o Compute Engine permite acessar informações de cota com o gcloud compute.

Como gerenciar sua cota usando a API Service Usage

É possível usar as APIs Service Usage para receber cotas atuais e limitar o uso de cotas para alguns serviços e APIs do Google Cloud. Para saber mais sobre o assunto, veja estes itens:

Não é possível usar a API Service Usage para solicitar uma cota maior. Para fazer isso, é preciso usar o Console do Cloud.

Como monitorar e configurar alertas para as métricas de cota

Com a IU e a API Cloud Monitoring, é possível monitorar o uso, os limites e os erros de cota com mais detalhes. É possível usar essas métricas para criar painéis e alertas personalizados. Assim, é possível monitorar o uso da cota ao longo do tempo e receber alertas quando, por exemplo, o limite de uma cota estiver prestes a ser atingido.

O Cloud Monitoring é compatível com várias métricas, que podem ser combinadas com filtros e agregações para ter visualizações novas e detalhadas sobre o uso da cota. Por exemplo, é possível combinar uma métrica para o uso da cota de alocação com um filtro quota_metric em nomes de Cloud TPU.

Se quiser usar o Metrics Explorer para visualizar as métricas de um recurso monitorado, siga estas etapas:

  1. No Console do Google Cloud, acesse a página Monitoring.

    Acessar Monitoring

  2. No painel de navegação do Monitoring, clique em Metrics Explorer.
  3. Verifique se Métrica é a guia selecionada.
  4. No campo Encontrar tipo de recurso e métrica, selecione no menu ou digite o nome do recurso e da métrica. Use as seguintes informações para preencher os campos:
    1. Em Resource, selecione ou informe a Consumer Quota.
    2. Em Metric, selecione ou insira Allocation quota usage ou Rate quota usage, dependendo do tipo de cota que você quer monitorar.
  5. Para modificar como os dados são exibidos, use os menus Filtro, Agrupar por e Agregador. Por exemplo, é possível agrupar por rótulos de recurso ou métrica. Para mais informações, consulte Como selecionar métricas.

Da mesma forma, para ver os limites de cota ou os erros por cota excedida, primeiro selecione Consumer Quota como o tipo de recurso e, em seguida, selecione Quota limit ou Quota exceeded error.

Depois de encontrar as informações de uso de cota que você queria, use o Cloud Monitoring para criar painéis personalizados e alertas para ajudar você a monitorar e manter um aplicativo robusto. Para mais informações, consulte os documentos a seguir:

Para ver exemplos de políticas de alertas específicas de cotas, consulte Como usar métricas de cota.

O guia de referência do Cloud Monitoring inclui uma referência detalhada para métricas de cota.

Como verificar o suporte da métrica de cota

Nem todos os serviços aceitam as métricas de cota no Cloud Monitoring. Para ver as métricas de cota aplicáveis a serviços compatíveis, selecione Cotas do consumidor como o tipo de recurso ao criar um gráfico ou uma política de alertas. A visualização não mostrará os serviços que não forem desse tipo.

  • Os serviços comuns compatíveis com as métricas de cota incluem Compute Engine, Dataflow, Cloud Spanner, Pub/Sub, Cloud Vision, Speech-to-Text, Cloud Monitoring e Cloud Logging.

  • Os serviços comuns que não são compatíveis com as métricas de cota incluem o App Engine, Cloud Storage e Cloud SQL.

Erros de cota

Se seu projeto exceder uma cota ao usar um serviço, o Google Cloud retornará um erro com base em como você acessou o serviço:

  • Se você tiver excedido uma cota com uma solicitação HTTP/REST, o Google Cloud retornará um código de status HTTP 429 TOO MANY REQUESTS.
  • Se você exceder uma cota com uma solicitação de API, o Google Cloud retornará um código de status HTTP 413 REQUEST ENTITY TOO LARGE.
  • Se você tiver excedido uma cota usando gRPC, o Google Cloud retornará um erro ResourceExhausted. A forma como esse erro aparecerá para você depende do serviço.
  • Se você excedeu uma cota usando um comando de ferramenta de linha de comando gcloud, a ferramenta gcloud gerará uma mensagem de erro de cota excedida e retornará o código de saída 1.

As cotas de taxa são redefinidas após um intervalo de tempo predefinido específico de cada serviço. Para mais informações, consulte a documentação de cotas do serviço específico.

Se você quiser receber um alerta quando ocorrerem erros no futuro, crie alertas personalizados para erros de cota específicos, conforme descrito em Como monitorar as métricas da cota.