Trabalhar com cotas

Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

"Trabalhar com sistemas de cotas do Google Cloud, o Google Cloud"

O Google Cloud usa cotas para restringir a quantidade de um determinado recurso compartilhado do Google Cloud que você pode usar. Cada cota representa um recurso contável específico. Por exemplo: chamadas de API para um serviço específico, o número de balanceadores de carga usados simultaneamente pelo seu projeto ou o número de projetos que podem ser criados.

Veja nesta página como usar cotas nos seus projetos. Isso inclui como encontrar e modificar seus limites de cota, como solicitar cotas mais altas e como monitorar o uso da cota.

Muitos serviços também têm limites que não estão relacionados ao sistema de cotas. Os limites são restrições fixas, como tamanhos máximos de arquivo ou limitações de esquema do banco de dados, que não podem ser aumentadas ou reduzidas. É possível descobrir sobre limites na página Cotas e limites relevantes para seu serviço (por exemplo, Cotas e limites do Cloud Storage).

Os links a seguir fornecem informações adicionais relacionadas ao uso de recursos:

Faça um teste

Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho dos nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.

Comece a usar gratuitamente

Sobre cotas

Antes de aprender a monitorar e gerenciar sua cota, é útil entender os conceitos básicos de funcionamento do sistema de cotas do Google Cloud. Nesta seção, apresentamos alguns dos principais conceitos sobre cotas: tipos de cota, limites de cota e solicitações de aumento de cota.

Por que aplicamos cotas?

As cotas são aplicadas por diversos motivos, incluindo:

  • Para proteger a comunidade de usuários do Google Cloud, prevenindo picos inesperados de uso e serviços sobrecarregados.
  • Ajudar a gerenciar recursos. Por exemplo, é possível definir seus próprios limites de uso do serviço ao desenvolver e testar seus aplicativos para evitar contas inesperadas de usar recursos caros.

Tipos de cota

Há três categorias de cotas do Google Cloud:

  • Cotas de taxa são usadas normalmente para limitar o número de solicitações que podem ser feitas para uma API ou um serviço. As cotas de taxa são redefinidas após um intervalo de tempo específico do serviço, por exemplo, o número de solicitações de API por dia.
  • As cotas de alocação são usadas para restringir o uso de recursos que não têm uma taxa de uso. Por exemplo, o número de VMs usadas pelo seu projeto em um determinado momento. As cotas de alocação não são redefinidas ao longo do tempo. Em vez disso, elas precisam ser explicitamente lançados quando você não quiser mais usá-las, por exemplo, excluindo um cluster do GKE.
  • As cotas simultâneas são usadas para restringir o número total de operações simultâneas em trânsito a qualquer momento. Essas operações geralmente são de longa duração. Por exemplo, o Compute Engine usa insert_operations com probabilidade de durar até uma hora.

Nessas categorias, algumas cotas são globais e se aplicam ao seu uso do recurso em qualquer lugar no Google Cloud. Outras são regionais ou zonais e se aplicam ao uso do recurso em uma região específica do Google Cloud (ambos os tipos de cota) ou zona (somente cotas de alocação). Por exemplo, há limites separados para quantas instâncias de VM do Compute Engine podem ser criadas em cada região do Google Cloud.

As cotas são aplicadas por projeto. Exceto pelo número de projetos que podem ser criados, que são aplicados por conta de usuário e de faturamento.

Ver informações sobre cotas

Há várias maneiras de visualizar e gerenciar sua cota do Google Cloud:

Veja detalhes sobre como usar essas abordagens no restante deste documento. Cada produto ou serviço também tem uma página própria de cotas e limites com informações específicas sobre as cotas do serviço. Por exemplo, a página de cotas e limites do GKE.

Entender os limites de cota

O conjunto de limites de cota que se aplica aos seus aplicativos é específico a você, seu projeto ou sua organização. Por exemplo, se você estiver usando uma conta de teste sem custo financeiro, talvez tenha uma cota muito baixa para alguns recursos em comparação com uma conta faturada. Ativar o faturamento para seu projeto aumenta as cotas para a maioria dos serviços. As cotas também podem aumentar à medida que você usa o Google Cloud.

Caso seu projeto precise de mais de um recurso específico do que o permitido pelas cotas, solicite mais cotas para um serviço específico. Saiba mais sobre como funcionam as solicitações de aumento de cota em Sobre solicitações de aumento de cota. Se você quiser impor limites de gastos, poderá adicionar seus próprios limites para determinadas cotas. Use essa ferramenta ao desenvolver ou testar aplicativos que usam recursos caros.

Algumas cotas são ilimitadas para usuários específicos. Nesse caso, você pode usar a quantidade de recurso que quiser.

Por fim, não é possível aumentar o número de cotas de seus valores padrão. Por exemplo, quando o uso mais alto é contraprodutivo ou quando os recursos são muito limitados. Essas limitações costumam ser documentadas na página Cotas e limites relevantes para o serviço, como neste exemplo do Cloud Functions.

Quando a cota acabar

Normalmente, se você esgotar a cota, a tarefa que está tentando executar falhará e receberá um erro de cota. As tarefas que geram esse erro podem incluir a implantação de um aplicativo, a criação de um novo projeto ou a chamada de uma API. Depois disso, a tarefa continuará falhando até que você libere recursos (para cota de alocação), o período de tempo será redefinido (para cota de taxa) ou você receberá um aumento de cota.

A forma como o erro de cota aparece depende da ferramenta ou do cliente que você usa para interagir com o Google Cloud. Veja os detalhes dos erros de cota em Erros de cota.

Para evitar erros de cota, configure o monitoramento para alertar quando estiver próximo dos limites de cota. Você pode saber mais sobre como monitorar suas cotas em Como monitorar e enviar alertas sobre métricas de cota, mais adiante neste documento.

Sobre solicitações de aumento de cota

A maioria das solicitações de aumento de cota é avaliada por sistemas automatizados. A decisão deles é baseada em critérios rigorosos, incluindo a disponibilidade de recursos, o período em que você usou o Google Cloud e outros fatores. As solicitações que não atenderem a critérios específicos serão negadas. Os critérios de avaliação para avaliações automáticas não são divulgados para garantir a imparcialidade de todos os clientes e evitar tentativas de manipulação do processo. Às vezes, as solicitações de aumento de cota são encaminhadas para revisores humanos, que também seguem critérios rigorosos, mas podem considerar circunstâncias exclusivas.

Talvez você precise pagar antecipadamente por alguns aumentos de cota. Por exemplo, pode ser necessário fazer um pagamento se você solicitar mais projetos que usarão serviços de nuvem pagos. O pagamento pode ser aplicado a todas as cobranças que você gerar no futuro e será visível como um crédito na sua conta.

Para saber como solicitar mais cota, consulte Como solicitar um limite de cota maior. Você não precisa ter um serviço pago de atendimento ao cliente para solicitar um aumento de cota. As solicitações de aumento de cota geralmente são concluídas de dois a três dias úteis. Você receberá um e-mail quando a solicitação for recebida e à qual você poderá responder. Use esse recurso se você tiver dúvidas ou quiser fornecer mais informações sobre sua solicitação (por exemplo, se a solicitação de aumento for urgente). Em seguida, você receberá outro e-mail após o processamento da solicitação, notificando se o aumento da cota foi aprovado ou negado. O e-mail informa a data efetiva do aumento, se aplicável.

Permissões

Permissões para visualizar a cota do projeto

Para visualizar a cota do seu projeto no console do Google Cloud ou acessá-la de maneira programática, é necessário ter as seguintes permissões do Identity and Access Management (IAM):

Para saber quais papéis incluem essas permissões por padrão, consulte a referência de permissões do IAM.

Permissões para alterar a cota do projeto

Para alterar sua cota no nível do projeto, da pasta ou da organização, é necessário ter a seguinte permissão:

Por padrão, essa permissão está incluída nos papéis a seguir: proprietário, editor, administrador de cotas e administrador do Service Usage.

Permissões para ver as solicitações de aumento de cota

Para ver as solicitações de aumento de cota no Console do Google Cloud, é necessário ter as permissões do IAM a seguir:

Permissões para criar uma política de alertas para uma cota

Para criar uma política de alertas para uma cota, é necessário ter a seguinte permissão:

  • monitoring.alertPolicies.create

Ver sua cota no console do Google Cloud

É possível ver os limites de cota atuais em duas áreas diferentes do Console do Google Cloud:

  • A página Cotas, que lista todo o uso e os limites das cotas para seu projeto.
  • O painel da API do console do Google Cloud, que lista informações de cotas de uma API específica, inclusive o uso de recursos ao longo do tempo.

Ver as cotas do projeto

Para visualizar o uso e os limites de cota de todos os recursos do seu projeto, siga estas etapas:

  1. No console do Google Cloud, acesse a página Cotas.

    Acessar "Cotas"
    As etapas restantes vão aparecer automaticamente no console do Google Cloud.

  2. Para focar nas informações necessárias, é possível filtrar e classificar a lista da seguinte maneira:

    • Para filtrar a lista, insira as propriedades e os valores desejados no campo Filtro . Por exemplo, para visualizar as cotas da API BigQuery, selecione Serviço e, depois, API BigQuery.
    • Para classificar a lista, clique no título da coluna que você quer alterar. Por exemplo, para classificar alfabeticamente pelo nome da cota, clique no cabeçalho da colunaCota.

      A lista é classificada por padrão para mostrar primeiramente as cotas mais usadas, o que ajuda a ver os limites que correm risco de serem excedidos.

A página Cotas exibe uma tabela com colunas configuráveis. As colunas Serviço e Cota apresentam informações gerais sobre a cota que está sendo descrita. Por exemplo, o Serviço pode ser a API Cloud Logging, e a Cota pode ser Solicitações de ingestão de registros por minuto. O campo Cota também descreve como a cota é avaliada. As cotas de taxa são avaliadas por minuto, a cada 100 segundos ou por dia. Cotas sem nenhuma dessas instruções são cotas de alocação.

Para mais informações sobre a cota, use as colunas Métrica, Nome do limite e Recurso monitorado. Essas colunas apresentam as informações detalhadas necessárias para criar um gráfico de cota.

Para informações sobre o uso da cota, visualize as colunas Uso atual e Uso máximo de sete dias. Os valores mostrados nesses campos são calculados da seguinte maneira:

  • Para cotas de taxa por minuto:

    • O Uso atual é o uso total nos últimos 10 minutos.
    • O Uso máximo de sete dias é a média do uso máximo em intervalos de uma hora nos últimos sete dias.
  • Para cotas de taxa a cada 100 segundos:

    • O Uso atual é o uso total nos últimos 10 minutos.
    • O Uso máximo de sete dias é o pico do uso total, conforme calculado em intervalos de uma hora, nos últimos sete dias.
  • Para cotas de taxa por dia:

    • O Uso atual é o uso total do período atual de 24 horas para cotas de taxa diária.
    • O Uso máximo de sete dias é o pico do uso total, com a média calculada em intervalos de um dia, nos últimos sete dias.
  • Para cotas de alocação:

    • O Uso atual é o valor mais recente. Por exemplo, esse número pode mostrar a quantidade de balanceadores de carga em uso no momento pelo seu projeto.
    • O Uso máximo de sete dias é uma estimativa do uso máximo. A estimativa é calculada dividindo os dados dos últimos sete dias em intervalos de uma hora, selecionando o ponto de dados de cada intervalo com o carimbo de data/hora mais recente e, em seguida, selecionando o valor máximo desse conjunto. Devido ao modo de cálculo do uso máximo, o valor do campo pode subestimar o uso máximo real.
  • Para cotas simultâneas:

    • O Uso atual é o valor mais recente. Por exemplo, esse número pode mostrar o número de insert_operations em andamento de um determinado serviço.
    • O Uso máximo de sete dias é uma estimativa do uso máximo. A estimativa é calculada dividindo os dados dos últimos sete dias em intervalos de uma hora, selecionando o ponto de dados de cada intervalo com o carimbo de data/hora mais recente e, em seguida, selecionando o valor máximo desse conjunto. Devido ao modo de cálculo do uso máximo, o valor do campo pode subestimar o uso máximo real.

Saiba mais sobre cotas para um serviço específico lendo a documentação desse serviço. Por exemplo, a cota do Compute Engine é documentada em Cotas de recursos.

Ver cota específica da API

Para ver informações detalhadas sobre cotas de uma API específica, inclusive o uso ao longo de um período, acesse a página de cotas da API no Console do Google Cloud. Dependendo da API, esses limites podem incluir solicitações por dia, solicitações por minuto e solicitações por minuto por usuário. Algumas APIs definem limites muito baixos até você ativar o faturamento no seu projeto.

É possível ver os limites atuais de uma API específica em duas áreas diferentes do Console do Google Cloud:

Ver o número de projetos que podem ser criados

Cada conta de usuário, incluindo contas de serviço, e uma conta de faturamento tem um limite para o número de projetos que podem ser criados. Se você tiver menos de 30 projetos restantes na cota, uma notificação exibirá o número de projetos restantes na cota no novo projeto. Para saber mais sobre como gerenciar essa cota, consulte Como gerenciar cotas de projetos e Solicitações de cotas de projetos.

Gerenciar sua cota usando o console do Google Cloud

Dependendo do uso de recursos, ajuste os limites de cota se o projeto for para cima ou para baixo. Nesta seção, descrevemos como alterar os limites de cota fornecidos. Para ver os limites de cota, na coluna Detalhes, clique em Todas as cotas.

Filtrar cotas

Para filtrar a lista de cotas por propriedades específicas, siga estas instruções:

  1. Acesse a página Cotas no Console do Google Cloud:

    Acessar "Cotas"

  2. Clique em Filtrar para consultar sua cota por uma propriedade específica.

Solicitar um limite de cota maior

Para solicitar um limite de cota maior usando o console do Google Cloud, faça o seguinte:

  1. Acesse a página Cotas:

    Acessar "Cotas"
    As etapas restantes vão aparecer automaticamente no console do Google Cloud.

  2. Na página Cotas, encontre a cota que você quer aumentar na coluna Cota.

    Use a caixa de pesquisa Filtro para procurar sua cota.

  3. Marque a caixa de seleção à esquerda da cota.

  4. Clique em EDITAR COTAS . O formulário Alterações de cota é exibido.

  5. No formulário Mudanças de cota, digite a cota maior que você quer para o projeto no campo Novo limite.

  6. Preencha todos os campos do formulário e clique em CONCLUÍDO.

  7. Clique em ENVIAR SOLICITAÇÃO.

Embora o procedimento anterior se aplique à maioria das solicitações de aumento de cota, é possível encontrar uma das seguintes exceções:

  • Caso haja um limite de uso, é necessário remover esse limite para que a cota possa ser aumentada. Você receberá uma declaração e um contrato. A declaração diz que o limite de uso será excluído e o limite será atualizado para o limite padrão imediatamente. Seu pedido de aumento de cota será processado normalmente pelo Google Cloud normalmente.
  • Às vezes, o console do Google Cloud redireciona você para um formulário separado para solicitar um limite maior. Depois de enviar o formulário, o Google Cloud confirmará sua solicitação por e-mail.
  • Não é possível atualizar algumas cotas usando o Console do Google Cloud. Se você achar que não consegue alterar uma cota no console, solicite o aumento do Cloud Customer Care. A equipe de faturamento não lida com aumentos de limite de cota.

Caso sua solicitação de aumento de cota exija aprovação, você receberá um e-mail de confirmação do Google Cloud. Se precisar de mais ajuda, responda a esse e-mail. O Cloud Customer Care normalmente processa sua solicitação em dois a três dias úteis. O Cloud Customer Care envia um segundo e-mail notificando se o aumento da cota foi aprovado ou negado. O e-mail informa a data efetiva do aumento, se aplicável.

Para saber mais sobre como o processo de aumento de cota funciona, consulte Sobre solicitações de aumento de cota.

Ver solicitações de aumento de cota

É possível ver as solicitações de aumento de cota pendentes e antigas no Console do Google Cloud.

Para ver as solicitações de aumento de cota pendentes:

  1. Verifique se você tem permissão para visualizar solicitações de aumento de cota.

  2. Acesse a página Cotas:

    Acessar "Cotas"

  3. EmCotas página, Pendente é exibida ao lado dos limites de cota pendentes de uma decisão sobre solicitações de aumento enviadas anteriormente. Clique em Pendente para ver os detalhes das solicitações pendentes.

As solicitações pendentes também são exibidas no formulário Alterações de cota quando uma nova solicitação de aumento de cota está prestes a ser enviada.

Para ver todas as solicitações de aumento de cota, como solicitações pendentes e anteriores, siga estas etapas:

  1. Acesse a página Cotas:

    Acessar "Cotas"

  2. Clique na guia Aumentar solicitações.

  3. Clique em Filtrar para consultar as solicitações de aumento de cota por uma propriedade específica.

Quando uma organização ou pasta é selecionada, a página exibe todas as solicitações de aumento de cota para todos os projetos na organização ou pasta.

Limitar o uso

Talvez você queira limitar o uso de um recurso específico definindo seus próprios limites de cota. Por exemplo, para evitar a cobrança pelo uso além dos limites de cortesia, defina limites de solicitações diárias.

Para limitar uma cota, siga as mesmas etapas usadas para solicitar um limite de cota maior.

O limite de uso com cotas não se aplica a todos os serviços. Verifique a página de cota específica do seu serviço para mais informações.

Gerenciar sua cota usando a CLI do Google Cloud (Alfa)

Use a Google Cloud CLI para ver as cotas atuais e limitar o uso de algumas APIs e serviços do Google Cloud, incluindocotas no nível do projeto, da pasta e da organização, quando disponíveis.

Para usar essa abordagem, primeiro verifique se você instalou e inicializou a versão mais recente do SDK do Cloud, incluindo o componente dos comandos Alfa. Se você estiver usando o Cloud Shell para interagir com o Google Cloud, a CLI do Google Cloud será instalada.

Para ver uma cota para um serviço específico, execute o seguinte comando, substituindo o ID do projeto e o nome do serviço:

gcloud alpha services quota list \
    --service=SERVICE_NAME.googleapis.com \
    --consumer=projects/PROJECT_ID

Para visualizar os mesmos detalhes de cota do serviço em uma organização:

gcloud alpha services quota list \
    --service=SERVICE_NAME.googleapis.com \
    --consumer=organizations/ORG_ID

Para uma lista completa de comandos e sinalizações da gcloud quota, consulte a referência da CLI do Google Cloud.

Além de gcloud quota, alguns serviços têm o próprio acesso à linha de comando para obter informações de uso de recursos e cotas. Por exemplo, o Compute Engine permite acessar informações de cota com o gcloud compute.

Gerenciar sua cota usando a API Service Usage

É possível usar as APIs Service Usage para receber cotas atuais e limitar o uso de cotas para alguns serviços e APIs do Google Cloud. Para saber mais sobre o assunto, veja estes itens:

Não é possível usar a API Service Usage para solicitar uma cota maior. Para essa atividade, use o Console do Google Cloud.

Monitorar e alertar sobre métricas de cota

Configurar alertas de uso de cota na página "Cotas"

É possível configurar alertas de cota na página Cotas para receber notificações quando o uso da cota atingir um limite definido. No momento, esse recurso é compatível apenas com cotas no nível do projeto.

Para configurar um alerta para uma cota específica, faça o seguinte:

  1. Verifique se você tem a permissão para criar alertas.

  2. Acesse a página Cotas: Acessar Cotas

  3. Na página Cotas, na última coluna da tabela, clique no botão para abrir o menu de ações e clique em Criar alerta de cota.

  4. Selecione o modelo de uso de cota e os canais de notificação desejados.

  5. Clique em Criar políticas.

  6. Opcional: se quiser personalizar a política de alertas padrão, abra o menu suspenso e siga as instruções.

Usar o Cloud Monitoring

A API e a IU do Cloud Monitoring permitem que você monitore o uso, os limites e os erros de cota com mais detalhes. É possível usar essas métricas para criar painéis e alertas personalizados. É possível monitorar o uso da cota ao longo do tempo e receber alertas. Por exemplo, quando você está se aproximando de um limite de cota.

O Cloud Monitoring é compatível com várias métricas, que podem ser combinadas com filtros e agregações para ter visualizações novas e detalhadas sobre o uso da cota. Por exemplo, é possível combinar uma métrica para o uso da cota de alocação com um filtro quota_metric em nomes de Cloud TPU.

Se quiser usar o Metrics Explorer para visualizar as métricas de um recurso monitorado, siga estas etapas:

  1. No Console do Google Cloud, acesse a página Metrics Explorer no Monitoring.
  2. Acessar o Metrics Explorer

  3. Selecione a guia Configuração.
  4. Expanda o menu Selecionar uma métrica, digite quota usage na barra de filtros e use os submenus para selecionar um tipo específico de recurso e métrica:
    1. No menu Recursos ativos, selecione Cota de consumidor.
    2. No menu Categorias de métrica ativa, selecione Cota.
    3. No menu Métricas ativas, selecione Uso da cota de alocação ou Uso da cota de taxa.
    4. Clique em Aplicar.
  5. Opcional: para configurar a visualização dos dados, adicione filtros e use os menus Agrupar por, Agregador e do tipo de gráfico. Por exemplo, é possível agrupar por rótulos de recurso ou métrica. Saiba mais em Selecionar métricas ao usar o Metrics Explorer.
  6. Opcional: altere as configurações do gráfico:
    • Para cotas e outras métricas que geram relatórios de uma amostra por dia, defina o período como pelo menos uma semana e o tipo de gráfico como Gráfico de barras empilhadas.
    • Para métricas de valor de distribuição, defina o tipo de gráfico como Gráfico de mapa de calor.

Da mesma forma, para ver os limites de cota ou os erros por cota excedida, primeiro selecione Consumer Quota como o tipo de recurso e, em seguida, selecione Quota limit ou Quota exceeded error.

Depois de encontrar as informações de uso de cota que você queria, use o Cloud Monitoring para criar painéis personalizados e alertas para ajudar você a monitorar e manter um aplicativo robusto. Para mais informações, consulte os documentos a seguir:

Para ver exemplos de políticas de alertas específicas de cotas, consulte Como usar métricas de cota.

O guia de referência do Cloud Monitoring inclui uma referência detalhada para métricas de cota.

Verificar o suporte à métrica de cotas

Nem todos os serviços aceitam as métricas de cota no Cloud Monitoring. Para ver as métricas de cota aplicáveis a serviços compatíveis, selecione Cotas do consumidor como o tipo de recurso ao criar um gráfico ou uma política de alertas. A visualização não mostrará os serviços que não forem desse tipo.

  • Os serviços comuns compatíveis com as métricas de cota incluem Compute Engine, Dataflow, Cloud Spanner, Pub/Sub, Cloud Vision, Speech-to-Text, Cloud Monitoring e Cloud Logging.

  • Os serviços comuns que não são compatíveis com as métricas de cota incluem o App Engine, Cloud Storage e Cloud SQL.

Erros de cota

Se seu projeto exceder uma cota ao usar um serviço, o Google Cloud retornará um erro com base em como você acessou o serviço:

  • Se você tiver excedido uma cota com uma solicitação HTTP/REST, o Google Cloud retornará um código de status HTTP 429 TOO MANY REQUESTS.
  • Se você exceder uma cota com uma solicitação de API, o Google Cloud retornará um código de status HTTP 413 REQUEST ENTITY TOO LARGE.
  • Se você tiver excedido uma cota usando gRPC, o Google Cloud retornará um erro ResourceExhausted. A forma como esse erro aparecerá para você depende do serviço.
  • Se você excedeu uma cota usando um comando da CLI do Google Cloud, a CLI gcloud gera uma mensagem de erro que excede a cota e retorna com o código de saída 1.

As cotas de taxa são redefinidas após um intervalo de tempo predefinido específico de cada serviço. Para mais informações, consulte a documentação de cotas do serviço específico.

Se você quiser receber um alerta quando ocorrerem erros no futuro, crie alertas personalizados para erros de cota específicos, conforme descrito em Como monitorar as métricas da cota.