Ajustador de quotas

Este documento descreve como ajustar as quotas através do sistema de ajuste de quotas.

O ajustador de quotas observa o seu consumo de recursos e envia proativamente pedidos de ajuste de quotas em seu nome. A monitorização da utilização dos recursos e o envio de pedidos de ajuste de quota de forma proativa evitam interrupções causadas pelo alcance do valor da quota. A utilização do ajustador de quota reduz a necessidade de monitorizar aumentos não planeados na utilização de recursos e permite-lhe enviar menos pedidos manuais de ajustes de quota.

Como funciona o ajustador de quotas

Quando ativa o ajustador de quotas, este monitoriza todas as quotas aplicáveis e aplica a seguinte lógica:

  • O ajustador de quota verifica se a utilização máxima se aproximou do valor da quota durante uma duração especificada.
  • Se for o caso, o ajustador de quota tenta aumentar o valor da quota (normalmente, cerca de 10 a 20%).

Se for possível aumentar o valor da quota, o aumento é aprovado e o valor é ajustado. Pode continuar a pedir manualmente aumentos dos valores da quota em qualquer altura, quer o ajuste da quota esteja ativado ou não.

O ajustador de quotas apenas envia pedidos de ajuste de quotas para aumentar o valor de uma quota. Não tenta diminuir o valor. Para quotas que têm um limite máximo de quota manual, o ajustador de quotas não envia pedidos de ajuste de quotas.

Pode ver os pedidos feitos pelo ajustador de quotas na página Quotas e limites do sistema da Google Cloud consola. Também pode configurar alertas para monitorizar as alterações iniciadas pelo ajuste de quota.

Limitações

O ajustador de quotas tem as seguintes limitações:

  • As definições do ajustador de quota só estão disponíveis por projeto.
  • As definições do ajustador de quota só estão acessíveis a partir da Google Cloud consola.
  • O ajuste de quota não está disponível para todas as quotas. Para saber mais, consulte a secção Disponibilidade neste documento.

Disponibilidade

A disponibilidade do ajuste de quota depende do seu Google Cloud projeto e só está disponível para algumas Google Cloud quotas.

Elegibilidade com base no histórico de utilização

O ajuste de quotas requer um volume suficiente de dados de utilização históricos para determinar com precisão quando pedir quotas adicionais. Por este motivo, a opção para ativar o ajuste de quota só está disponível em projetos com atividade do histórico suficiente para suportar previsões precisas.

Quotas suportadas

O ajustador de quotas não está disponível para todas as Google Cloud quotas. Um serviço pode suportar o ajuste de quotas para todas, algumas ou nenhuma das respetivas quotas. Google Cloud Se ativar o ajustador de quotas no seu projeto, este aplica-se a todas as quotas suportadas.

Quando um Google Cloud serviço adiciona ou expande o suporte do ajustador de quotas para as respetivas quotas, o ajustador de quotas monitoriza e ajusta automaticamente estas quotas suportadas recentemente para o seu projeto. Isto acontece mesmo que estas quotas específicas não fossem suportadas quando ativou inicialmente o ajuste de quotas.

A tabela seguinte apresenta as quotas suportadas pelo ajustador de quotas.

Serviço Quotas
API Artifact Registry Pedidos por projeto na multirregião da Ásia por minuto
API Artifact Registry Pedidos por projeto na multirregião da Europa por minuto
API Artifact Registry Pedidos por projeto na multirregião dos EUA por minuto
API Artifact Registry Pedidos por projeto por região por minuto por região
API Cloud Build Criação e operação de pedidos GET por minuto
API Cloud Build Crie e opere pedidos GET por minuto por utilizador
API Cloud Build CPUs de compilação simultânea (conjunto predefinido regional)
API Cloud Build Compilações simultâneas (conjunto predefinido não regional)
Cloud Key Management Service API Pedidos criptográficos por minuto
Cloud Key Management Service API Pedidos de leitura por minuto
Cloud Key Management Service API Pedidos de escrita por minuto
Cloud Logging API Bytes de gravação de registos por minuto por região
Cloud Resource Manager API Pedidos de leitura por minuto
Cloud Run Admin API Pedidos de execução de tarefas por minuto por região
Cloud Run Admin API Pedidos de leitura por minuto por região
Cloud Run Admin API Atribuição total de CPU, em milivCPU, por projeto por região
Cloud Run Admin API Pedidos de escrita por minuto por região
Cloud Trace API Pedidos de escrita (gratuitos) por minuto
API Compute Engine Grupos de afinidades
API Compute Engine Contentores de back-end
API Compute Engine CPUs C2
API Compute Engine CPUs C2D
API Compute Engine CPUs C3
API Compute Engine Compromissos
API Compute Engine CPUs A2 comprometidas
API Compute Engine CPUs comprometidas
API Compute Engine Licenças alocadas
API Compute Engine Disco SSD local comprometido reservado (GB)
API Compute Engine CPUs M3 comprometidas
API Compute Engine CPUs otimizadas para memória comprometida
API Compute Engine CPUs N2 comprometidas
API Compute Engine CPUs N2D comprometidas
API Compute Engine CPUs T2D comprometidas
API Compute Engine CPUs
API Compute Engine CPUs por família de VMs
API Compute Engine Projetos de serviço de rede entre projetos
API Compute Engine Encaminhamentos estáticos personalizados por rede VPC
API Compute Engine Serviços de back-end do balanceador de carga de rede de encaminhamento externo
API Compute Engine Regras de encaminhamento do balanceador de carga de rede de passagem externo
API Compute Engine Regras de encaminhamento de protocolos externos
API Compute Engine Regras de firewall
API Compute Engine Regras de encaminhamento
API Compute Engine Serviços de back-end geridos externamente globais
API Compute Engine Regras de encaminhamento geridas externamente globais
API Compute Engine Serviços de back-end do LB de proxy externo global
API Compute Engine Serviços de back-end do diretor de tráfego interno global
API Compute Engine Quantidade de GPUs por família de GPUs
API Compute Engine GPUs (todas as regiões)
API Compute Engine Verificações de funcionamento
API Compute Engine Imagens
API Compute Engine Endereços IP em utilização
API Compute Engine Endereços IPv4 externos regionais em utilização
API Compute Engine Agendamentos de instantâneos em utilização
API Compute Engine Grupos de instâncias
API Compute Engine Modelos de instâncias
API Compute Engine Instâncias por grupo de peering
API Compute Engine Instâncias por rede da VPC
API Compute Engine Endereços IP internos
API Compute Engine Serviços de back-end do balanceador de carga de rede de encaminhamento interno
API Compute Engine Regras de encaminhamento do balanceador de carga de rede de passagem interna por grupo de peering
API Compute Engine Regras de encaminhamento do balanceador de carga de rede de encaminhamento interno por rede da VPC
API Compute Engine Aliases de IP por grupo de peering
API Compute Engine Alias de IP por rede VPC
API Compute Engine Disco SSD local por família de VMs (GB)
API Compute Engine CPUs M1
API Compute Engine CPUs M2
API Compute Engine CPUs M3
API Compute Engine Grupos de instâncias geridas
API Compute Engine CPUs N2
API Compute Engine CPUs N2D
API Compute Engine Grupos de pontos finais da rede
API Compute Engine Políticas de firewall de rede
API Compute Engine Atributos de regras da política de segurança do equilíbrio de carga de rede
API Compute Engine Políticas de segurança do balanceamento de carga de rede
API Compute Engine Redes
API Compute Engine CPUs NVIDIA A2
API Compute Engine Intercâmbios por rede da VPC
API Compute Engine IOPS do Persistent Disk
API Compute Engine Disco persistente SSD (GB)
API Compute Engine Disco persistente padrão (GB)
API Compute Engine CPUs preemptivas
API Compute Engine SSD local preemptível (GB)
API Compute Engine GPUs NVIDIA A100 de 80 GB preemptíveis
API Compute Engine GPUs NVIDIA A100 preemptíveis
API Compute Engine GPUs NVIDIA H100 preemptíveis
API Compute Engine GPUs NVIDIA H100 MEGA preemptíveis
API Compute Engine GPUs NVIDIA K80 preemptíveis
API Compute Engine GPUs NVIDIA L4 preemptíveis
API Compute Engine GPUs de estação de trabalho virtual NVIDIA L4 preemptíveis
API Compute Engine GPUs NVIDIA P100 preemptíveis
API Compute Engine GPUs de estação de trabalho virtual NVIDIA P100 preemptíveis
API Compute Engine GPUs NVIDIA P4 preemptíveis
API Compute Engine GPUs de estação de trabalho virtual NVIDIA P4 preemptíveis
API Compute Engine GPUs NVIDIA T4 preemptíveis
API Compute Engine GPUs de estação de trabalho virtual NVIDIA T4 preemptíveis
API Compute Engine GPUs NVIDIA V100 preemptíveis
API Compute Engine Prefixos públicos anunciados
API Compute Engine Serviços de back-end geridos externamente regionais
API Compute Engine Regras de encaminhamento geridas externas regionais por região por rede da VPC
API Compute Engine Modelos de instâncias regionais
API Compute Engine Serviços de back-end geridos internos regionais
API Compute Engine Serviços de back-end do diretor de tráfego interno regional
API Compute Engine Grupos de instâncias geridas regionais
API Compute Engine Políticas de segurança regionais
API Compute Engine Regras de políticas de segurança regionais com uma condição de correspondência avançada
API Compute Engine Proxies TCP de destino regionais
API Compute Engine Routers
API Compute Engine Trajetos
API Compute Engine Políticas de segurança
API Compute Engine Regras da política de segurança
API Compute Engine Regras de idioma das regras da política de segurança
API Compute Engine Instantâneos
API Compute Engine Certificados SSL
API Compute Engine Endereços IP estáticos BYOIP
API Compute Engine Endereços IP estáticos
API Compute Engine Intervalos de sub-redes por grupo de peering
API Compute Engine Intervalos de sub-redes por rede da VPC
API Compute Engine CPUs T2A
API Compute Engine CPUs T2D
API Compute Engine Proxies HTTP de destino
API Compute Engine Proxies HTTPS de destino
API Compute Engine Proxies SSL de destino
API Compute Engine Proxies TCP de destino
API Compute Engine Gateways de VPN de destino
API Compute Engine Total de discos SSD locais reservados (GB)
API Compute Engine Mapas de URLs
API Compute Engine Instâncias de VMs
API Compute Engine Gateways de VPN
API Compute Engine Túneis de VPN
Ligue a API do gateway Pedidos de ligação de gateway por minuto
Dialogflow API Todos os outros pedidos por minuto
API Filestore Cópias de segurança por região
API Filestore Capacidade do HDD básico (padrão) (GB) por região
API Filestore Capacidade do SSD básico (Premium) (GB) por região
API Filestore Capacidade zonal e regional de 1 a 10 TiB (Enterprise) (GB) por região
API Filestore Capacidade zonal e regional de 10 a 100 TiB (alta escala) (GB) por região
Google Cloud API Memorystore for Redis Capacidade total do Redis (GB) por região
Google Cloud API Memorystore for Redis Total de unidades do Redis Cluster por projeto por região
API Memorystore Total de unidades do Memorystore por projeto por região
API Vertex AI CPUs de publicação de modelos personalizados por região
API Vertex AI Publicação de modelos personalizados com GPUs Nvidia T4 por região
API Vertex AI Treino de modelos personalizados com GPUs Nvidia T4 por região
API Vertex AI Gere pedidos de conteúdo por minuto por projeto por modelo base
API Vertex AI

Pedidos de previsão online regionais por minuto por projeto por modelo base

Nota: para ver a lista completa de dimensões disponíveis, expanda esta entrada na Google Cloud consola.

API Vertex AI Pedidos de gestão de recursos (CRUD) por minuto por região
API Vertex AI Restrições de núcleos de pods de TPUs V3 de preparação de imagens

Ative o ajustador de quotas

Para ativar o ajuste de quotas, tem de ter as seguintes autorizações de IAM:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Para ativar o ajustador de quotas no seu Google Cloud projeto da consola, selecione o separador adequado e siga as instruções:

Consola

Para ativar o ajustador de quota no seu Google Cloud projeto a partir da Google Cloud consola, siga estes passos:

  1. Na Google Cloud consola, aceda à página IAM e administração > Quotas e limites do sistema:

    Aceda a Quotas e limites do sistema

  2. Clique no separador Configurações.
  3. Clique no botão ativar/desativar Ativar.

Quando a coluna Estado indica Ativado, o ajuste de quota monitoriza a sua utilização e emite pedidos de ajuste de quota quando a utilização de recursos se aproxima do valor da quota.

REST

  1. Para ativar o ajustador de quotas no seu Google Cloud projeto através da API REST (pré-visualização), faça um pedido HTTP para atualizar as definições do ajustador de quotas:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. No corpo do pedido, especifique o recurso de definições do ajustador de quota e defina o campo enablement como ENABLED. Também pode especificar uma ETag, mas fazê-lo é opcional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: ENABLED
      etag: OPTIONAL_ETAG
    }
    

    Substitua o seguinte:

    • PROJECT_ID_OR_NUMBER: o ID do projeto ou o número do projeto para o qual quer ativar o ajustador de quotas.
    • OPTIONAL_ETAG: uma string ETag opcional para as definições do ajustador de quota.

    Esta ação atualiza o estado de ativação para enabled.

gcloud

Para ativar o ajuste de quota no seu Google Cloud projeto através da CLI gcloud (pré-visualização), siga estes passos:

  1. Autentique com a CLI gcloud:

    gcloud auth login
    
  2. Ative as definições do ajustador de quotas:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
    

    Substitua PROJECT_ID_OR_NUMBER pelo ID do projeto ou pelo número do projeto para o qual quer ativar o ajustador de quota.

  3. Valide o estado de ativação:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Desde que tenha as autorizações necessárias, esta função devolve o estado como enabled.

Veja pedidos de ajuste de quota

Para ver pedidos de ajuste de quota, tem de ter as seguintes autorizações de IAM:

  • resourcemanager.projects.get
  • serviceusage.services.list
  • serviceusage.quotas.get

Para ver as solicitações de ajuste de quota emitidas pelo ajustador de quotas:

  1. Na Google Cloud consola, aceda à página IAM e administração > Quotas e limites do sistema:

    Aceda a Quotas e limites do sistema

  2. Clique no separador Pedidos de aumento. A vista Aumentar pedidos mostra os pedidos de aumento para o seu projeto, incluindo os aumentos pedidos manualmente e os pedidos emitidos pelo ajustador de quotas.
  3. Clique no campo Filtro.
  4. Selecione Tipo no menu e introduza Auto. Este filtro procura pedidos feitos pelo ajustador de quotas.

Configure alertas do ajustador de quotas

Para receber alertas do ajuste de quota:

  1. Na Google Cloud consola, aceda à página IAM e administração > Quotas e limites do sistema:

    Aceda a Quotas e limites do sistema

  2. Clique no separador Configurações.
  3. Clique em Criar alerta.
  4. Escolha um ou ambos os modelos de alerta:
    1. Todos os ajustes do Quota Adjuster enviam um alerta sempre que o Quota Adjuster emite um pedido de ajuste de quota para o projeto.
    2. Erros e falhas do ajustador de quotas envia alertas apenas quando o ajustador de quotas tenta aumentar um valor de quota e não o consegue fazer.
  5. Opcional: ajuste os valores predefinidos para o período mínimo entre alertas e a duração do encerramento automático de incidentes clicando em Mostrar opções.
  6. Selecione o canal de notificação para receber alertas. Para ajustar as definições do canal de notificação ou criar um novo canal de notificação, clique em Gerir canais de notificação.
  7. Clique em Criar.

Edite ou elimine alertas do ajustador de quota

Pode editar ou eliminar alertas do ajustador de quota na Google Cloud consola:

  1. Aceda à página Políticas na consola do Cloud Monitoring.

    Aceder às políticas

  2. Pesquise a sua política de alertas do ajustador de quotas. As políticas de alertas do ajustador de quotas têm os seguintes nomes:

    • Quota adjuster errors and failures
    • All adjustments by quota adjuster
  3. Na linha que mostra a política de alertas do ajustador de quotas, clique em Ver mais.

  4. Clique em Editar ou Eliminar.

Desative o ajustador de quotas

Para desativar o ajuste de quotas, tem de ter as seguintes autorizações do IAM:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Para desativar o ajustador de quotas no seu Google Cloud projeto da consola, selecione o separador adequado e siga as instruções:

Consola

  1. Na Google Cloud consola, aceda à página IAM e administração > Quotas e limites do sistema:

    Aceda a Quotas e limites do sistema

  2. Clique no separador Configurações.
  3. Clique no botão ativar/desativar Ativar. O botão para ativar/desativar fica cinzento.

Quando o botão está cinzento e a coluna de estado indica Não ativado, o ajustador de quota deixa de monitorizar a sua utilização ou emitir pedidos de ajuste de quota.

REST

  1. Para desativar o ajuste de quota no seu Google Cloud projeto através da API REST (pré-visualização), faça um pedido HTTP para atualizar as definições do ajuste de quota:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. No corpo do pedido, especifique o recurso de definições do ajustador de quota e defina o campo enablement como DISABLED. Também pode especificar uma ETag, mas fazê-lo é opcional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: DISABLED
      etag: OPTIONAL_ETAG
    }
    

    Substitua o seguinte:

    • PROJECT_ID_OR_NUMBER: o ID do projeto ou o número do projeto para o qual quer desativar o ajustador de quotas.
    • OPTIONAL_ETAG: uma string ETag opcional para as definições do ajustador de quota.

    Esta ação atualiza o estado de ativação para disabled.

gcloud

Para desativar o ajuste de quota no seu Google Cloud projeto através da CLI gcloud (pré-visualização), siga estes passos:

  1. Autentique-se na CLI gcloud:

    gcloud auth login
    
  2. Desative as definições do ajustador de quotas:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
    

    Substitua PROJECT_ID_OR_NUMBER pelo ID do projeto ou pelo número do projeto para o qual quer desativar o ajustador de quota.

  3. Valide o estado de ativação:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Desde que tenha as autorizações necessárias, esta função devolve o estado como disabled.

Resolva problemas de recusas de aumentos de quotas

É possível que um aumento da quota iniciado pelo ajustador da quota seja recusado. Isto ocorre por vezes quando Google Cloud não consegue aumentar a quota de um projeto, um recurso ou uma região específicos para além de um determinado valor. Ainda pode pedir um aumento manual da quota nestes cenários.

Para receber notificações quando um pedido de ajuste de quota feito pelo ajustador de quota for recusado, configure alertas do ajustador de quota.