Este documento descreve como ajustar as quotas através do sistema de ajuste de quotas.
O ajustador de quotas observa o seu consumo de recursos e envia proativamente pedidos de ajuste de quotas em seu nome. A monitorização da utilização dos recursos e o envio de pedidos de ajuste de quota de forma proativa evitam interrupções causadas pelo alcance do valor da quota. A utilização do ajustador de quota reduz a necessidade de monitorizar aumentos não planeados na utilização de recursos e permite-lhe enviar menos pedidos manuais de ajustes de quota.
Como funciona o ajustador de quotas
Quando ativa o ajustador de quotas, este monitoriza todas as quotas aplicáveis e aplica a seguinte lógica:
- O ajustador de quota verifica se a utilização máxima se aproximou do valor da quota durante uma duração especificada.
- Se for o caso, o ajustador de quota tenta aumentar o valor da quota (normalmente, cerca de 10 a 20%).
Se for possível aumentar o valor da quota, o aumento é aprovado e o valor é ajustado. Pode continuar a pedir manualmente aumentos dos valores da quota em qualquer altura, quer o ajuste da quota esteja ativado ou não.
O ajustador de quotas apenas envia pedidos de ajuste de quotas para aumentar o valor de uma quota. Não tenta diminuir o valor. Para quotas que têm um limite máximo de quota manual, o ajustador de quotas não envia pedidos de ajuste de quotas.
Pode ver os pedidos feitos pelo ajustador de quotas na página Quotas e limites do sistema da Google Cloud consola. Também pode configurar alertas para monitorizar as alterações iniciadas pelo ajuste de quota.
Limitações
O ajustador de quotas tem as seguintes limitações:
- As definições do ajustador de quota só estão disponíveis por projeto.
- As definições do ajustador de quota só estão acessíveis a partir da Google Cloud consola.
- O ajuste de quota não está disponível para todas as quotas. Para saber mais, consulte a secção Disponibilidade neste documento.
Disponibilidade
A disponibilidade do ajuste de quota depende do seu Google Cloud projeto e só está disponível para algumas Google Cloud quotas.
Elegibilidade com base no histórico de utilização
O ajuste de quotas requer um volume suficiente de dados de utilização históricos para determinar com precisão quando pedir quotas adicionais. Por este motivo, a opção para ativar o ajuste de quota só está disponível em projetos com atividade do histórico suficiente para suportar previsões precisas.
Quotas suportadas
O ajustador de quotas não está disponível para todas as Google Cloud quotas. Um serviço pode suportar o ajuste de quotas para todas, algumas ou nenhuma das respetivas quotas. Google Cloud Se ativar o ajustador de quotas no seu projeto, este aplica-se a todas as quotas suportadas.
Quando um Google Cloud serviço adiciona ou expande o suporte do ajustador de quotas para as respetivas quotas, o ajustador de quotas monitoriza e ajusta automaticamente estas quotas suportadas recentemente para o seu projeto. Isto acontece mesmo que estas quotas específicas não fossem suportadas quando ativou inicialmente o ajuste de quotas.
A tabela seguinte apresenta as quotas suportadas pelo ajustador de quotas.
Serviço | Quotas |
---|---|
API Artifact Registry | Pedidos por projeto na multirregião da Ásia por minuto |
API Artifact Registry | Pedidos por projeto na multirregião da Europa por minuto |
API Artifact Registry | Pedidos por projeto na multirregião dos EUA por minuto |
API Artifact Registry | Pedidos por projeto por região por minuto por região |
API Cloud Build | Criação e operação de pedidos GET por minuto |
API Cloud Build | Crie e opere pedidos GET por minuto por utilizador |
API Cloud Build | CPUs de compilação simultânea (conjunto predefinido regional) |
API Cloud Build | Compilações simultâneas (conjunto predefinido não regional) |
Cloud Key Management Service API | Pedidos criptográficos por minuto |
Cloud Key Management Service API | Pedidos de leitura por minuto |
Cloud Key Management Service API | Pedidos de escrita por minuto |
Cloud Logging API | Bytes de gravação de registos por minuto por região |
Cloud Resource Manager API | Pedidos de leitura por minuto |
Cloud Run Admin API | Pedidos de execução de tarefas por minuto por região |
Cloud Run Admin API | Pedidos de leitura por minuto por região |
Cloud Run Admin API | Atribuição total de CPU, em milivCPU, por projeto por região |
Cloud Run Admin API | Pedidos de escrita por minuto por região |
Cloud Trace API | Pedidos de escrita (gratuitos) por minuto |
API Compute Engine | Grupos de afinidades |
API Compute Engine | Contentores de back-end |
API Compute Engine | CPUs C2 |
API Compute Engine | CPUs C2D |
API Compute Engine | CPUs C3 |
API Compute Engine | Compromissos |
API Compute Engine | CPUs A2 comprometidas |
API Compute Engine | CPUs comprometidas |
API Compute Engine | Licenças alocadas |
API Compute Engine | Disco SSD local comprometido reservado (GB) |
API Compute Engine | CPUs M3 comprometidas |
API Compute Engine | CPUs otimizadas para memória comprometida |
API Compute Engine | CPUs N2 comprometidas |
API Compute Engine | CPUs N2D comprometidas |
API Compute Engine | CPUs T2D comprometidas |
API Compute Engine | CPUs |
API Compute Engine | CPUs por família de VMs |
API Compute Engine | Projetos de serviço de rede entre projetos |
API Compute Engine | Encaminhamentos estáticos personalizados por rede VPC |
API Compute Engine | Serviços de back-end do balanceador de carga de rede de encaminhamento externo |
API Compute Engine | Regras de encaminhamento do balanceador de carga de rede de passagem externo |
API Compute Engine | Regras de encaminhamento de protocolos externos |
API Compute Engine | Regras de firewall |
API Compute Engine | Regras de encaminhamento |
API Compute Engine | Serviços de back-end geridos externamente globais |
API Compute Engine | Regras de encaminhamento geridas externamente globais |
API Compute Engine | Serviços de back-end do LB de proxy externo global |
API Compute Engine | Serviços de back-end do diretor de tráfego interno global |
API Compute Engine | Quantidade de GPUs por família de GPUs |
API Compute Engine | GPUs (todas as regiões) |
API Compute Engine | Verificações de funcionamento |
API Compute Engine | Imagens |
API Compute Engine | Endereços IP em utilização |
API Compute Engine | Endereços IPv4 externos regionais em utilização |
API Compute Engine | Agendamentos de instantâneos em utilização |
API Compute Engine | Grupos de instâncias |
API Compute Engine | Modelos de instâncias |
API Compute Engine | Instâncias por grupo de peering |
API Compute Engine | Instâncias por rede da VPC |
API Compute Engine | Endereços IP internos |
API Compute Engine | Serviços de back-end do balanceador de carga de rede de encaminhamento interno |
API Compute Engine | Regras de encaminhamento do balanceador de carga de rede de passagem interna por grupo de peering |
API Compute Engine | Regras de encaminhamento do balanceador de carga de rede de encaminhamento interno por rede da VPC |
API Compute Engine | Aliases de IP por grupo de peering |
API Compute Engine | Alias de IP por rede VPC |
API Compute Engine | Disco SSD local por família de VMs (GB) |
API Compute Engine | CPUs M1 |
API Compute Engine | CPUs M2 |
API Compute Engine | CPUs M3 |
API Compute Engine | Grupos de instâncias geridas |
API Compute Engine | CPUs N2 |
API Compute Engine | CPUs N2D |
API Compute Engine | Grupos de pontos finais da rede |
API Compute Engine | Políticas de firewall de rede |
API Compute Engine | Atributos de regras da política de segurança do equilíbrio de carga de rede |
API Compute Engine | Políticas de segurança do balanceamento de carga de rede |
API Compute Engine | Redes |
API Compute Engine | CPUs NVIDIA A2 |
API Compute Engine | Intercâmbios por rede da VPC |
API Compute Engine | IOPS do Persistent Disk |
API Compute Engine | Disco persistente SSD (GB) |
API Compute Engine | Disco persistente padrão (GB) |
API Compute Engine | CPUs preemptivas |
API Compute Engine | SSD local preemptível (GB) |
API Compute Engine | GPUs NVIDIA A100 de 80 GB preemptíveis |
API Compute Engine | GPUs NVIDIA A100 preemptíveis |
API Compute Engine | GPUs NVIDIA H100 preemptíveis |
API Compute Engine | GPUs NVIDIA H100 MEGA preemptíveis |
API Compute Engine | GPUs NVIDIA K80 preemptíveis |
API Compute Engine | GPUs NVIDIA L4 preemptíveis |
API Compute Engine | GPUs de estação de trabalho virtual NVIDIA L4 preemptíveis |
API Compute Engine | GPUs NVIDIA P100 preemptíveis |
API Compute Engine | GPUs de estação de trabalho virtual NVIDIA P100 preemptíveis |
API Compute Engine | GPUs NVIDIA P4 preemptíveis |
API Compute Engine | GPUs de estação de trabalho virtual NVIDIA P4 preemptíveis |
API Compute Engine | GPUs NVIDIA T4 preemptíveis |
API Compute Engine | GPUs de estação de trabalho virtual NVIDIA T4 preemptíveis |
API Compute Engine | GPUs NVIDIA V100 preemptíveis |
API Compute Engine | Prefixos públicos anunciados |
API Compute Engine | Serviços de back-end geridos externamente regionais |
API Compute Engine | Regras de encaminhamento geridas externas regionais por região por rede da VPC |
API Compute Engine | Modelos de instâncias regionais |
API Compute Engine | Serviços de back-end geridos internos regionais |
API Compute Engine | Serviços de back-end do diretor de tráfego interno regional |
API Compute Engine | Grupos de instâncias geridas regionais |
API Compute Engine | Políticas de segurança regionais |
API Compute Engine | Regras de políticas de segurança regionais com uma condição de correspondência avançada |
API Compute Engine | Proxies TCP de destino regionais |
API Compute Engine | Routers |
API Compute Engine | Trajetos |
API Compute Engine | Políticas de segurança |
API Compute Engine | Regras da política de segurança |
API Compute Engine | Regras de idioma das regras da política de segurança |
API Compute Engine | Instantâneos |
API Compute Engine | Certificados SSL |
API Compute Engine | Endereços IP estáticos BYOIP |
API Compute Engine | Endereços IP estáticos |
API Compute Engine | Intervalos de sub-redes por grupo de peering |
API Compute Engine | Intervalos de sub-redes por rede da VPC |
API Compute Engine | CPUs T2A |
API Compute Engine | CPUs T2D |
API Compute Engine | Proxies HTTP de destino |
API Compute Engine | Proxies HTTPS de destino |
API Compute Engine | Proxies SSL de destino |
API Compute Engine | Proxies TCP de destino |
API Compute Engine | Gateways de VPN de destino |
API Compute Engine | Total de discos SSD locais reservados (GB) |
API Compute Engine | Mapas de URLs |
API Compute Engine | Instâncias de VMs |
API Compute Engine | Gateways de VPN |
API Compute Engine | Túneis de VPN |
Ligue a API do gateway | Pedidos de ligação de gateway por minuto |
Dialogflow API | Todos os outros pedidos por minuto |
API Filestore | Cópias de segurança por região |
API Filestore | Capacidade do HDD básico (padrão) (GB) por região |
API Filestore | Capacidade do SSD básico (Premium) (GB) por região |
API Filestore | Capacidade zonal e regional de 1 a 10 TiB (Enterprise) (GB) por região |
API Filestore | Capacidade zonal e regional de 10 a 100 TiB (alta escala) (GB) por região |
Google Cloud API Memorystore for Redis | Capacidade total do Redis (GB) por região |
Google Cloud API Memorystore for Redis | Total de unidades do Redis Cluster por projeto por região |
API Memorystore | Total de unidades do Memorystore por projeto por região |
API Vertex AI | CPUs de publicação de modelos personalizados por região |
API Vertex AI | Publicação de modelos personalizados com GPUs Nvidia T4 por região |
API Vertex AI | Treino de modelos personalizados com GPUs Nvidia T4 por região |
API Vertex AI | Gere pedidos de conteúdo por minuto por projeto por modelo base |
API Vertex AI | Pedidos de previsão online regionais por minuto por projeto por modelo base Nota: para ver a lista completa de dimensões disponíveis, expanda esta entrada na Google Cloud consola. |
API Vertex AI | Pedidos de gestão de recursos (CRUD) por minuto por região |
API Vertex AI | Restrições de núcleos de pods de TPUs V3 de preparação de imagens |
Ative o ajustador de quotas
Para ativar o ajuste de quotas, tem de ter as seguintes autorizações de IAM:
cloudquotas.quotas.update
cloudquotas.quotas.get
Para ativar o ajustador de quotas no seu Google Cloud projeto da consola, selecione o separador adequado e siga as instruções:
Consola
Para ativar o ajustador de quota no seu Google Cloud projeto a partir da Google Cloud consola, siga estes passos:
- Na Google Cloud consola, aceda à página IAM e administração > Quotas e limites do sistema:
- Clique no separador Configurações.
- Clique no botão ativar/desativar Ativar.
Quando a coluna Estado indica Ativado, o ajuste de quota monitoriza a sua utilização e emite pedidos de ajuste de quota quando a utilização de recursos se aproxima do valor da quota.
REST
Para ativar o ajustador de quotas no seu Google Cloud projeto através da API REST (pré-visualização), faça um pedido HTTP para atualizar as definições do ajustador de quotas:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
No corpo do pedido, especifique o recurso de definições do ajustador de quota e defina o campo
enablement
comoENABLED
. Também pode especificar uma ETag, mas fazê-lo é opcional:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: ENABLED etag: OPTIONAL_ETAG }
Substitua o seguinte:
PROJECT_ID_OR_NUMBER
: o ID do projeto ou o número do projeto para o qual quer ativar o ajustador de quotas.OPTIONAL_ETAG
: uma string ETag opcional para as definições do ajustador de quota.
Esta ação atualiza o estado de ativação para
enabled
.
gcloud
Para ativar o ajuste de quota no seu Google Cloud projeto através da CLI gcloud (pré-visualização), siga estes passos:
Autentique com a CLI gcloud:
gcloud auth login
Ative as definições do ajustador de quotas:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
Substitua
PROJECT_ID_OR_NUMBER
pelo ID do projeto ou pelo número do projeto para o qual quer ativar o ajustador de quota.Valide o estado de ativação:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
Desde que tenha as autorizações necessárias, esta função devolve o estado como
enabled
.
Veja pedidos de ajuste de quota
Para ver pedidos de ajuste de quota, tem de ter as seguintes autorizações de IAM:
resourcemanager.projects.get
serviceusage.services.list
serviceusage.quotas.get
Para ver as solicitações de ajuste de quota emitidas pelo ajustador de quotas:
- Na Google Cloud consola, aceda à página IAM e administração > Quotas e limites do sistema:
- Clique no separador Pedidos de aumento. A vista Aumentar pedidos mostra os pedidos de aumento para o seu projeto, incluindo os aumentos pedidos manualmente e os pedidos emitidos pelo ajustador de quotas.
- Clique no campo Filtro.
- Selecione Tipo no menu e introduza
Auto
. Este filtro procura pedidos feitos pelo ajustador de quotas.
Configure alertas do ajustador de quotas
Para receber alertas do ajuste de quota:
- Na Google Cloud consola, aceda à página IAM e administração > Quotas e limites do sistema:
- Clique no separador Configurações.
- Clique em Criar alerta.
- Escolha um ou ambos os modelos de alerta:
- Todos os ajustes do Quota Adjuster enviam um alerta sempre que o Quota Adjuster emite um pedido de ajuste de quota para o projeto.
- Erros e falhas do ajustador de quotas envia alertas apenas quando o ajustador de quotas tenta aumentar um valor de quota e não o consegue fazer.
- Opcional: ajuste os valores predefinidos para o período mínimo entre alertas e a duração do encerramento automático de incidentes clicando em Mostrar opções.
- Selecione o canal de notificação para receber alertas. Para ajustar as definições do canal de notificação ou criar um novo canal de notificação, clique em Gerir canais de notificação.
- Clique em Criar.
Edite ou elimine alertas do ajustador de quota
Pode editar ou eliminar alertas do ajustador de quota na Google Cloud consola:
Aceda à página Políticas na consola do Cloud Monitoring.
Pesquise a sua política de alertas do ajustador de quotas. As políticas de alertas do ajustador de quotas têm os seguintes nomes:
Quota adjuster errors and failures
All adjustments by quota adjuster
Na linha que mostra a política de alertas do ajustador de quotas, clique em
Ver mais.Clique em Editar ou Eliminar.
Desative o ajustador de quotas
Para desativar o ajuste de quotas, tem de ter as seguintes autorizações do IAM:
cloudquotas.quotas.update
cloudquotas.quotas.get
Para desativar o ajustador de quotas no seu Google Cloud projeto da consola, selecione o separador adequado e siga as instruções:
Consola
- Na Google Cloud consola, aceda à página IAM e administração > Quotas e limites do sistema:
- Clique no separador Configurações.
- Clique no botão ativar/desativar Ativar. O botão para ativar/desativar fica cinzento.
Quando o botão está cinzento e a coluna de estado indica Não ativado, o ajustador de quota deixa de monitorizar a sua utilização ou emitir pedidos de ajuste de quota.
REST
Para desativar o ajuste de quota no seu Google Cloud projeto através da API REST (pré-visualização), faça um pedido HTTP para atualizar as definições do ajuste de quota:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
No corpo do pedido, especifique o recurso de definições do ajustador de quota e defina o campo
enablement
comoDISABLED
. Também pode especificar uma ETag, mas fazê-lo é opcional:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: DISABLED etag: OPTIONAL_ETAG }
Substitua o seguinte:
PROJECT_ID_OR_NUMBER
: o ID do projeto ou o número do projeto para o qual quer desativar o ajustador de quotas.OPTIONAL_ETAG
: uma string ETag opcional para as definições do ajustador de quota.
Esta ação atualiza o estado de ativação para
disabled
.
gcloud
Para desativar o ajuste de quota no seu Google Cloud projeto através da CLI gcloud (pré-visualização), siga estes passos:
Autentique-se na CLI gcloud:
gcloud auth login
Desative as definições do ajustador de quotas:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
Substitua
PROJECT_ID_OR_NUMBER
pelo ID do projeto ou pelo número do projeto para o qual quer desativar o ajustador de quota.Valide o estado de ativação:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
Desde que tenha as autorizações necessárias, esta função devolve o estado como
disabled
.
Resolva problemas de recusas de aumentos de quotas
É possível que um aumento da quota iniciado pelo ajustador da quota seja recusado. Isto ocorre por vezes quando Google Cloud não consegue aumentar a quota de um projeto, um recurso ou uma região específicos para além de um determinado valor. Ainda pode pedir um aumento manual da quota nestes cenários.
Para receber notificações quando um pedido de ajuste de quota feito pelo ajustador de quota for recusado, configure alertas do ajustador de quota.