Cotas e limites do Cloud Monitoring

Neste documento, listamos as cotas e os limites do sistema que se aplicam Cloud Monitoring: As cotas especificam a quantidade de um recurso compartilhado e contável que você podem usar e são definidos pelos serviços do Google Cloud, como Cloud Monitoring: Os limites do sistema são valores fixos que não podem ser alterados.

O Google Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe quanto de um recurso do Google Cloud o projeto do Google Cloud pode usar. As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários do Google Cloud, impedindo a sobrecarga de serviços. As cotas também ajudam você a gerenciar seus próprios recursos do Google Cloud.

O sistema de cotas do Cloud faz o seguinte:

  • Monitora o consumo de produtos e serviços do Google Cloud.
  • Restringe o consumo desses recursos.
  • Fornece um meio de solicitar mudanças no valor da cota

Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso e a tarefa que você está tentando executar falha.

As cotas geralmente se aplicam ao projeto do nível Google Cloud. O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud, as cotas são compartilhadas entre todos os aplicativos e endereços IP.

Para ajustar a maioria das cotas, use o console do Google Cloud. Para mais informações, consulte Solicitar um ajuste de cota.

Também há limites do sistema para os recursos do Monitoring. Não é possível alterar os limites.

Métricas definidas pelo usuário

A página Gerenciamento de métricas do Cloud Monitoring fornece informações que podem ajudar você a controlar os gastos em métricas faturáveis sem afetar a observabilidade. A página Gerenciamento de métricas mostra as seguintes informações:

  • Volumes de ingestão para faturamento baseado em byte e amostra, em domínios de métricas e para métricas individuais.
  • Dados sobre rótulos e cardinalidade de métricas.
  • Número de leituras para cada métrica.
  • Uso de métricas em políticas de alertas e painéis personalizados.
  • Taxa de erros de gravação de métrica.

Você também pode usar o Gerenciamento de métricas para excluir métricas desnecessárias o que elimina o custo de ingestão. Para mais informações sobre a página Gerenciamento de métricas, consulte Confira e gerencie o uso de métricas.

Categoria Valor máximo
Descritores de métricas personalizadas por projeto1 10.000
Rótulos por descritor de métrica 30
Comprimento da string para chave de rótulo 100
Comprimento da string para valor de rótulo 1024
Séries temporais incluídas em uma solicitação de gravação2 200
Taxa em que os dados podem ser gravados em uma única série temporal3 Um ponto a cada 5 segundos
Buckets de histograma por métrica de distribuição personalizada 200
Descritores de métricas de carga de trabalho, do Prometheus e externas4 por projeto 25.000
Séries temporais ativas nas métricas personalizadas por recurso monitorado5 200.000
Séries temporais ativas nas métricas externas por recurso monitorado5 200.000
Séries temporais ativas no Prometheus por recurso monitorado5 1.000.000
Séries temporais ativas nas métricas externas por recurso monitorado5 200.000
Taxa em que os descritores de métrica podem ser criados 6.000 por minuto por projeto

1 Esse limite é dado pelo Cloud Monitoring. Outros serviços podem impor valores máximos mais baixos. As métricas personalizadas são gravadas em custom.googleapis.com.
2 Como é possível gravar somente um ponto de dados para cada série temporal de uma solicitação, esse limite também funciona como o número máximo de gravações por solicitação.
3 A API Cloud Monitoring exige que os horários de término dos pontos gravados em uma série temporal tenha pelo menos cinco segundos de intervalo. É possível gravar pontos de dados em lote em uma série temporal, desde que isso seja feito na ordem correta.
4 Métricas externas são aquelas gravadas em external.googleapis.com.
5 Uma série temporal fica ativa se você tiver gravado pontos de dados nela nas últimas 24 horas. O limite especificado na linha é o número total de série temporal ativas para um único recurso monitorado (por exemplo, uma única VM gce_instance ou um único contêiner k8s_container) em todas as métricas definidas pelo usuário métricas nessa linha (personalizada, carga de trabalho, Prometheus ou externa). O recurso monitorado global é uma exceção. Nele, o limite se aplica a cada métrica definida pelo usuário separadamente. Esse é um limite de segurança de todo o sistema, e não é personalizável.

Como monitorar limites e cotas da API

Categoria Valor máximo
Limites do uso da API

Para encontrar as cotas e os limites da API, siga um destes procedimentos:

Ciclo de vida dos tokens de página da API 24 horas

Sobre como monitorar as cotas da API

A API Monitoring tem limites de cotas para as taxas de solicitações de processamento e de consultas de séries temporais. As solicitações de processamento são chamadas que gravam dados de séries temporais, e as consultas são chamadas que retornam dados delas. Também há limites internos para outros endpoints da API Monitoring. Esses endpoints não foram feitos para processar altas taxas de solicitações.

Para reduzir o número de solicitações de API que você emite quando seus serviços gravam dados de série temporal, use uma solicitação de API para gravar dados de várias séries temporais. Recomendamos que você grave pelo menos 10 objetos por solicitação. Para mais informações sobre solicitações de API em lote, consulte timeSeries.create.

Se, depois de agrupar suas solicitações de API, você ainda precisar de uma Como monitorar os limites de cota da API, contato Suporte do Google Cloud.

Os outros limites são fixos conforme os detalhes nesta página.

Para mais informações, acesse Como trabalhar com cotas.

Retenção de dados

Os pontos de dados de métricas mais antigos que o período de armazenamento são excluídos das séries temporais.

Categoria Valor
Retenção de pontos de dados de tipos de métricas personalizadas, externas e de agente, incluindo:
  • Métricas personalizadas, prefixo custom.googleapis.com
  • Métricas do Google Cloud Managed Service para Prometheus, prefixo prometheus.googleapis.com2.
  • Métricas de agente, prefixo agent.googleapis.com, incluindo
    processes/count_by_state e processes/fork_state.
    As métricas processes restantes têm um período de armazenamento diferente; consulte a entrada a seguir.
  • Métricas externas, prefixo external.googleapis.com
  • OpenTelemetry e outras métricas de carga de trabalho: prefixo workload.googleapis.com
24 meses1
Retenção de pontos de dados de tipos de métricas de integridade do processo: agent.googleapis.com/processes,
, exceto count_by_state e fork_state, conforme observado na entrada anterior.
24 horas
Retenção de pontos de dados de todos os outros tipos de métricas, incluindo: 6 semanas
Ciclo de vida dos tokens de página da API 24 horas

1 Os dados de métricas são armazenados por 6 semanas em sua frequência de amostragem original e, em seguida, são amostrados em intervalos de 10 minutos para armazenamento estendido.
2 Os dados de métricas do Google Cloud Managed Service para Prometheus são armazenados para 1 semana na data original a frequência de amostragem, depois a amostragem é reduzida para intervalos de 1 minuto para o próximo cinco semanas, depois a amostragem é reduzida para intervalos de 10 minutos para armazenamento estendido.

Grupos de recursos

Categoria Valor
Número de grupos de recursos por escopo de métricas 500
Número máximo de grupos incluídos em um relatório por e-mail1 10

1 Ao configurar os relatórios por e-mail do Cloud Monitoring, é possível solicitar informações sobre a utilização dos grupos de recursos. Devido a uma limitação nos relatórios por e-mail, os relatórios gerados incluem informações de apenas 10 grupos.

Limites do projeto monitorado

O Cloud Monitoring tem suporte oficial para até 375 projetos do Google Cloud por escopo de métricas .

É possível adicionar até mil projetos do Google Cloud por escopo de métricas. mas você pode ter problemas de desempenho, especialmente ao consultar métricas ou dados históricos. O Cloud Monitoring garante consultas e gráficos com bom desempenho apenas para 375 projetos do Google Cloud por escopo de métricas.

Para aumentar a cota de projetos do Google Cloud por escopo de métricas, solicite um aumento da cota de "Projetos monitorados / Escopo de métricas de monitoramento". Consulte a documentação sobre como gerenciar sua cota para mais detalhes.

Limites na criação e atualização de descritores de métrica

O Cloud Monitoring aplica um limite de taxa por minuto na criação de novas métricas, na adição de novos nomes de rótulos a métricas existentes e na exclusão de métricas. Esse limite de taxa geralmente é atingido apenas na primeira integração com o Cloud Monitoring. Por exemplo, ao migrar uma implantação madura do Prometheus para o Cloud Monitoring. Esse não é um limite de taxa para a ingestão de pontos de dados. Essa limitação de taxa se aplica apenas ao criar métricas nunca vistas antes ou ao adicionar novos nomes de rótulos a métricas existentes.

Essa cota é fixa, mas os problemas são resolvidos automaticamente conforme novas métricas e rótulos de métrica são criados até o limite por minuto.

Limites para alertas

Categoria Valor Tipo de política1
Políticas de alertas (soma da métrica e do registro) por escopo de métricas 2 500 Métrica, Registro
Condições por política de alertas com base em métricas 6 Métrica
Condições por política de alertas baseada em SQL (prévia pública) 1 SQL
Período máximo que uma
condição de ausência de métrica avalia3
1 dia Métrica
Período máximo em que uma
condição de limite de métrica é avaliada3
23 horas e 30 minutos Métrica
Comprimento máximo do filtro usado
em uma condição de limite de métrica
2.048 caracteres Unicode Métrica
Número máximo de séries temporais
monitoradas por uma condição de previsão
64 Métrica
Janela de previsão mínima 1 hora (3.600 segundos) Métrica
Janela de previsão máxima 2,5 dias (216.000 segundos) Métrica
Canais de notificação por política de alertas 16 Métrica, Registro
Taxa máxima de notificações4 1 notificação a cada 5 minutos para cada política de alertas com base em registros Registro
Número máximo de notificações 20 notificações por dia para cada política de alertas com base em registros Registro
Número máximo de incidentes abertos simultaneamente
por política de alertas
1.000 Métrica
Período após o qual um incidente sem dados novos é
fechado automaticamente
7 dias Métrica
Duração máxima de um incidente, se ele não for fechado manualmente 7 dias Registro
Retenção de incidentes fechados 13 meses Não relevante
Retenção de incidentes abertos Indefinida Não relevante
Canais de notificação por escopo de métricas 4.000 Não relevante
Número máximo de políticas de alertas por adiamento 16 Métrica, Registro
Retenção de uma soneca 13 meses Não relevante
1Métrica: uma política de alertas com base em dados de métrica Registro: uma política de alertas baseada em mensagens de registro (alertas baseados em registros)
2Apigee e Apigee híbrida } estão profundamente integrados ao Cloud Monitoring. O limite de alerta para todos os níveis de assinatura da Apigee (Standard, Enterprise e Enterprise Plus) é o mesmo que para o Cloud Monitoring: 500 por escopo de métricas .
3O período máximo que uma condição avalia é a soma dos períodos de alinhamento e de duração. Por exemplo, se o período de alinhamento for definido como 15 horas e a janela de duração for definida como 15 horas, serão necessárias 30 horas de dados para avaliar a condição.
4Se a consulta da política de alertas com base em registros extrair valores de rótulo, e cada combinação de valores extraídos representa sua própria linha do tempo de notificação. Por exemplo, imagine que um modelo a política de alertas extrai os valores de um rótulo. Suponha que o rótulo possa ter dois valores. Com essa configuração, você pode receber duas notificações, uma para cada valor de rótulo, nos mesmos 5 minutos.

Limites para monitores sintéticos

Categoria Valor
Verificações de tempo de atividade por escopo de métricas * 100
Número máximo de pings ICMP por verificação de tempo de atividade pública 3
Monitores sintéticos por escopo de métricas 100
*Esse limite se aplica ao número de verificações personalizadas. Cada configuração de verificação de tempo de atividade inclui o intervalo entre testar o status do recurso especificado.
Para saber como aumentar esse limite, consulte Gerenciar a cota usando o console do Google Cloud.

Limites para geração de gráficos

Categoria Valor
Painéis por escopo de métricas 1000
Gráficos em um painel 40
Linhas em um gráfico 50*
Linhas em uma tabela 300
*Esse limite é aplicado por motivos de desempenho. Quando há mais de 50 séries temporais para representar em um gráfico, um ícone com um ponto vermelho é adicionado à barra de ferramentas. A dica do ícone mostra a mensagem To improve performance, we've limited the time series displayed in this chart: Para mostrar todas as séries temporais, abra a dica e selecione o botão Mostrar todas as séries temporais.

Objetivos de nível de serviço

Categoria Valor
Número de SLOs por serviço 500