Métricas de monitorização suportadas

Esta página lista as métricas do Cloud Monitoring disponíveis para o Memorystore for Valkey e descreve o que cada métrica mede.

Métricas do Cloud Monitoring

Métricas ao nível da instância

Estas métricas oferecem uma vista geral do estado e do desempenho gerais da instância. Ajudam a compreender a capacidade e a utilização gerais da instância, bem como a identificar potenciais gargalos ou áreas de melhoria.

Nome da métrica Descrição
memorystore.googleapis.com/instance/clients/average_connected_clients Número atual médio de ligações de clientes em todos os nós na instância.
memorystore.googleapis.com/instance/clients/maximum_connected_clients Número atual máximo de ligações de cliente para um único nó na instância.
memorystore.googleapis.com/instance/clients/maximum_connection_duration Duração máxima de uma ligação de cliente para um único nó na instância.
memorystore.googleapis.com/instance/clients/total_connected_clients Número atual de ligações de clientes à instância.
memorystore.googleapis.com/instance/stats/total_connections_received_count Contagem de ligações de clientes totais ao nível da instância criadas no último minuto.
memorystore.googleapis.com/instance/stats/total_rejected_connections_count Número de ligações rejeitadas devido ao limite de clientes.
memorystore.googleapis.com/instance/commandstats/total_usec_count O tempo total consumido por comando.
memorystore.googleapis.com/instance/commandstats/total_calls_count Número total de chamadas para este comando num minuto.
memorystore.googleapis.com/instance/cpu/average_utilization Utilização média da CPU em todos os nós na instância de 0,0 a 1,0.
memorystore.googleapis.com/instance/cpu/maximum_utilization Utilização máxima da CPU para um único nó na instância de 0,0 a 1,0.
memorystore.googleapis.com/instance/stats/average_expired_keys Número médio de eventos de expiração de chaves para os principais de todos os nós na instância.
memorystore.googleapis.com/instance/stats/maximum_expired_keys Número máximo de eventos de expiração de chaves para um único nó na instância para o primário.
memorystore.googleapis.com/instance/stats/total_expired_keys_count Número total de eventos de expiração de chaves em primários de todos os nós na instância.
memorystore.googleapis.com/instance/stats/average_evicted_keys Número médio de chaves removidas devido à capacidade de memória nos principais de todos os nós na instância.
memorystore.googleapis.com/instance/stats/maximum_evicted_keys Número máximo de chaves removidas para um único nó na instância devido à capacidade de memória do primário.
memorystore.googleapis.com/instance/stats/total_evicted_keys_count Número de chaves removidas devido à capacidade de memória em primários de todos os nós na instância.
memorystore.googleapis.com/instance/keyspace/total_keys Número de chaves armazenadas na instância.
memorystore.googleapis.com/instance/stats/average_keyspace_hits Número médio de pesquisas bem-sucedidas de chaves em todos os nós na instância.
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits O número máximo de pesquisas bem-sucedidas de chaves para um único nó na instância.
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count Número de pesquisas bem-sucedidas de chaves para a instância.
memorystore.googleapis.com/instance/stats/average_keyspace_misses Número médio de falhas de pesquisa de chaves em todos os nós na instância.
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses Número máximo de pesquisas de chaves falhadas para um único nó na instância.
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count O número total de pesquisas de chaves falhadas para a instância.
memorystore.googleapis.com/instance/memory/average_utilization Utilização média da memória em todos os nós na instância. O valor é de 0,0 a 1,0.
memorystore.googleapis.com/instance/memory/maximum_utilization Utilização máxima de memória para um único nó na instância de 0,0 a 1,0.
memorystore.googleapis.com/instance/memory/total_used_memory Utilização total de memória da instância.
memorystore.googleapis.com/instance/memory/size Tamanho da memória da instância.
memorystore.googleapis.com/instance/replication/average_ack_lag Atraso de confirmação médio (em segundos) das réplicas em todos os nós na instância.

O atraso de confirmação é um gargalo no nó principal de uma instância. Este gargalo é causado pelas respetivas réplicas que não conseguem acompanhar as informações que o nó principal lhes envia. Quando isto acontece, o nó principal tem de aguardar a confirmação de que as réplicas receberam as informações. Isto pode abrandar as confirmações de transações e afetar o desempenho no nó principal.
memorystore.googleapis.com/instance/replication/maximum_ack_lag Atraso máximo de confirmação (em segundos) para uma única réplica na instância.
memorystore.googleapis.com/instance/replication/average_offset_diff Diferença de deslocamento de confirmação de replicação média (em bytes) em todos os nós na instância.

A diferença de deslocamento de confirmação de replicação refere-se ao número de bytes que não foram replicados entre as réplicas e os respetivos originais.
memorystore.googleapis.com/instance/replication/maximum_offset_diff Diferença máxima de desvio de replicação (em bytes) para um único nó na instância.

A diferença de desvio de replicação refere-se ao número de bytes que não foram replicados entre uma réplica e os respetivos originais.
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count Contagem de bytes de rede recebidos pelos pontos finais da instância.
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count A quantidade de bytes de rede de saída enviados a partir dos pontos finais da instância.

Métricas ao nível do nó

Estas métricas oferecem estatísticas detalhadas sobre o estado de funcionamento e o desempenho de nós individuais na instância. Ajudam a resolver problemas com nós e a otimizar o desempenho dos nós.

Nome da métrica Descrição
memorystore.googleapis.com/instance/node/clients/connected_clients O número de clientes ligados ao nó da instância.
memorystore.googleapis.com/instance/node/clients/blocked_clients O número de ligações de cliente que o nó de instância bloqueia.
memorystore.googleapis.com/instance/node/server/uptime O tempo de atividade do nó da instância.
memorystore.googleapis.com/instance/node/stats/connections_received_count O número de ligações de cliente que o Memorystore for Valkey cria no último minuto no nó da instância.
memorystore.googleapis.com/instance/node/stats/rejected_connections_count O número de ligações que o Memorystore for Valkey rejeita porque o nó da instância atinge o limite de `maxclients`.
memorystore.googleapis.com/instance/node/commandstats/usec_count O tempo consumido para cada comando no nó da instância.
memorystore.googleapis.com/instance/node/commandstats/calls_count O número de chamadas para este comando no nó da instância num minuto.
memorystore.googleapis.com/instance/node/cpu/utilization A utilização da CPU para o nó da instância (de 0,0 a 1,0).
memorystore.googleapis.com/instance/node/stats/expired_keys_count O número de eventos de expiração no nó da instância.
memorystore.googleapis.com/instance/node/stats/evicted_keys_count O número de chaves removidas pelo nó da instância.
memorystore.googleapis.com/instance/node/keyspace/total_keys O número de chaves que o Memorystore for Valkey armazena no nó da instância.
memorystore.googleapis.com/instance/node/stats/keyspace_hits_count O número de pesquisas bem-sucedidas de chaves no nó da instância.
memorystore.googleapis.com/instance/node/stats/keyspace_misses_count O número de pesquisas de chaves falhadas no nó da instância.
memorystore.googleapis.com/instance/node/memory/utilization A utilização de memória para o nó de instância (de 0,0 a 1,0).
memorystore.googleapis.com/instance/node/memory/usage A utilização de memória do nó da instância.
memorystore.googleapis.com/instance/node/stats/net_input_bytes_count O número de bytes de rede recebidos pelo nó da instância.
memorystore.googleapis.com/instance/node/stats/net_output_bytes_count O número de bytes de rede de saída que o nó da instância envia.
memorystore.googleapis.com/instance/node/replication/offset Os bytes de desvio de replicação do nó da instância.
memorystore.googleapis.com/instance/node/server/healthy Determina se um nó de instância está disponível e a funcionar corretamente. Esta métrica está em pré-visualização.

Métricas de replicação entre regiões

Esta secção apresenta as métricas usadas para a replicação entre regiões.

Nome da métrica Descrição
memorystore.googleapis.com/instance/cross_instance_replication/secondary_replication_links Esta métrica mostra o número de associações de fragmentos entre as instâncias principal e secundária. Num grupo de replicação entre regiões, uma instância principal comunica o número de links de replicação entre regiões que tem com as instâncias secundárias no grupo. Para cada instância secundária, espera-se que este número seja igual ao número de fragmentos. Se o número descer abaixo do número de fragmentos, esta métrica identifica o número de fragmentos quando a replicação parou entre o replicador e o seguidor. Num estado ideal, esta métrica tem o mesmo número que a contagem de fragmentos para a instância principal.
memorystore.googleapis.com/instance/cross_instance_replication/secondary_maximum_replication_offset_diff Esta métrica mostra a diferença máxima de desvio de replicação entre os fragmentos principais e secundários.
memorystore.googleapis.com/instance/cross_instance_replication/secondary_average_replication_offset_diff Esta métrica mostra a diferença média de desvio de replicação entre os fragmentos principais e secundários.

Métricas de cópia de segurança

Esta secção apresenta as métricas de cópia de segurança e importação.

Métricas ao nível da instância

Nome da métrica Descrição
memorystore.googleapis.com/instance/backup/last_backup_start_time A hora de início da última operação de cópia de segurança.
memorystore.googleapis.com/instance/backup/last_backup_status O estado da última operação de cópia de segurança. Os estados são 1 (êxito) e 0 (falha).
memorystore.googleapis.com/instance/backup/last_backup_duration A duração da última operação de cópia de segurança (em milissegundos).
memorystore.googleapis.com/instance/backup/last_backup_size O tamanho da última cópia de segurança (em bytes).
memorystore.googleapis.com/instance/import/last_import_start_time A hora de início da última operação de importação.
memorystore.googleapis.com/instance/import/last_import_duration A duração da última operação de importação(em milissegundos).

Métricas de persistência

Esta secção apresenta as métricas de persistência e fornece exemplos de utilização das métricas de persistência.

Métricas de persistência da RDB

Métricas ao nível da instância

Nome da métrica Descrição
memorystore.googleapis.com/instance/persistence/load_count A contagem cumulativa de carregamentos de toda a instância para persistência AOF ou RDB.
memorystore.googleapis.com/instance/persistence/rdb_saves_count O número cumulativo de vezes que a sua instância tira uma captura instantânea do RDB (também conhecido como save). Esta métrica tem um campo status_code. Para verificar se um instantâneo falha, pode filtrar o campo status_code para o seguinte erro: 3 - INTERNAL ERROR.
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages Uma imagem instantânea da distribuição por idade para todos os nós na instância. Quer que a distribuição tenha valores com um tempo de atraso inferior (ou o mesmo tempo) do que a frequência da análise instantânea.
memorystore.googleapis.com/instance/persistence/rejected_writes_count A contagem cumulativa de comandos de gravação recusados na instância devido a uma falha na persistência.

Métricas ao nível do nó

Nome da métrica Descrição
memorystore.googleapis.com/instance/node/persistence/rdb_bgsave_in_progress Está em curso uma RDB BGSAVE no nó da instância. TRUE significa que a gravação está em curso.
memorystore.googleapis.com/instance/node/persistence/rdb_last_bgsave_status O sucesso da última BGSAVE no nó da instância. TRUE significa que ocorre uma BGSAVE bem-sucedida. Se não ocorrer nenhum bgrewrite, o valor pode ser predefinido como TRUE.
memorystore.googleapis.com/instance/node/persistence/rdb_saves_count A métrica mostra o número cumulativo de guardas de RDB executados no nó da instância.
memorystore.googleapis.com/instance/node/persistence/rdb_last_save_age O tempo (em segundos) desde o último instantâneo bem-sucedido.
memorystore.googleapis.com/instance/node/persistence/rdb_next_save_time_until O tempo restante (em segundos) até à próxima captura instantânea.
memorystore.googleapis.com/instance/node/persistence/current_save_keys_total O número de chaves na gravação RDB executada no nó da instância.

Métricas de persistência de AOF

Métricas ao nível da instância

Nome da métrica Descrição
memorystore.googleapis.com/instance/persistence/aof_fsync_lags Esta métrica mostra uma distribuição do atraso (desde a gravação de dados até à sincronização do armazenamento duradouro) para todos os nós na instância. Só é emitido para instâncias com appendfsync=everysec. Idealmente, quer ver a distribuição com valores que tenham um tempo de atraso inferior (ou o mesmo tempo) do que a frequência de sincronização do AOF.
memorystore.googleapis.com/instance/persistence/aof_rewrite_count Esta métrica mostra o número cumulativo de vezes que um nó acionou uma reescrita de AOF para a sua instância. Esta métrica tem um campo status_code. Para verificar se as reescritas de AOF estão a falhar, pode filtrar o campo status_code para o seguinte erro: 3 - INTERNAL_ERROR

Métricas ao nível do nó

Nome da métrica Descrição
memorystore.googleapis.com/instance/node/persistence/aof_last_write_status Esta métrica mostra o êxito da gravação AOF mais recente no nó da instância. VERDADEIRO significa êxito. Se não tiver ocorrido nenhuma gravação, o valor pode ser predefinido como VERDADEIRO.
memorystore.googleapis.com/instance/node/persistence/aof_last_bgrewrite_status Esta métrica mostra o êxito da última operação bgrewrite AOF no nó da instância. VERDADEIRO significa êxito. Se não tiver ocorrido nenhuma reescrita em segundo plano, o valor pode ser VERDADEIRO por predefinição.
memorystore.googleapis.com/instance/node/persistence/aof_fsync_lag Esta métrica mostra o atraso da AOF entre a memória e o armazenamento persistente no nó da instância. Só é aplicável a instâncias com AOF ativado em que appendfsync=EVERYSEC
memorystore.googleapis.com/instance/node/persistence/aof_rewrites_count Esta métrica mostra a contagem de reescritas de AOF no nó da instância. Para verificar se as reescritas de AOF estão a falhar, pode filtrar o campo status_code para o seguinte erro: 3 - INTERNAL_ERROR
memorystore.googleapis.com/instance/node/persistence/aof_fsync_errors_count Esta métrica mostra a contagem de erros de chamadas fsync() de AOF e só é aplicável a instâncias com AOF ativado em que appendfsync=EVERYSEC|ALWAYS.

Métricas de persistência comuns

Métricas aplicáveis aos mecanismos de persistência AOF e RDB.

Métricas ao nível do nó

Nome da métrica Descrição
memorystore.googleapis.com/instance/node/persistence/auto_restore_count Esta métrica mostra a contagem de restauros a partir do ficheiro de despejo (AOF ou RDB). Para verificar se os restauros estão a falhar, pode filtrar o campo status_code para o seguinte erro: 2 - INTERNAL_ERROR

Exemplos de utilização de métricas de persistência

Verificar se as operações de escrita AOF causam latência e pressão de memória

Suponhamos que deteta um aumento da latência ou da utilização de memória na sua instância ou no nó na instância. Neste caso, recomendamos que verifique se a utilização adicional está relacionada com a persistência do AOF.

Uma vez que sabe que as operações de reescrita de AOF podem acionar picos de carga transitórios, pode inspecionar a métrica aof_rewrites_count, que lhe dá a contagem cumulativa de reescritas de AOF ao longo da duração da instância ou do nó na instância. Suponhamos que esta métrica mostra que os incrementos na contagem de reescritas correspondem a aumentos na latência. Nesta circunstância, pode resolver o problema reduzindo a taxa de gravação ou aumentando a contagem de fragmentos para reduzir a frequência de reescritas.

Verificar se as operações de gravação de RDB causam latência e pressão de memória

Suponhamos que deteta um aumento da latência ou da utilização de memória na sua instância ou no nó na instância. Neste caso, recomendamos que verifique se a utilização adicional está relacionada com a persistência RDB.

Uma vez que sabe que as operações de guardar RDB podem acionar picos de carga transitórios, pode inspecionar a métrica rdb_saves_count, que dá a contagem cumulativa de guardados RDB ao longo da duração total da instância ou do nó na instância. Suponhamos que esta métrica mostra que os incrementos na contagem de poupanças da RDB correspondem a aumentos na latência. Nesta circunstância, pode reduzir o intervalo de instantâneos da RDB para diminuir a frequência de reescritas. Também pode expandir a instância para reduzir os níveis de carga de base.

Interpretar métricas do Memorystore for Valkey

Conforme se pode ver na lista acima, muitas das métricas partilham três categorias: média, máximo e total.

Para o Memorystore for Valkey, fornecemos variações médias e máximas da mesma métrica para que possa usá-las ambas para identificar o hotspotting para essa família de métricas.

O valor total da métrica é independente e fornece estatísticas separadas não relacionadas com o objetivo de identificação de pontos críticos de média e máximo.

Compreender as métricas médias e máximas

Suponhamos que compara os valores average_keyspace_hits e maximum_keyspace_hits da sua instância. À medida que a diferença entre as duas métricas aumenta, uma diferença maior indica uma maior concentração de acessos na sua instância. Idealmente, deve ter um valor próximo entre average_keyspace_hits e maximum_keyspace_hits, porque isto significa que os acessos estão mais uniformemente distribuídos na sua instância.

Este princípio aplica-se a todas as métricas que têm as variações média e máxima da mesma métrica.

Exemplo de pontos ativos

Se comparar average_keyspace_hits e maximum_keyspace_hits para todos os fragmentos na sua instância, a comparação destes valores indica onde ocorre o hot spotting. Por exemplo, suponha que os fragmentos numa instância de 6 fragmentos têm o seguinte número de resultados:

  • Fragmento 1 – 2 acertos
  • Fragmento 2 – 2 resultados
  • Fragmento 3 – 2 resultados
  • Fragmento 4 – 2 resultados
  • Fragmento 5 – 2 resultados
  • Fragmento 6 – 8 hits

Neste exemplo, average_keyspace_hits devolve um valor de 3 e maximum_keyspace_hits devolve 8, o que indica que o fragmento 6 está ativo.

Fornecemos métricas ao nível do nó que podem ser úteis para identificar pontos críticos na instância.