Esta página lista as métricas do Cloud Monitoring disponíveis para o Memorystore for Valkey e descreve o que cada métrica mede.
Métricas do Cloud Monitoring
Métricas ao nível da instância
Estas métricas oferecem uma vista geral do estado e do desempenho gerais da instância. Ajudam a compreender a capacidade e a utilização gerais da instância, bem como a identificar potenciais gargalos ou áreas de melhoria.
Nome da métrica | Descrição |
---|---|
memorystore.googleapis.com/instance/clients/average_connected_clients |
Número atual médio de ligações de clientes em todos os nós na instância. |
memorystore.googleapis.com/instance/clients/maximum_connected_clients |
Número atual máximo de ligações de cliente para um único nó na instância. |
memorystore.googleapis.com/instance/clients/maximum_connection_duration |
Duração máxima de uma ligação de cliente para um único nó na instância. |
memorystore.googleapis.com/instance/clients/total_connected_clients |
Número atual de ligações de clientes à instância. |
memorystore.googleapis.com/instance/stats/total_connections_received_count |
Contagem de ligações de clientes totais ao nível da instância criadas no último minuto. |
memorystore.googleapis.com/instance/stats/total_rejected_connections_count |
Número de ligações rejeitadas devido ao limite de clientes. |
memorystore.googleapis.com/instance/commandstats/total_usec_count |
O tempo total consumido por comando. |
memorystore.googleapis.com/instance/commandstats/total_calls_count |
Número total de chamadas para este comando num minuto. |
memorystore.googleapis.com/instance/cpu/average_utilization |
Utilização média da CPU em todos os nós na instância de 0,0 a 1,0. |
memorystore.googleapis.com/instance/cpu/maximum_utilization |
Utilização máxima da CPU para um único nó na instância de 0,0 a 1,0. |
memorystore.googleapis.com/instance/stats/average_expired_keys |
Número médio de eventos de expiração de chaves para os principais de todos os nós na instância. |
memorystore.googleapis.com/instance/stats/maximum_expired_keys |
Número máximo de eventos de expiração de chaves para um único nó na instância para o primário. |
memorystore.googleapis.com/instance/stats/total_expired_keys_count |
Número total de eventos de expiração de chaves em primários de todos os nós na instância. |
memorystore.googleapis.com/instance/stats/average_evicted_keys |
Número médio de chaves removidas devido à capacidade de memória nos principais de todos os nós na instância. |
memorystore.googleapis.com/instance/stats/maximum_evicted_keys |
Número máximo de chaves removidas para um único nó na instância devido à capacidade de memória do primário. |
memorystore.googleapis.com/instance/stats/total_evicted_keys_count |
Número de chaves removidas devido à capacidade de memória em primários de todos os nós na instância. |
memorystore.googleapis.com/instance/keyspace/total_keys |
Número de chaves armazenadas na instância. |
memorystore.googleapis.com/instance/stats/average_keyspace_hits |
Número médio de pesquisas bem-sucedidas de chaves em todos os nós na instância. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits |
O número máximo de pesquisas bem-sucedidas de chaves para um único nó na instância. |
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count |
Número de pesquisas bem-sucedidas de chaves para a instância. |
memorystore.googleapis.com/instance/stats/average_keyspace_misses |
Número médio de falhas de pesquisa de chaves em todos os nós na instância. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses |
Número máximo de pesquisas de chaves falhadas para um único nó na instância. |
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count |
O número total de pesquisas de chaves falhadas para a instância. |
memorystore.googleapis.com/instance/memory/average_utilization |
Utilização média da memória em todos os nós na instância. O valor é de 0,0 a 1,0. |
memorystore.googleapis.com/instance/memory/maximum_utilization |
Utilização máxima de memória para um único nó na instância de 0,0 a 1,0. |
memorystore.googleapis.com/instance/memory/total_used_memory |
Utilização total de memória da instância. |
memorystore.googleapis.com/instance/memory/size |
Tamanho da memória da instância. |
memorystore.googleapis.com/instance/replication/average_ack_lag |
Atraso de confirmação médio (em segundos) das réplicas em todos os nós na instância. O atraso de confirmação é um gargalo no nó principal de uma instância. Este gargalo é causado pelas respetivas réplicas que não conseguem acompanhar as informações que o nó principal lhes envia. Quando isto acontece, o nó principal tem de aguardar a confirmação de que as réplicas receberam as informações. Isto pode abrandar as confirmações de transações e afetar o desempenho no nó principal. |
memorystore.googleapis.com/instance/replication/maximum_ack_lag |
Atraso máximo de confirmação (em segundos) para uma única réplica na instância. |
memorystore.googleapis.com/instance/replication/average_offset_diff |
Diferença de deslocamento de confirmação de replicação média (em bytes) em todos os nós na instância. A diferença de deslocamento de confirmação de replicação refere-se ao número de bytes que não foram replicados entre as réplicas e os respetivos originais. |
memorystore.googleapis.com/instance/replication/maximum_offset_diff |
Diferença máxima de desvio de replicação (em bytes) para um único nó na instância. A diferença de desvio de replicação refere-se ao número de bytes que não foram replicados entre uma réplica e os respetivos originais. |
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count |
Contagem de bytes de rede recebidos pelos pontos finais da instância. |
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count |
A quantidade de bytes de rede de saída enviados a partir dos pontos finais da instância. |
Métricas ao nível do nó
Estas métricas oferecem estatísticas detalhadas sobre o estado de funcionamento e o desempenho de nós individuais na instância. Ajudam a resolver problemas com nós e a otimizar o desempenho dos nós.
Nome da métrica | Descrição |
---|---|
memorystore.googleapis.com/instance/node/clients/connected_clients |
O número de clientes ligados ao nó da instância. |
memorystore.googleapis.com/instance/node/clients/blocked_clients |
O número de ligações de cliente que o nó de instância bloqueia. |
memorystore.googleapis.com/instance/node/server/uptime |
O tempo de atividade do nó da instância. |
memorystore.googleapis.com/instance/node/stats/connections_received_count |
O número de ligações de cliente que o Memorystore for Valkey cria no último minuto no nó da instância. |
memorystore.googleapis.com/instance/node/stats/rejected_connections_count |
O número de ligações que o Memorystore for Valkey rejeita porque o nó da instância atinge o limite de `maxclients`. |
memorystore.googleapis.com/instance/node/commandstats/usec_count |
O tempo consumido para cada comando no nó da instância. |
memorystore.googleapis.com/instance/node/commandstats/calls_count |
O número de chamadas para este comando no nó da instância num minuto. |
memorystore.googleapis.com/instance/node/cpu/utilization |
A utilização da CPU para o nó da instância (de 0,0 a 1,0). |
memorystore.googleapis.com/instance/node/stats/expired_keys_count |
O número de eventos de expiração no nó da instância. |
memorystore.googleapis.com/instance/node/stats/evicted_keys_count |
O número de chaves removidas pelo nó da instância. |
memorystore.googleapis.com/instance/node/keyspace/total_keys |
O número de chaves que o Memorystore for Valkey armazena no nó da instância. |
memorystore.googleapis.com/instance/node/stats/keyspace_hits_count |
O número de pesquisas bem-sucedidas de chaves no nó da instância. |
memorystore.googleapis.com/instance/node/stats/keyspace_misses_count |
O número de pesquisas de chaves falhadas no nó da instância. |
memorystore.googleapis.com/instance/node/memory/utilization |
A utilização de memória para o nó de instância (de 0,0 a 1,0). |
memorystore.googleapis.com/instance/node/memory/usage |
A utilização de memória do nó da instância. |
memorystore.googleapis.com/instance/node/stats/net_input_bytes_count |
O número de bytes de rede recebidos pelo nó da instância. |
memorystore.googleapis.com/instance/node/stats/net_output_bytes_count |
O número de bytes de rede de saída que o nó da instância envia. |
memorystore.googleapis.com/instance/node/replication/offset |
Os bytes de desvio de replicação do nó da instância. |
memorystore.googleapis.com/instance/node/server/healthy |
Determina se um nó de instância está disponível e a funcionar corretamente. Esta métrica está em pré-visualização. |
Métricas de replicação entre regiões
Esta secção apresenta as métricas usadas para a replicação entre regiões.
Nome da métrica | Descrição |
---|---|
memorystore.googleapis.com/instance/cross_instance_replication/secondary_replication_links |
Esta métrica mostra o número de associações de fragmentos entre as instâncias principal e secundária. Num grupo de replicação entre regiões, uma instância principal comunica o número de links de replicação entre regiões que tem com as instâncias secundárias no grupo. Para cada instância secundária, espera-se que este número seja igual ao número de fragmentos. Se o número descer abaixo do número de fragmentos, esta métrica identifica o número de fragmentos quando a replicação parou entre o replicador e o seguidor. Num estado ideal, esta métrica tem o mesmo número que a contagem de fragmentos para a instância principal. |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_maximum_replication_offset_diff |
Esta métrica mostra a diferença máxima de desvio de replicação entre os fragmentos principais e secundários. |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_average_replication_offset_diff |
Esta métrica mostra a diferença média de desvio de replicação entre os fragmentos principais e secundários. |
Métricas de cópia de segurança
Esta secção apresenta as métricas de cópia de segurança e importação.
Métricas ao nível da instância
Nome da métrica | Descrição |
---|---|
memorystore.googleapis.com/instance/backup/last_backup_start_time |
A hora de início da última operação de cópia de segurança. |
memorystore.googleapis.com/instance/backup/last_backup_status |
O estado da última operação de cópia de segurança. Os estados são 1 (êxito) e 0 (falha). |
memorystore.googleapis.com/instance/backup/last_backup_duration |
A duração da última operação de cópia de segurança (em milissegundos). |
memorystore.googleapis.com/instance/backup/last_backup_size |
O tamanho da última cópia de segurança (em bytes). |
memorystore.googleapis.com/instance/import/last_import_start_time |
A hora de início da última operação de importação. |
memorystore.googleapis.com/instance/import/last_import_duration |
A duração da última operação de importação(em milissegundos). |
Métricas de persistência
Esta secção apresenta as métricas de persistência e fornece exemplos de utilização das métricas de persistência.
Métricas de persistência da RDB
Métricas ao nível da instância
Nome da métrica | Descrição |
---|---|
memorystore.googleapis.com/instance/persistence/load_count |
A contagem cumulativa de carregamentos de toda a instância para persistência AOF ou RDB. |
memorystore.googleapis.com/instance/persistence/rdb_saves_count |
O número cumulativo de vezes que a sua instância tira uma captura instantânea do RDB (também conhecido como save). Esta métrica tem um campo status_code . Para verificar se um instantâneo falha, pode filtrar o campo status_code para o seguinte erro: 3 - INTERNAL ERROR . |
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages |
Uma imagem instantânea da distribuição por idade para todos os nós na instância. Quer que a distribuição tenha valores com um tempo de atraso inferior (ou o mesmo tempo) do que a frequência da análise instantânea. |
memorystore.googleapis.com/instance/persistence/rejected_writes_count |
A contagem cumulativa de comandos de gravação recusados na instância devido a uma falha na persistência. |
Métricas ao nível do nó
Nome da métrica | Descrição |
---|---|
memorystore.googleapis.com/instance/node/persistence/rdb_bgsave_in_progress |
Está em curso uma RDB BGSAVE no nó da instância. TRUE significa que a gravação está em curso. |
memorystore.googleapis.com/instance/node/persistence/rdb_last_bgsave_status |
O sucesso da última BGSAVE no nó da instância. TRUE significa que ocorre uma BGSAVE bem-sucedida. Se não ocorrer nenhum bgrewrite , o valor pode ser predefinido como TRUE . |
memorystore.googleapis.com/instance/node/persistence/rdb_saves_count |
A métrica mostra o número cumulativo de guardas de RDB executados no nó da instância. |
memorystore.googleapis.com/instance/node/persistence/rdb_last_save_age |
O tempo (em segundos) desde o último instantâneo bem-sucedido. |
memorystore.googleapis.com/instance/node/persistence/rdb_next_save_time_until |
O tempo restante (em segundos) até à próxima captura instantânea. |
memorystore.googleapis.com/instance/node/persistence/current_save_keys_total |
O número de chaves na gravação RDB executada no nó da instância. |
Métricas de persistência de AOF
Métricas ao nível da instância
Nome da métrica | Descrição |
---|---|
memorystore.googleapis.com/instance/persistence/aof_fsync_lags |
Esta métrica mostra uma distribuição do atraso (desde a gravação de dados até à sincronização do armazenamento duradouro) para todos os nós na instância. Só é emitido para instâncias com appendfsync=everysec. Idealmente, quer ver a distribuição com valores que tenham um tempo de atraso inferior (ou o mesmo tempo) do que a frequência de sincronização do AOF. |
memorystore.googleapis.com/instance/persistence/aof_rewrite_count |
Esta métrica mostra o número cumulativo de vezes que um nó acionou uma reescrita de AOF para a sua instância. Esta métrica tem um campo status_code . Para verificar se as reescritas de AOF estão a falhar, pode filtrar o campo status_code para o seguinte erro: 3 - INTERNAL_ERROR |
Métricas ao nível do nó
Nome da métrica | Descrição |
---|---|
memorystore.googleapis.com/instance/node/persistence/aof_last_write_status |
Esta métrica mostra o êxito da gravação AOF mais recente no nó da instância. VERDADEIRO significa êxito. Se não tiver ocorrido nenhuma gravação, o valor pode ser predefinido como VERDADEIRO. |
memorystore.googleapis.com/instance/node/persistence/aof_last_bgrewrite_status |
Esta métrica mostra o êxito da última operação bgrewrite AOF no nó da instância. VERDADEIRO significa êxito. Se não tiver ocorrido nenhuma reescrita em segundo plano, o valor pode ser VERDADEIRO por predefinição. |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_lag |
Esta métrica mostra o atraso da AOF entre a memória e o armazenamento persistente no nó da instância. Só é aplicável a instâncias com AOF ativado em que appendfsync=EVERYSEC |
memorystore.googleapis.com/instance/node/persistence/aof_rewrites_count |
Esta métrica mostra a contagem de reescritas de AOF no nó da instância. Para verificar se as reescritas de AOF estão a falhar, pode filtrar o campo status_code para o seguinte erro: 3 - INTERNAL_ERROR |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_errors_count |
Esta métrica mostra a contagem de erros de chamadas fsync() de AOF e só é aplicável a instâncias com AOF ativado em que appendfsync=EVERYSEC|ALWAYS. |
Métricas de persistência comuns
Métricas aplicáveis aos mecanismos de persistência AOF e RDB.
Métricas ao nível do nó
Nome da métrica | Descrição |
---|---|
memorystore.googleapis.com/instance/node/persistence/auto_restore_count |
Esta métrica mostra a contagem de restauros a partir do ficheiro de despejo (AOF ou RDB). Para verificar se os restauros estão a falhar, pode filtrar o campo status_code para o seguinte erro: 2 - INTERNAL_ERROR |
Exemplos de utilização de métricas de persistência
Verificar se as operações de escrita AOF causam latência e pressão de memória
Suponhamos que deteta um aumento da latência ou da utilização de memória na sua instância ou no nó na instância. Neste caso, recomendamos que verifique se a utilização adicional está relacionada com a persistência do AOF.
Uma vez que sabe que as operações de reescrita de AOF podem acionar picos de carga transitórios, pode inspecionar a métrica aof_rewrites_count
, que lhe dá a contagem cumulativa de reescritas de AOF ao longo da duração da instância ou do nó na instância. Suponhamos que esta métrica mostra que os incrementos na contagem de reescritas correspondem a aumentos na latência. Nesta circunstância, pode resolver o problema reduzindo a taxa de gravação ou aumentando a contagem de fragmentos para reduzir a frequência de reescritas.
Verificar se as operações de gravação de RDB causam latência e pressão de memória
Suponhamos que deteta um aumento da latência ou da utilização de memória na sua instância ou no nó na instância. Neste caso, recomendamos que verifique se a utilização adicional está relacionada com a persistência RDB.
Uma vez que sabe que as operações de guardar RDB podem acionar picos de carga transitórios, pode inspecionar a métrica rdb_saves_count
, que dá a contagem cumulativa de guardados RDB ao longo da duração total da instância ou do nó na instância. Suponhamos que esta métrica mostra que os incrementos na contagem de poupanças da RDB correspondem a aumentos na latência. Nesta circunstância, pode reduzir o intervalo de instantâneos da RDB para diminuir a frequência de reescritas. Também pode expandir a instância para reduzir os níveis de carga de base.
Interpretar métricas do Memorystore for Valkey
Conforme se pode ver na lista acima, muitas das métricas partilham três categorias: média, máximo e total.
Para o Memorystore for Valkey, fornecemos variações médias e máximas da mesma métrica para que possa usá-las ambas para identificar o hotspotting para essa família de métricas.
O valor total da métrica é independente e fornece estatísticas separadas não relacionadas com o objetivo de identificação de pontos críticos de média e máximo.
Compreender as métricas médias e máximas
Suponhamos que compara os valores average_keyspace_hits
e maximum_keyspace_hits
da sua instância. À medida que a diferença entre as duas métricas aumenta, uma diferença maior indica uma maior concentração de acessos na sua instância. Idealmente, deve ter um valor próximo entre average_keyspace_hits
e maximum_keyspace_hits
, porque isto significa que os acessos estão mais uniformemente distribuídos na sua instância.
Este princípio aplica-se a todas as métricas que têm as variações média e máxima da mesma métrica.
Exemplo de pontos ativos
Se comparar average_keyspace_hits
e maximum_keyspace_hits
para todos os fragmentos na sua instância, a comparação destes valores indica onde ocorre o hot spotting. Por exemplo, suponha que os fragmentos numa instância de 6 fragmentos têm o seguinte número de resultados:
- Fragmento 1 – 2 acertos
- Fragmento 2 – 2 resultados
- Fragmento 3 – 2 resultados
- Fragmento 4 – 2 resultados
- Fragmento 5 – 2 resultados
- Fragmento 6 – 8 hits
Neste exemplo, average_keyspace_hits
devolve um valor de 3 e maximum_keyspace_hits
devolve 8, o que indica que o fragmento 6 está ativo.
Fornecemos métricas ao nível do nó que podem ser úteis para identificar pontos críticos na instância.