Questa pagina elenca le metriche di Cloud Monitoring disponibili per Memorystore for Valkey e descrive cosa misura ciascuna metrica.
Metriche di Cloud Monitoring
Nome metrica | Descrizione |
---|---|
memorystore.googleapis.com/instance/clients/average_connected_clients |
Numero medio attuale di connessioni client in tutti i nodi dell'istanza. |
memorystore.googleapis.com/instance/clients/maximum_connected_clients |
Numero attuale massimo di connessioni client per un singolo nodo nell'istanza. |
memorystore.googleapis.com/instance/clients/maximum_connection_duration |
Durata massima di una connessione client per un singolo nodo nell'istanza. |
memorystore.googleapis.com/instance/clients/total_connected_clients |
Numero attuale di connessioni client all'istanza. |
memorystore.googleapis.com/instance/stats/total_connections_received_count |
Conteggio delle connessioni client totali a livello di istanza create nell'ultimo minuto. |
memorystore.googleapis.com/instance/stats/total_rejected_connections_count |
Numero di connessioni rifiutate a causa del limite maxclients. |
memorystore.googleapis.com/instance/commandstats/total_usec_count |
Il tempo totale consumato per comando. |
memorystore.googleapis.com/instance/commandstats/total_calls_count |
Numero totale di chiamate per questo comando in un minuto. |
memorystore.googleapis.com/instance/cpu/average_utilization |
Utilizzo medio della CPU in tutti i nodi dell'istanza da 0,0 a 1,0. |
memorystore.googleapis.com/instance/cpu/maximum_utilization |
Utilizzo massimo della CPU per un singolo nodo dell'istanza compreso tra 0,0 e 1,0. |
memorystore.googleapis.com/instance/stats/average_expired_keys |
Numero medio di eventi di scadenza della chiave per i principali di tutti i nodi nell'istanza. |
memorystore.googleapis.com/instance/stats/maximum_expired_keys |
Numero massimo di eventi di scadenza della chiave per un singolo nodo nell'istanza per l'istanza principale. |
memorystore.googleapis.com/instance/stats/total_expired_keys_count |
Numero totale di eventi di scadenza delle chiavi nei principali di tutti i nodi dell'istanza. |
memorystore.googleapis.com/instance/stats/average_evicted_keys |
Numero medio di chiavi espulse a causa della capacità di memoria nelle tabelle principali di tutti i nodi dell'istanza. |
memorystore.googleapis.com/instance/stats/maximum_evicted_keys |
Numero massimo di chiavi espulse per un singolo nodo dell'istanza a causa della capacità di memoria per la chiave principale. |
memorystore.googleapis.com/instance/stats/total_evicted_keys_count |
Numero di chiavi espulse a causa della capacità di memoria nelle tabelle principali di tutti i nodi dell'istanza. |
memorystore.googleapis.com/instance/keyspace/total_keys |
Numero di chiavi archiviate nell'istanza. |
memorystore.googleapis.com/instance/stats/average_keyspace_hits |
Numero medio di ricerca di chiavi riuscita in tutti i nodi dell'istanza. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits |
Numero massimo di ricerche riuscite di chiavi per un singolo nodo nell'istanza. |
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count |
Numero di ricerche di chiavi riuscite per l'istanza. |
memorystore.googleapis.com/instance/stats/average_keyspace_misses |
Numero medio di ricerche delle chiavi non riuscite in tutti i nodi dell'istanza. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses |
Numero massimo di ricerca di chiavi non riuscita per un singolo nodo nell'istanza. |
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count |
Numero totale di ricerche di chiavi non riuscite per l'istanza. |
memorystore.googleapis.com/instance/memory/average_utilization |
Utilizzo medio della memoria in tutti i nodi nell'istanza. Il valore va da 0,0 a 1,0. |
memorystore.googleapis.com/instance/memory/maximum_utilization |
Utilizzo massimo della memoria per un singolo nodo nell'istanza da 0,0 a 1,0. |
memorystore.googleapis.com/instance/memory/total_used_memory |
Utilizzo di memoria totale dell'istanza. |
memorystore.googleapis.com/instance/memory/size |
Dimensioni della memoria dell'istanza. |
memorystore.googleapis.com/instance/replication/average_ack_lag |
Ritardo medio della replica (in secondi) delle repliche in tutti i nodi dell'istanza. Il ritardo della replica (in secondi) indica quanto le repliche sono in ritardo rispetto alle principali. |
memorystore.googleapis.com/instance/replication/maximum_ack_lag |
Ritardo massimo di conferma della replica (in secondi) per una singola replica nell'istanza. Il ritardo di conferma della replica (in secondi) indica quanto i riconoscimenti della replica sono in ritardo rispetto alle principali. |
memorystore.googleapis.com/instance/replication/average_offset_diff |
Differenza media dell'offset di conferma della replica (in byte) tra tutti i nodi dell'istanza. La differenza dell'offset di conferma della replica indica il numero di byte che non sono stati replicati tra le repliche e le relative principali. |
memorystore.googleapis.com/instance/replication/maximum_offset_diff |
Differenza dell'offset di replica massimo (in byte) per un singolo nodo nell'istanza. Differenza dell'offset di replica indica il numero di byte che non sono stati replicati tra una replica e le rispettive istanze primarie. |
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count |
Conteggio dei byte di rete in entrata ricevuti dagli endpoint dell'istanza. |
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count |
Conteggio dei byte di rete in uscita inviati dagli endpoint dell'istanza. |
Metriche sulla persistenza
Questa sezione elenca le metriche sulla persistenza e fornisce casi d'uso di esempio per queste metriche.
Metriche sulla persistenza RDB
Nome metrica | Descrizione |
---|---|
memorystore.googleapis.com/instance/persistence/load_count |
Conteggio cumulativo dei caricamenti dal file dump nell'istanza (AOF o RDB). |
memorystore.googleapis.com/instance/persistence/rdb_saves_count |
Questa metrica mostra il numero cumulativo di volte in cui l'istanza ha acquisito uno snapshot RDB (noto anche come salvataggio). Questa metrica ha un campo status_code . Per verificare se uno snapshot non è riuscito, puoi filtrare il campo status_code in base al seguente errore: 3 - INTERNAL_ERROR |
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages |
Questa metrica mostra l'età di un'istantanea della distribuzione per tutti i nodi dell'istanza. Idealmente, potresti voler vedere che la distribuzione abbia valori con un tempo di attesa inferiore (o contemporaneamente) rispetto alla frequenza dello snapshot. |
memorystore.googleapis.com/instance/persistence/rejected_writes_count |
Conteggio cumulativo dei comandi di scrittura negati nell'istanza a causa della mancata persistenza. |
Metriche sulla persistenza AOF
Nome metrica | Descrizione |
---|---|
memorystore.googleapis.com/instance/persistence/aof_fsync_lags |
Questa metrica mostra una distribuzione del ritardo (dalla scrittura dei dati alla sincronizzazione dell'archiviazione durevole) per tutti i nodi nell'istanza. Viene emesso solo per le istanze con appendfsync=everysec. Idealmente, la distribuzione dovrebbe avere valori con un tempo di latenza inferiore (o uguale) alla frequenza di sincronizzazione AOF. |
memorystore.googleapis.com/instance/persistence/aof_rewrite_count |
Questa metrica mostra il numero cumulativo di volte per la tua istanza in cui un nodo ha attivato una riscrittura AOF. Questa metrica ha un campo status_code . Per verificare se le riscritture AOF non vanno a buon fine, puoi filtrare il campo status_code per individuare il seguente errore: 3 - INTERNAL_ERROR |
Esempi di casi d'uso per le metriche di persistenza
Controllo del fatto che le operazioni di scrittura AOF causano latenza e pressione di memoria
Supponiamo di rilevare un aumento della latenza o dell'utilizzo della memoria nell'istanza. In questo caso, potresti voler controllare se l'utilizzo aggiuntivo è correlato alla persistenza AOF.
Poiché sai che le operazioni di riscrittura AOF possono attivare picchi di carico temporanei, puoi esaminare la metrica aof_rewrites_count
che fornisce il conteggio cumulativo delle riscritture AOF per tutta la durata dell'istanza. Supponiamo che questa metrica mostri che gli incrementi nel conteggio delle riscritture corrispondono agli aumenti della latenza. In questo caso, potresti risolvere il problema riducendo la frequenza di scrittura o aumentando il numero di shard per ridurre la frequenza delle riscritture.
Verificare se le operazioni di salvataggio RDB causano latenza e pressione sulla memoria
Supponiamo di rilevare un aumento della latenza o dell'utilizzo della memoria nell'istanza. In questo caso, ti consigliamo di verificare se l'utilizzo aggiuntivo è correlato alla persistenza RDB.
Poiché sai che le operazioni di salvataggio RDB possono attivare picchi di carico temporanei, puoi esaminare la metrica rdb_saves_count
che fornisce il conteggio cumulativo dei salvataggi RDB nel corso della durata dell'istanza. Supponiamo che questa metrica mostri che gli incrementi del conteggio dei salvataggi RDB corrispondono agli aumenti della latenza. In questo caso, è possibile ridurre l'intervallo di snapshot RDB per abbassare la frequenza delle riscritture. Puoi anche fare lo scale out dell'istanza per ridurre i livelli di carico di riferimento.
Interpretazione delle metriche per Memorystore for Valkey
Come indicato nell'elenco precedente, molte metriche condividono tre categorie: media, massima e totale.
Per Memorystore per Valkey, forniamo le variazioni medie e massime della stessa metrica, in modo da poterle utilizzare entrambe per identificare gli hotspot per quella famiglia di metriche.
Il valore totale della metrica è indipendente e fornisce insight distinti. non correlata allo scopo di hotspotting media e massima.
Informazioni sulle metriche medie e massime
Supponi di confrontare average_keyspace_hits
e maximum_keyspace_hits
per la tua istanza. Man mano che la differenza tra le due metriche aumenta, una maggiore differenza indica un maggior numero di hit hot nella tua istanza. Ideally
dovresti avere un valore di chiusura compreso tra average_keyspace_hits
e
maximum_keyspace_hits
, perché questo significa che gli hit sono in modo più uniforme
distribuiti in tutta l'istanza.
Questo principio si applica a tutte le metriche che hanno le varianti media e massima della stessa metrica.
Esempio di hotspot
Se confronti average_keyspace_hits
e maximum_keyspace_hits
per tutti
gli shard della tua istanza, il confronto di questi valori indica dove si verificano gli hot spot. Ad esempio, supponiamo che gli shard in un'istanza con 6 shard abbiano il seguente
numero di hit:
- Hit shard 1-2
- Shard 2 – 2 hit
- Shard 3 - 2 hit
- Shard 4-2 hit
- Shard 5 – 2 hit
- Shard 6-8 hit
In questo esempio, average_keyspace_hits
restituisce un valore pari a 3 e maximum_keyspace_hits
restituisce 8, a indicare che lo shard 6 è attivo.