このページでは、Memorystore for Valkey で使用可能な Cloud Monitoring 指標を一覧表示するとともに、各指標の測定値について説明します。
Cloud Monitoring の指標
指標名 | 説明 |
---|---|
memorystore.googleapis.com/instance/clients/average_connected_clients |
インスタンス内のすべてのノードにわたる現在の平均クライアント接続数。 |
memorystore.googleapis.com/instance/clients/maximum_connected_clients |
インスタンス内の単一ノードの現在のクライアント接続の最大数。 |
memorystore.googleapis.com/instance/clients/maximum_connection_duration |
インスタンス内の単一ノードのクライアント接続の最大継続時間。 |
memorystore.googleapis.com/instance/clients/total_connected_clients |
インスタンスへの現在のクライアント接続の数。 |
memorystore.googleapis.com/instance/stats/total_connections_received_count |
過去 1 分間に作成されたインスタンス レベルのクライアント接続の合計数。 |
memorystore.googleapis.com/instance/stats/total_rejected_connections_count |
最大クライアント上限により拒否された接続の数。 |
memorystore.googleapis.com/instance/commandstats/total_usec_count |
コマンドごとに消費される合計時間。 |
memorystore.googleapis.com/instance/commandstats/total_calls_count |
このコマンドの 1 分間での呼び出しの合計回数。 |
memorystore.googleapis.com/instance/cpu/average_utilization |
インスタンス内のすべてのノードの平均 CPU 使用率(0.0 ~ 1.0)。 |
memorystore.googleapis.com/instance/cpu/maximum_utilization |
インスタンス内の単一ノードの最大 CPU 使用率(0.0 ~ 1.0)。 |
memorystore.googleapis.com/instance/stats/average_expired_keys |
インスタンス内のすべてのノードのプライマリの鍵有効期限イベントの平均数。 |
memorystore.googleapis.com/instance/stats/maximum_expired_keys |
プライマリのインスタンス内の単一ノードの鍵有効期限イベントの最大数。 |
memorystore.googleapis.com/instance/stats/total_expired_keys_count |
インスタンス内のすべてのノードのプライマリにまたがる鍵の有効期限イベントの合計数。 |
memorystore.googleapis.com/instance/stats/average_evicted_keys |
インスタンス内のすべてのノードのプライマリでのメモリ容量が原因で強制排除されたキーの平均数。 |
memorystore.googleapis.com/instance/stats/maximum_evicted_keys |
プライマリのメモリ容量が原因で、インスタンス内の単一ノードの強制排除されたキーの最大数。 |
memorystore.googleapis.com/instance/stats/total_evicted_keys_count |
インスタンス内のすべてのノードのプライマリにわたるメモリ容量が原因で強制排除されたキーの数。 |
memorystore.googleapis.com/instance/keyspace/total_keys |
インスタンスに格納されているキーの数。 |
memorystore.googleapis.com/instance/stats/average_keyspace_hits |
インスタンス内のすべてのノードにわたるキーの正常な検索の平均数。 |
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits |
インスタンス内の単一ノードのキーの正常な検索の最大数。 |
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count |
インスタンスのキーの正常な検索の数。 |
memorystore.googleapis.com/instance/stats/average_keyspace_misses |
インスタンス内のすべてのノードにわたるキーのルックアップに失敗した平均数。 |
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses |
インスタンス内の単一ノードのキーのルックアップに失敗した最大数。 |
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count |
インスタンスのキーのルックアップに失敗した合計数。 |
memorystore.googleapis.com/instance/memory/average_utilization |
インスタンス内のすべてのノードの平均メモリ使用率。値は 0.0 ~ 1.0 です。 |
memorystore.googleapis.com/instance/memory/maximum_utilization |
インスタンス内の単一ノードの最大メモリ使用率(0.0 ~ 1.0)。 |
memorystore.googleapis.com/instance/memory/total_used_memory |
インスタンスの合計メモリ使用量。 |
memorystore.googleapis.com/instance/memory/size |
インスタンスのメモリサイズ |
memorystore.googleapis.com/instance/replication/average_ack_lag |
インスタンス内のすべてのノードにおけるレプリカの平均レプリケーション ラグ(秒単位)。 レプリケーション ラグ(秒単位)は、レプリカがプライマリよりどの程度遅れているかを示します。 |
memorystore.googleapis.com/instance/replication/maximum_ack_lag |
インスタンス内の単一レプリカの最大レプリケーション確認応答ラグ(秒単位)。 レプリケーションの確認応答ラグ(秒単位)は、レプリケーションの確認応答がプライマリよりどの程度遅れているかを示します。 |
memorystore.googleapis.com/instance/replication/average_offset_diff |
インスタンス内のすべてのノード間のレプリケーション確認応答オフセット差分(バイト単位)。 レプリケーション確認応答オフセットの差分とは、レプリカとそのプライマリ間で複製されていないバイト数を意味します。 |
memorystore.googleapis.com/instance/replication/maximum_offset_diff |
インスタンス内の単一ノードのレプリケーション オフセット差分(バイト単位)。 レプリケーション オフセットの差分とは、レプリカとそのプライマリ間でレプリケートされていないバイト数を意味します。 |
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count |
インスタンス エンドポイントが受信した受信ネットワーク バイト数。 |
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count |
インスタンス エンドポイントから送信された送信ネットワーク バイト数。 |
永続性の指標
このセクションでは、永続性の指標を一覧表示し、永続性指標のサンプル ユースケースを示します。
RDB 永続性の指標
指標名 | 説明 |
---|---|
memorystore.googleapis.com/instance/persistence/load_count |
インスタンス(AOF または RDB)にわたるダンプファイルからの読み込みの累積数。 |
memorystore.googleapis.com/instance/persistence/rdb_saves_count |
この指標は、インスタンスが RDB スナップショットを取得(保存とも呼ばれます)した累積回数を示します。この指標には status_code フィールドがあります。スナップショットが失敗したかどうかを確認するには、status_code フィールドに次のエラーをフィルタします: 3 - INTERNAL_ERROR |
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages |
この指標は、インスタンス上のすべてのノードの分布スナップショットの経過時間を示します。理想的には、分布の値にスナップショット頻度よりも遅れ時間(または同じ時間)が低いことを確認します。 |
memorystore.googleapis.com/instance/persistence/rejected_writes_count |
持続的な失敗が原因で、インスタンス全体で拒否された書き込みコマンドの累積数。 |
AOF 永続性指標
指標名 | 説明 |
---|---|
memorystore.googleapis.com/instance/persistence/aof_fsync_lags |
この指標は、インスタンス内のすべてのノードにおけるラグ(データの書き込みから耐久性の高いストレージ同期まで)の分布を示します。Appfsync=everysec が設定されているインスタンスでのみ生成されます。理想的には、分布の値が AOF 同期頻度よりも短い(または同じ時刻)値であることを確認します。 |
memorystore.googleapis.com/instance/persistence/aof_rewrite_count |
この指標は、ノードが AOF 書き換えをトリガーしたインスタンスの累積回数を示します。この指標には status_code フィールドがあります。AOF 書き換えが失敗しているかどうかを確認するには、status_code フィールドでフィルタして、「3 - INTERNAL_ERROR」のエラーでフィルタリングします。 |
永続性指標のサンプル ユースケース
AOF 書き込みオペレーションによってレイテンシとメモリ プレッシャーが発生するかどうかを確認する
インスタンスのレイテンシの増加またはメモリ使用量を検出したとします。この場合、追加の使用が AOF 永続化に関連しているかどうかを確認できます。
AOF 書き換えオペレーションによって一時的な負荷の急増がトリガーされる可能性があることがわかっているため、aof_rewrites_count
指標を調べると、インスタンスの存続期間全体での AOF 書き換えの累積数を確認できます。この指標が、書き換え回数の増分がレイテンシの増加に対応することを示しているとします。このような状況では、書き込みレートを下げるか、シャード数を増やして書き換えの頻度を減らすことで、問題に対処できます。
RDB 保存オペレーションによってレイテンシとメモリ プレッシャーが発生するかどうかを確認する
インスタンスのレイテンシの増加またはメモリ使用量を検出したとします。この場合は、余分な使用が RDB の永続性に関連しているかどうかを確認できます。
RDB 保存オペレーションによって一時的な負荷の急増がトリガーされる可能性があることがわかっているので、rdb_saves_count
指標を調べることができます。これにより、インスタンスの存続期間中の RDB 保存の累積数がわかります。この指標が、RDB 保存数の増分がレイテンシの増加に対応することを示しているとします。その場合は、RDB スナップショットの間隔を短くして、書き換えの頻度を下げることができます。インスタンスをスケールアウトして、ベースラインの負荷レベルを下げることもできます。
Memorystore for Valkey の指標の解釈
上記のリストに示されているように、指標の多くは、平均、最大、合計の 3 つのカテゴリに分かれます。
Memorystore for Redis Cluster の場合、同じ指標の平均と最大のバリエーションが提供されるため、両方を使用してその指標ファミリーのホットスポットを特定できます。
指標の合計値は独立しており、平均と最大でホットスポットを特定する目的とは関係なく、個別の分析情報を提供します。
平均指標と最大指標について
インスタンスの average_keyspace_hits
と maximum_keyspace_hits
の値を比較するとします。2 つの指標の差が大きくなるほど、インスタンスで発生するホットスポットが増加します。理想は、average_keyspace_hits
と maximum_keyspace_hits
の値が近いことです。これは、ホットスポットの発生がインスタンス間で均等に分散されていることを意味するためです。
この原則は、同じ指標の平均および最大の変動を持つすべての指標に適用されます。
ホットスポットの例
インスタンス内のすべてのシャードの average_keyspace_hits
と maximum_keyspace_hits
を比較すると、これらの値を比較すると、ホットスポットが発生している場所がわかります。たとえば、6 シャード インスタンスのシャードに次のヒット数があるとします。
- シャード 1 ~ 2 ヒット
- シャード 2 ~ 2 ヒット
- シャード 3 ~ 2 ヒット
- シャード 4 ~ 2 ヒット
- シャード 5 ~ 2 ヒット
- シャード 6 ~ 8 ヒット
この例では、average_keyspace_hits
は値 3 を返し、maximum_keyspace_hits
は 8 を返します。これは、シャード 6 がホットであることを示します。