监控 NetApp 卷

本页介绍了如何监控 Google Cloud NetApp Volumes。

Cloud Monitoring 指标

Cloud Monitoring 中提供了用于监控 NetApp 卷的各种指标。类别包括卷、存储空间池和复制指标。

您可以在 Metrics Explorer 中选择并绘制各个指标的图表,创建包含多个图表的信息中心,添加提醒,或使用 Cloud Monitoring API 检索指标数据。

受监控的资源

netapp.googleapis.com 位于每个受监控的资源之前。例如,对于音量,完整的受监控的资源为 netapp.googleapis.com/volume

受监控的资源 资源元数据字段
Volume labels

service_level

storage_pool

protocols
StoragePool labels

service_level
Replication service_level

资源指标

netapp.googleapis.com 位于每个指标之前。例如,volume/bytes_used 指标的完整指标为 netapp.googleapis.com/volume/bytes_used

系统每 5 分钟对指标进行一次采样,然后将其推送到 Cloud Monitoring。在 Cloud Monitoring Metrics Explorer 中,选择一个指标,并使用至少 5 分钟的对齐周期以获得准确的结果。

指标名称 说明 受监控的资源 指标类型 单位
/volume/backup_used 备份的字节数
(基准和
增量更改)。
/volume byte
/volume/bytes_used 用于存储
写入为文件的数据以及
用于快照的额外空间
/volume byte
/volume/snapshot_bytes 用于快照的容量
/volume byte
/volume/allocated_bytes 从存储池分配给卷的容量
/volume byte
/volume/auto_tiering/tiered_bytes 自动分层卷使用的

容量按分层类型:冷或热。
/volume
  • 热门
byte
/volume/auto_tiering/cold_tier_read_byte_count 从卷的冷
层读取的容量。
/volume byte
/volume/auto_tiering/cold_tier_write_byte_count 将容量写入卷的冷
层级。
/volume byte
/volume/operation_count 客户端对卷宗执行的操作数。

/volume
  • read
  • write
  • 元数据
1
/volume/throughput
操作类型的吞吐量。
/volume
  • read
  • write
  • 元数据
byte
/volume/average_latency 存储系统内的卷 I/O 操作延迟时间
/volume
  • read
  • write
  • 元数据
ms
/volume/backup_current_transfer_bytes 当前作业到目前为止转移的数据量
/volume byte
/volume/backup_healthy FALSE如果备份传输
未能按时完成或失败,或者
发生了手动备份失败。
/volume BOOL
/volume/backup_last_transfer_duration 上次转移作业的时长
/volume sec
/volume/backup_last_transfer_size 上一个传输作业的大小。
/volume byte
/volume/backup_transferring 备份状态:
TRUE = 传输中,
FALSE = 空闲。
/volume BOOL
/volume/inode_limit 为卷分配的 inode(硬上限)。


与卷的分配容量
(大小)相关联
/volume 1
/volume/inode_used 卷上正在使用的 inode 数量。
/volume 1
/volume/throughput_limit 为该卷分配的最大吞吐量
/volume KiB/s
/storage_pool/allocated 分配给卷的存储池容量。
/storagePool byte
/storage_pool/auto_tiering/tiered_bytes 存储池容量分层
类型:冷备用、非冷备用。
/storagePool
  • 非冷
byte
/storage_pool/auto_tiering/cold_tier_read_byte_count 从池的冷
层读取的字节数。
/storagePool byte
/storage_pool/auto_tiering/cold_tier_write_byte_count 写入到池冷
层的字节数。
/storagePool byte
/storage_pool/capacity 池的总大小。 /storagePool byte
/storage_pool/replication_status
区域性弹性版资源池的复制状态。0 表示
不同步,1 表示同步
,2 表示正在赶上。
/storagePool 1
/replication/healthy 如果
关系未错过
上次安排的传输
,则值为 TRUE;如果
错过了
安排的传输
或传输不正常,则值为 FALSE
/replication BOOL
/replication/lag_time
源上拍摄
传输快照以来经过的时间,包括传输时长。
/replication sec
/replication/last_
transfer_duration
上一次
转移作业的时长。
/replication sec
/replication/last
_transfer_size
上次传输作业的大小。 /replication byte
/replication/current
/transfer_bytes
当前作业到目前为止转移的数据量。
/replication byte
/replication/transferring 复制状态:
  • TRUE = 正在转移
  • FALSE = 闲置
/replication BOOL
/replication/total_
transfer_byte_count
自该关系创建以来,为其转移的累计数据

可以重置为 0
/replication byte

借助 Cloud Monitoring,您还可以设置在指标满足特定条件时发送提醒。例如,您可以使用 Cloud Monitoring 在卷空间用尽之前触发管理通知。请参阅 Cloud Monitoring 提醒

使用 Cloud Monitoring 跟踪音量性能统计信息

Cloud Monitoring 会跟踪每个卷级别的以下性能指标:

  • /volume/operation_count
  • /volume/throughput
  • /volume/average_latency

这些指标每 5 分钟更新一次,可概览一段时间(或更长时间)内的效果趋势。

这些指标仅反映服务性能。建议您使用客户端提供的监控工具了解详情。例如,如果请求在发送到服务之前先在客户端上加入队列,则客户端上观察到的延迟时间可能会高于服务报告的延迟时间。

后续步骤

监控音量使用情况