Ops Agent 指标

在虚拟机实例上安装 Ops Agent 后,该代理会将本页中列出的指标类型的数据传输到 Monitoring。如需了解如何选择合适的代理,请参阅 Ops Agent 概览

  • 如需了解表中条目的一般说明,包括 DELTAGAUGE 等值的相关信息,请参阅指标类型

  • 如需了解指标列表中使用的单位,请参阅 MetricDescriptor 参考中的 unit 字段

  • 有关“每 x 秒采样”和“采样后,数据最多 y 秒不可见”等形式语句,请参阅其他信息:元数据

  • 如需查看受目前支持指标类型的完整列表,请参阅指标列表

  • 标题为“代理”的表中的指标类型免费,而其他类型是收费的。如需了解价格信息,请参阅监控价格

来自 Ops Agent 和 Monitoring 代理的指标

Monitoring 代理有两个完全不同的实现,一个用于 Linux 虚拟机,另一个用于 Windows 虚拟机。Ops Agent 在 Linux 和 Windows 虚拟机上运行。

仅限 Linux?

本页所列表格中的某些指标包括免责声明“仅限 Linux”。此免责声明意味着适用于 Windows 虚拟机的 Monitoring 代理不收集此指标。此免责声明不适用于在 Windows 虚拟机上运行的 Ops Agent。

指标收集方面的差异

下表介绍了 Ops Agent 和 Monitoring 代理提取的数据之间的差异。
指标类型,省略了
agent.googleapis.com
Ops Agent(正式版) Ops Agent(预览版) Monitoring 代理
disk/bytes_used
disk/percent_used
提取时 device 标签中包含完整路径;例如 /dev/sd15

未针对 tmpfsudev 等虚拟设备提取该指标。
提取时 device 标签的路径中不含 /dev;例如 sda15

针对 tmpfsudev 等虚拟设备提取该指标。
提取时 device 标签的路径中不含 /dev;例如 sda15

针对 tmpfsudev 等虚拟设备提取该指标。
processes/count_by_state 不提取。 提取。 提取。
swap/bytes_used 在 Linux 上提取时不含 device 标签。 在 Linux 上提取时包含 device 标签。 在 Linux 上提取时包含 device 标签。
正式版列指 Ops Agent 2.0.0 版及更高版本。预览版列是指低于 2.0.0 的 Ops Agent 版本。

代理指标

来自在 Google Cloud 虚拟机实例上运行的 Ops Agent 的指标。

代理

来自 Ops Agent 和 Linux Monitoring 代理的默认配置的指标。这些指标的发布阶段:正式版

此表中的“指标类型”字符串必须以 agent.googleapis.com/agent/ 为前缀。表中的条目已省略该前缀。

指标类型发布阶段
显示名
种类、类型、单位
受监控的资源
说明
标签
api_request_count 正式版
Monitoring 代理 API 请求数
CUMULATIVEINT641
aws_ec2_instance、gae_app、gce_instance、k8s_container
来自 Monitoring 代理的 API 请求数。仅限 Linux。每 60 秒采样一次。
state:请求状态。
log_entry_count 正式版
Logging 代理日志条目计数
CUMULATIVEINT641
aws_ec2_instance、gae_app、gce_instance、k8s_container
Logging 代理写入的日志条目的计数。仅限 Linux。每 60 秒采样一次。
response_code:来自 gRPC 和 HTTP 错误空间的数字响应代码。
log_entry_retry_count 正式版
Logging 代理重试的日志条目写入次数
CUMULATIVEINT641
aws_ec2_instance、gae_app、gce_instance、k8s_container
Logging 代理重试的日志条目写入次数。仅限 Linux。每 60 秒采样一次。
response_code:来自 gRPC 和 HTTP 错误空间的数字响应代码。
memory_usage 正式版
Monitoring 代理内存用量
GAUGEDOUBLEBy
aws_ec2_instance、gae_app、gce_instance、k8s_container
Monitoring 代理使用的内存。仅限 Linux。每 60 秒采样一次。
monitoring/point_count 正式版
Monitoring 代理指标点计数
CUMULATIVEINT641
aws_ec2_instance、gae_app、gce_instance、k8s_container
写入 Stackdriver Monitoring 的指标点计数。仅限 Linux。每 60 秒采样一次。
status:gRPC 响应代码。
request_count 正式版
Logging 代理 API 请求数
CUMULATIVEINT641
aws_ec2_instance、gae_app、gce_instance、k8s_container
来自 Logging 代理的 API 请求数。仅限 Linux。每 60 秒采样一次。
response_code:来自 gRPC 和 HTTP 错误空间的数字响应代码。
streamspace_size 正式版
Monitoring 代理进程标签大小
GAUGEDOUBLEBy
aws_ec2_instance、gae_app、gce_instance、k8s_container
Monitoring 代理在 24 小时的时间段内写入的进程标签的估计总大小。仅限 Linux。每 60 秒采样一次。
streamspace_size_throttling 正式版
Monitoring 代理正在限制进程
GAUGEDOUBLE1
aws_ec2_instance、gae_app、gce_instance、k8s_container
Monitoring 代理当前是否对进程指标进行限制。仅限 Linux。每 60 秒采样一次。
uptime 正式版
Monitoring/Logging 代理正常运行时间
CUMULATIVEINT64s
aws_ec2_instance、gae_app、gce_instance、k8s_container
Monitoring 代理或 Logging 代理的正常运行时间。仅限 Linux。每 60 秒采样一次。
version:代理版本。

CPU

来自 Ops AgentMonitoring 代理的默认配置的指标。Compute Engine 还会报告类似指标,但这些指标来自 Hypervisor,而不是来自虚拟机内部。这些指标的发布阶段:正式版

此表中的“指标类型”字符串必须以 agent.googleapis.com/cpu/ 为前缀。表中的条目已省略该前缀。

指标类型发布阶段
显示名
种类、类型、单位
受监控的资源
说明
标签
load_15m 正式版
CPU 负载(15 分钟)
GAUGEDOUBLE1
aws_ec2_instance、gce_instance
过去 15 分钟的负载平均值。仅限 Linux。每 60 秒采样一次。
load_1m 正式版
CPU 负载(1 分钟)
GAUGEDOUBLE1
aws_ec2_instance、gce_instance
过去 1 分钟的负载平均值。仅限 Linux。每 60 秒采样一次。
load_5m 正式版
CPU 负载(5 分钟)
GAUGEDOUBLE1
aws_ec2_instance、gce_instance
过去 5 分钟的负载平均值。仅限 Linux。每 60 秒采样一次。
usage_time 正式版
CPU 使用时间(操作系统报告)
CUMULATIVEINT64s{CPU}
aws_ec2_instance、gce_instance
CPU 在不同状态下所花费的总时间。此值从虚拟机内部报告,可能与由虚拟机的 Hypervisor 报告的“compute.googleapis.com/instance/cpu/usage_time”不同。仅限 Linux。每 60 秒采样一次。
cpu_number:CPU 编号,例如“0”、“1”或“2”。此标签仅针对特定 Monitoring 配置设置。
cpu_state:CPU 状态,为 [空闲、中断、良好、softirq、窃取、系统、用户、等待] 之一。
utilization 正式版
CPU 利用率(操作系统报告)
GAUGEDOUBLE%
aws_ec2_instance、gce_instance
在不同状态所花费的总 CPU 容量百分比。此值从虚拟机内部报告,可能与由虚拟机的 Hypervisor 报告的“compute.googleapis.com/instance/cpu/utilization”不同。每 60 秒采样一次。
cpu_number:CPU 编号,例如“0”、“1”或“2”。此标签仅针对特定 Monitoring 配置设置。仅限 Linux。
cpu_state:CPU 状态,在 Linux 上为 [空闲、中断、良好、softirq、窃取、系统、用户、等待] 之一,在 Windows 上为 [空闲、已使用] 之一。

磁盘

来自 Ops AgentMonitoring 代理的默认配置的指标。这些指标的发布阶段:正式版

此表中的“指标类型”字符串必须以 agent.googleapis.com/disk/ 为前缀。表中的条目已省略该前缀。

指标类型发布阶段
显示名
种类、类型、单位
受监控的资源
说明
标签
bytes_used 正式版
已使用的磁盘字节数
GAUGEDOUBLEBy
aws_ec2_instance、gce_instance
当前使用的磁盘字节数(按状态列出)。将所有状态的值求和会生成可用的磁盘空间总量。仅限 Linux。每 60 秒采样一次。
device:设备名称。
state:使用类型,为 [免费、已使用、预留] 之一。
io_time 正式版
磁盘 I/O 时间
CUMULATIVEINT64ms
aws_ec2_instance、gce_instance
当 I/O 操作在排队时以及磁盘忙碌时花费的累计时间。当至少有一个 I/O 操作待处理或正在进行时,该指标的值会增加。此值对应于 https://www.kernel.org/doc/Documentation/iostats.txt 文档中的字段 10。仅限 Linux。每 60 秒采样一次。
device:设备名称。
merged_operations 正式版
磁盘已合并操作
CUMULATIVEINT641
aws_ec2_instance、gce_instance
已合并的磁盘操作总数(按方向列出)。仅限 Linux。每 60 秒采样一次。
device:设备名称。
direction:方向,为 [读取、写入] 之一。
operation_count 正式版
磁盘操作
CUMULATIVEINT641
aws_ec2_instance、gce_instance
磁盘操作总数(按方向列出)。仅限 Linux。每 60 秒采样一次。
device:设备名称。
direction:方向,为 [读取、写入] 之一。
operation_time 正式版
磁盘操作时间
CUMULATIVEINT64ms
aws_ec2_instance、gce_instance
完成磁盘操作的平均时间乘以挂钟时间。作为速率校准时,该值为完成磁盘操作的平均时间。仅限 Linux。每 60 秒采样一次。
device:设备名称。
direction:方向,为 [读取、写入] 之一。
pending_operations 正式版
磁盘待处理操作
GAUGEDOUBLE1
aws_ec2_instance、gce_instance
当前待处理磁盘操作数。仅限 Linux。每 60 秒采样一次。
device:设备名称。
percent_used 正式版
磁盘利用率
GAUGEDOUBLE%
aws_ec2_instance、gce_instance
已使用磁盘的当前百分比(按状态列出)。利用率介于 0.0 到 100.0 之间。每 60 秒采样一次。
device:设备名称。
state:使用类型,为 [免费、已使用、预留] 之一。
read_bytes_count 正式版
已读取的磁盘字节数
CUMULATIVEINT64By
aws_ec2_instance、gce_instance
已读取的磁盘字节数总数。仅限 Linux。每 60 秒采样一次。
device:设备名称。
weighted_io_time 正式版
磁盘加权 I/O 时间
CUMULATIVEINT64ms
aws_ec2_instance、gce_instance
花费在磁盘 I/O 操作上的总时间(使用进行中的 I/O 数量进行加权)。该指标用于测量 I/O 完成时间以及可能会累积的积压大小。仅限 Linux。每 60 秒采样一次。
device:设备名称。
write_bytes_count 正式版
已写入的磁盘字节数
CUMULATIVEINT64By
aws_ec2_instance、gce_instance
已写入的磁盘字节总数。仅限 Linux。每 60 秒采样一次。
device:设备名称。

IIS

仅限 Microsoft Windows。来自 Microsoft Windows Ops Agent 和 Microsoft Windows Monitoring 代理的默认配置的指标。这些指标的发布阶段:正式版

此表中的“指标类型”字符串必须以 agent.googleapis.com/iis/ 为前缀。表中的条目已省略该前缀。

指标类型发布阶段
显示名
种类、类型、单位
受监控的资源
说明
标签
current_connections 正式版
IIS 打开的连接
GAUGEDOUBLE1
aws_ec2_instance、gce_instance
当前 IIS 的打开的连接。每 60 秒采样一次。
network/transferred_bytes_count 正式版
IIS 已传输的字节数
CUMULATIVEINT64By
aws_ec2_instance、gce_instance
IIS 已传输的网络字节数。每 60 秒采样一次。
direction:方向(已发送,已接收)
new_connection_count 正式版
IIS 连接
CUMULATIVEINT641
aws_ec2_instance、gce_instance
对 IIS 打开的连接。每 60 秒采样一次。
request_count 正式版
IIS 请求
CUMULATIVEINT641
aws_ec2_instance、gce_instance
向 IIS 发出的请求。每 60 秒采样一次。
http_method:Http 方法(post、put、get、delete、option、trace、head)

接口

来自 Ops Agent 和 Linux Monitoring 代理的默认配置的网络接口指标。这些指标的发布阶段:正式版

此表中的“指标类型”字符串必须以 agent.googleapis.com/interface/ 为前缀。表中的条目已省略该前缀。

指标类型发布阶段
显示名
种类、类型、单位
受监控的资源
说明
标签
errors 正式版
网络错误
CUMULATIVEINT641
aws_ec2_instance、gce_instance
网络错误总数。仅限 Linux。每 60 秒采样一次。
device:网络设备的名称。
direction:网络流量方向,为 [tx、rx] 之一。
packets 正式版
网络数据包数
CUMULATIVEINT641
aws_ec2_instance、gce_instance
已通过网络发送的数据包总数。仅限 Linux。每 60 秒采样一次。
device:网络设备的名称。
direction:网络流量方向,为 [tx、rx] 之一。
traffic 正式版
网络流量
CUMULATIVEINT64By
aws_ec2_instance、gce_instance
已通过网络发送的字节总数。仅限 Linux。每 60 秒采样一次。
device:网络设备的名称。
direction:网络流量方向,为 [tx、rx] 之一。

内存

来自 Ops AgentMonitoring 代理的默认配置的指标。这些指标的发布阶段:正式版

此表中的“指标类型”字符串必须以 agent.googleapis.com/memory/ 为前缀。表中的条目已省略该前缀。

指标类型发布阶段
显示名
种类、类型、单位
受监控的资源
说明
标签
bytes_used 正式版
内存用量
GAUGEDOUBLEBy
aws_ec2_instance、gce_instance
当前内存用量(按内存状态列出)。对所有状态的值求和会生成机器上的总内存。仅限 Linux。每 60 秒采样一次。
state:为 [已缓冲、已缓存、免费、Slab、已使用] 之一。
percent_used 正式版
内存利用率
GAUGEDOUBLE%
aws_ec2_instance、gce_instance
当前使用的内存百分比(按内存状态列出)。所有状态的总和为 100%。每 60 秒采样一次。
state:为 [已缓冲、已缓存、免费、Slab、已使用] 之一。

mssql

仅限 Microsoft Windows。来自 Microsoft Windows Ops Agent 和 Microsoft Windows Monitoring 代理的默认配置的指标。这些指标的发布阶段:正式版

此表中的“指标类型”字符串必须以 agent.googleapis.com/mssql/ 为前缀。表中的条目已省略该前缀。

指标类型发布阶段
显示名
种类、类型、单位
受监控的资源
说明
标签
connections/user 正式版
SQL Server 打开的连接
GAUGEDOUBLE1
aws_ec2_instance、gce_instance
SQL Server 的当前打开的连接。每 60 秒采样一次。
transaction_rate 正式版
SQL Server 事务率
GAUGEDOUBLE1/s
aws_ec2_instance、gce_instance
SQL Server 每秒总事务数。每 60 秒采样一次。
write_transaction_rate 正式版
SQL Server 写入事务速率
GAUGEDOUBLE1/s
aws_ec2_instance、gce_instance
SQL Server 每秒写入事务数。每 60 秒采样一次。

网络

来自 Ops AgentMonitoring 代理的默认配置的指标。这些指标的发布阶段:正式版

此表中的“指标类型”字符串必须以 agent.googleapis.com/network/ 为前缀。表中的条目已省略该前缀。

指标类型发布阶段
显示名
种类、类型、单位
受监控的资源
说明
标签
tcp_connections 正式版
TCP 连接
GAUGEDOUBLE1
aws_ec2_instance、gce_instance
当前 TCP 连接数。每 60 秒采样一次。
port本地主机或远程主机上的 TCP 端口号,例如“0-local”、“0-remote”或“all”。
tcp_state:TCP 状态,例如“ESTABLISHED”或“FIN_WAIT1”。

页面文件

来自 Ops Agent 和 Microsoft Windows Monitoring 代理的默认配置的指标。这些指标的发布阶段:正式版

此表中的“指标类型”字符串必须以 agent.googleapis.com/pagefile/ 为前缀。表中的条目已省略该前缀。

指标类型发布阶段
显示名
种类、类型、单位
受监控的资源
说明
标签
percent_used 正式版
页面文件利用率
GAUGEDOUBLE%
aws_ec2_instance、gce_instance
已使用的页面文件的当前百分比(按状态列出)值介于 0.0 到 100.0 之间。仅限 Windows。每 60 秒采样一次。
state:使用类型,为 [免费、已使用] 之一。

进程

来自 Ops AgentMonitoring 代理的默认配置的指标。这些指标的发布阶段:正式版

此表中的“指标类型”字符串必须以 agent.googleapis.com/processes/ 为前缀。表中的条目已省略该前缀。

指标类型发布阶段
显示名
种类、类型、单位
受监控的资源
说明
标签
count_by_state GA
流程
GAUGEDOUBLE1
aws_ec2_instance、gce_instance
指定状态的流程计数。仅限 Linux。每 60 秒采样一次。
state:跑步、睡觉、僵化等。
cpu_time GA
流程 CPU
CUMULATIVE、 INT64、 us{CPU}
aws_ec2_instance, gce_instance
给定流程的 CPU 时间。每 60 秒采样一次。
process:流程名称。
user_or_syst:用户或系统进程。
command:进程命令。
command_line:进程命令行,最多 1024 个字符。
owner:进程所有者。
pid:进程 ID。
disk/read_bytes_count GA
处理磁盘读取 I/O
CUMULATIVEINT64By
aws_ec2_instance、gce_instance
流程磁盘读取 I/O。仅限 Linux。每 60 秒采样一次。
process:流程名称。
command:进程命令。
command_line:进程命令行,最多 1024 个字符。
owner:进程所有者。
pid:进程 ID。
disk/write_bytes_count GA
流程磁盘写入 I/O
CUMULATIVEINT64By
aws_ec2_instance、gce_instance
流程磁盘写入 I/O。仅限 Linux。每 60 秒采样一次。
process:流程名称。
command:进程命令。
command_line:进程命令行,最多 1024 个字符。
owner:进程所有者。
pid:进程 ID。
fork_count GA
叉数
CUMULATIVEINT641
aws_ec2_instance、gce_instance
分支流程总数。仅限 Linux。每 60 秒采样一次。
rss_usage GA
处理常驻内存
GAUGEDOUBLEBy
aws_ec2_instance、gce_instance
给定进程的常驻内存使用量。仅限 Linux。每 60 秒采样一次。
process:流程名称。
command:进程命令。
command_line:进程命令行,最多 1024 个字符。
owner:进程所有者。
pid:进程 ID。
vm_usage GA
处理虚拟内存
GAUGEDOUBLEBy
aws_ec2_instance、gce_instance
给定流程的虚拟机使用情况。每 60 秒采样一次。
process:流程名称。
command:进程命令。
command_line:进程命令行,最多 1024 个字符。
owner:进程所有者。
pid:进程 ID。

交换空间

来自 Ops Agent 和 Linux Monitoring 代理的默认配置的指标。这些指标的发布阶段:正式版

此表中的“指标类型”字符串必须以 agent.googleapis.com/swap/ 为前缀。表中的条目已省略该前缀。

指标类型发布阶段
显示名
种类、类型、单位
受监控的资源
说明
标签
bytes_used 正式版
交换空间用量
GAUGEDOUBLEBy
aws_ec2_instance、gce_instance
当前使用的交换空间字节数(按状态列出)。要使此指标可用,必须在实例上启用交换空间。仅限 Linux。每 60 秒采样一次。
device:交换空间设备。
state:为 [已使用、免费、已缓存、预留] 之一。
io 正式版
交换空间 I/O 操作
CUMULATIVEINT641
aws_ec2_instance、gce_instance
交换空间 I/O 操作的总数(按方向列出)。要使此指标可用,必须在实例上启用交换空间。仅限 Linux。每 60 秒采样一次。
direction:交换空间 I/O 方向,为 [输入、输出] 之一。
percent_used 正式版
交换空间利用率
GAUGEDOUBLE%
aws_ec2_instance、gce_instance
已使用的交换空间的当前百分比(按状态列出)值介于 0.0 到 100.0 之间。要使此指标可用,必须在实例上启用交换空间。仅限 Linux。每 60 秒采样一次。
device:交换空间设备。
state:为 [已使用、免费、已缓存、预留] 之一。

第三方应用指标

nginx

nginx 的指标。如需了解如何收集这些指标,请参阅为 nginx 配置 Ops Agent 指南。

指标类型
种类、类型
受监控的资源
标签
workload.googleapis.com/nginx.requests
CUMULATIVEINT64
gce_instance
 
workload.googleapis.com/nginx.connections_accepted
CUMULATIVEINT64
gce_instance
 
workload.googleapis.com/nginx.connections_handled
CUMULATIVEINT64
gce_instance
 
workload.googleapis.com/nginx.connections_current
GAUGEINT64
gce_instance
state