查看 Cloud Router 路由器日志和指标

Cloud Router 将日志记录信息发送到 Cloud Logging,并将监控指标发送到 Cloud Monitoring。本页介绍了如何访问这两种信息。

日志

Cloud Router 路由器会将某些事件(例如路由和 BGP 事件)发送到 Logging

Cloud Logging 会记录以下事件:

  • 与您的 Cloud Router 路由器相关的路由器事件
  • 与 BGP 配置和会话相关的 BGP 事件
  • 与两个 BGP 对等端之间的路由公告相关的路由事件

如何查看日志

如需查看日志,请按以下步骤操作:

  1. 在 Google Cloud Console 中,打开 Cloud Router 路由器页面。

    打开“Cloud Router 路由器”页面

  2. 日志列中,点击查看

    Cloud Router 日志具有以下格式:

    [事件类型]: [日志文本]

  3. 如需进行高级搜索,请在“按标签过滤或搜索文字”框中,点击最右侧的三角形并选择转换为高级过滤条件

参考日志

下表列出了 Logging 参考日志中记录的事件。

事件 说明
路由器事件 路由器任务已激活
路由器任务已停用
BGP 事件 已成功为对等互连添加配置:LIST_OF_PEERS
X 秒前与 PEER 建立了 BGP 对等互连
PEER 建立的 BGP 对等互连出现故障
BGP 路由器 ID 设置为:BGP_ROUTER_ID
路由事件 向对等体通告前缀:PREFIX
从对等体中撤消前缀:PREFIX
Cloud Router 路由器收到前缀 PREFIX 下一个跃点 LIST_OF_NEXTHOPS
从 Cloud Router 路由器删除了前缀 PREFIX 下一个跃点 LIST_OF_NEXTHOPS

常见 Logging 事件

如需查看下表中所列的 Cloud Router 路由器常见 Logging 事件,请使用查看日志的说明并指定如下所列的高级过滤条件之一。根据需要调整 Logging 搜索的时间范围。

事件描述 Logging 高级过滤条件
迁移或重启 Cloud Router 路由器进程 resource.type="gce_router"
"task activated"
添加已学习的路由 resource.type="gce_router"
("Route Event" AND "received by cloud router")
移除已学习的路由 resource.type="gce_router"
("Route Event" AND "deleted from cloud router")
导出通告的路由 resource.type="gce_router"
("Route Event" AND "Advertising prefix")
BGP 对等互连出现 resource.type="gce_router"
("BGP peering" AND "came up")
BGP 对等互连出现故障 resource.type="gce_router"
("BGP peering" AND "went down")
由于收到的路由过多,BGP 会话被终止 resource.type="gce_router"
("NOTIFICATION 6/1")
severity="CRITICAL"
超出了 Cloud Router 路由配额限制 resource.type="gce_network_region"
("No more routes" AND "can be programmed")
severity="ERROR"
因配额问题,前缀被丢弃 resource.type="gce_network_region"
severity="ERROR"
jsonPayload.affectedResource.routes.nextHopIpAddresses="PEER IP ADDRESS"

指标

Cloud Router 将指标发布到 Cloud Monitoring。如需查看为 Cloud Router 发布的指标列表,请参阅 Cloud Router 的 Monitoring 指标

使用 API 查看指标

您可以使用 Cloud Monitoring API 访问这些指标。如需了解详情,请参阅读取指标数据

使用 Cloud Monitoring 信息中心查看指标

您还可以在 Cloud Monitoring 中创建自定义信息中心,以帮助分析这些指标。如需详细了解如何创建自定义信息中心,请参阅通过控制台管理信息中心

如需创建自定义信息中心,请执行以下操作:

  1. 在 Google Cloud Console 中,转到 Monitoring

    转到 Monitoring

  2. 选择信息中心 > 创建信息中心

  3. Untitled Dashboard 替换为相应的名称。

  4. 点击添加图表

  5. 查找资源类型和指标字段中,添加 Cloud Router 作为资源,然后添加 Cloud Router 路由器指标。

  6. 更改图表标题或使用建议的标题。

  7. 使用过滤器控件将视图限制为仅显示某些路由器或会话。

  8. 要添加其他指标,请点击添加指标

  9. 点击保存将图表添加到信息中心。

一些指标适用于 Cloud Router 路由器,另一些指标则适用于指定 Cloud Router 路由器上的 BGP 会话。Cloud Router 路由器指标会显示为 router-name,而 BGP 会话指标会显示为 router-name(bgp-name)

Cloud Router 的 Monitoring 指标

此表中的“指标类型”字符串必须以 router.googleapis.com/ 为前缀。表中的条目已省略该前缀。

指标类型发布阶段
显示名
种类、类型、单位
受监控的资源
说明
标签
best_received_routes_count GA
收到的路由数
GAUGEINT641
gce_router
路由器当前收到的最佳路由数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
bfd/control/receive_intervals Beta 版
BFD 控制数据包接收时间间隔
GAUGEINT64ms
gce_router
BFD 控制数据包接收时间间隔。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP 地址。
bfd/control/received_packets_count Beta 版
收到的控制数据包数
DELTAINT641
gce_router
从此 BFD 会话收到的控制数据包数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP 地址。
bfd/control/rejected_packets_count (Beta 版)
拒绝的控制数据包数
DELTAINT641
gce_router
拒绝来自此 BFD 会话的控制数据包数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP 地址。
bfd/control/transmit_intervals Beta 版
BFD 控制数据包传输时间间隔
GAUGEINT64ms
gce_router
BFD 控制数据包传输时间间隔。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP 地址。
bfd/control/transmitted_packets_count (Beta 版)
传输的控制数据包数
DELTAINT641
gce_router
从此 BFD 会话传输的控制数据包数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP。
bfd/session_flap_events_count Beta 版
BFD 会话不稳定
DELTAINT641
gce_router
此 BFD 会话中的每个 BFD 缺陷事件数。会话缺陷事件指的是从“向上”状态过渡。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP。
event_type:BFD 缺陷的原因,如“AdminDown”或“ControlDetectionTimeExpired”。
bfd/session_up Beta 版
BFD 会话状态
GAUGEINT641
gce_router
BFD 会话建立成功的指示符。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP 地址。
bgp/received_routes_count GA
BGP 收到的路由数
GAUGEINT641
gce_router
bgp 会话上收到的当前路由数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
bgp_peer_name:bgp 会话的名称。
bgp/sent_routes_count GA
BGP 发送的路由数
GAUGEINT641
gce_router
在 bgp 会话中发送的路由数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
bgp_peer_name:bgp 会话的名称。
bgp/session_up GA
BGP 会话状态
GAUGEINT641
gce_router
bgp 会话建立成功的指示符。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
bgp_peer_name:bgp 会话的名称。
bgp_sessions_down_count GA
关闭的 BGP 会话数
GAUGEINT641
gce_router
路由器上关闭的 BGP 会话数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
bgp_sessions_up_count GA
启动的 BGP 会话数
GAUGEINT641
gce_router
路由器上启动的 BGP 会话数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
dynamic_routes/learned_routes/any_dropped_unique_destinations Beta 版
所有唯一目的地都舍弃
GAUGE、 BOOL、 1
gce_network_region
一个布尔值指标,用于判断网络区域中是否有任何唯一目标因超出配额而被舍弃。每 60 秒采样一次。采样后,数据在最长 60 秒的时间内不会显示。
routing_mode:路由的路由模式,是 [“全局性”- 从远程区域获知的;"区域性" - 从本地区域获知的]。
dynamic_routes/learned_routes/dropped_unique_destinations (Beta 版)
舍弃了唯一目的地
GAUGE、 INT64、 1
gce_network_region
因超出配额而在一个网络区域中丢弃的唯一目的地的数量。每 60 秒采样一次。采样后,数据在最长 60 秒的时间内不会显示。
routing_mode:路由的路由模式,是 [“全局性”- 从远程区域获知的;"区域性" - 从本地区域获知的]。
dynamic_routes/learned_routes/unique_destinations_limit Beta 版
唯一目的地数量限制
GAUGE、 INT64、 1
gce_network_region
此网络区域路由配额允许的唯一目标数量上限。每 60 秒采样一次。采样后,数据在最长 60 秒的时间内不会显示。
routing_mode:路由的路由模式,是 [“全局性”- 从远程区域获知的;"区域性" - 从本地区域获知的]。
dynamic_routes/learned_routes/used_unique_destinations (Beta 版)
使用的唯一目的地数量
GAUGE、 INT64、 1
gce_network_region
此网络区域的已知路由使用的唯一目标数量。每 60 秒采样一次。采样后,数据在最长 60 秒的时间内不会显示。
routing_mode:路由的路由模式,是 [“全局性”- 从远程区域获知的;"区域性" - 从本地区域获知的]。
nat/allocated_ports GA
已分配的端口
GAUGEINT64{port}
nat_gateway
NAT 网关分配给所有虚拟机的端口数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
nat_ip:端口的 NAT IP 地址。
nat/closed_connections_count GA
关闭的连接数
DELTAINT64{connection}
nat_gateway
NAT 网关上关闭的连接数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/dropped_received_packets_count GA
收到但被丢弃的数据包数
DELTAINT64{packet}
nat_gateway
NAT 网关收到但丢弃的数据包数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/dropped_sent_packets_count GA
发送但丢弃的数据包数
DELTAINT64{packet}
nat_gateway
NAT 网关发送但丢弃的数据包数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
reason:数据包丢弃的原因。可能的值为 OUT_OF_RESOURCES、ENDPOINT_INDEPENDENCE_CONFLICT。
nat/nat_allocation_failed GA
NAT 分配失败
GAUGEBOOL
nat_gateway
指示在向 NAT 网关中的任何虚拟机分配 NAT IP 地址时是否失败。每 60 秒采样一次。采样后,数据在最长 120 秒的时间内不会显示。
nat/new_connections_count GA
新的连接数
DELTAINT64{connection}
nat_gateway
通过 NAT 网关创建的新连接数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/open_connections GA
打开的连接数
GAUGEINT64{connection}
nat_gateway
目前在 NAT 网关上打开的连接数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/port_usage GA
端口使用量
GAUGEINT64{port}
nat_gateway
从虚拟机到单个互联网端点 (IP:port) 的连接数上限。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/received_bytes_count GA
收到的字节数
DELTAINT64By
nat_gateway
通过 NAT 网关接收的字节数(互联网 -> 虚拟机)。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/received_packets_count GA
收到的数据包数
DELTAINT64{packet}
nat_gateway
通过 NAT 网关接收到的数据包数(互联网 -> 虚拟机)。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/sent_bytes_count GA
已发送的字节数
DELTAINT64By
nat_gateway
通过 NAT 网关发送的字节数(虚拟机 -> 互联网)。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/sent_packets_count GA
已发送的数据包数
DELTAINT64{packet}
nat_gateway
通过 NAT 网关发送的数据包数(虚拟机 -> 互联网)。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
router_up GA
路由器状态
GAUGEINT641
gce_router
路由器状态(启动或关闭)。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
sent_routes_count GA
已发送的路由数
GAUGEINT641
gce_router
路由器当前发送的路由数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。

世界协调时间 (UTC) 2021-09-09 23:54:53 生成的表。