查看日志和指标

Cloud Router 路由器将日志记录信息发送到 Cloud Logging,并将监控指标发送到 Cloud Monitoring。本页介绍了如何访问这两种信息。

日志

Cloud Router 路由器将日志记录信息发送到 Cloud Logging,用于记录以下事件:

  • 与您的 Cloud Router 路由器相关的路由器事件
  • 与 BGP 配置和会话相关的 BGP 事件
  • 与两个 BGP 对等端之间的路由公告相关的路由事件

查看日志

控制台

  1. 在 Google Cloud 控制台中,前往 Cloud Router 路由器页面。

    前往“Cloud Router 路由器”

  2. 从 Cloud Router 路由器列表中选择 Cloud Router 路由器。

  3. 日志列中,点击查看

    Cloud Router 日志具有以下格式:

    [Event Type]: [Log Text]
    
  4. 如需在 Logs Explorer 中构建查询,请参阅在 Logs Explorer 中构建查询

参考日志

下表列出了 Logging 信息日志中记录的事件。

事件 说明
路由器事件 路由器任务已激活
路由器任务已停用
BGP 事件 已成功为对等互连添加配置:LIST_OF_PEERS
X 秒前与 PEER 建立了 BGP 对等互连
PEER 的 BGP 对等互连关闭,原因为 MESSAGE,其中 MESSAGE 提供了说明,例如 HOLD_TIMER_EXPIREDLINK_DOWN
如需详细了解 LINK_DOWN,请参阅 Cloud Router 路由器日志中出现 LINK_DOWN 消息
BGP 路由器 ID 设置为 BGP_ROUTER_ID
路由事件 向对等体通告前缀:PREFIX
从对等体中撤消前缀:PREFIX
Cloud Router 路由器收到前缀 PREFIX 下一个跃点 LIST_OF_NEXTHOPS
从 Cloud Router 路由器删除了前缀 PREFIX 下一个跃点 LIST_OF_NEXTHOPS

常见 Logging 事件

如需查看下表中所列的 Cloud Router 路由器常见 Logging 事件,请按照查看日志的步骤操作。指定表中列出的高级过滤条件之一。根据需要调整 Logging 搜索的时间范围。

活动说明 Logging 高级过滤条件
迁移或重启 Cloud Router 路由器进程 resource.type="gce_router"
"task activated"
添加已学习的路由 resource.type="gce_router"
"received by cloud router"
移除已知路由 resource.type="gce_router"
"deleted from cloud router"
导出通告的路由 resource.type="gce_router"
("Route Event" AND "Advertising prefix")
BGP 对等互连出现 resource.type="gce_router"
("BGP peering" AND "came up")
BGP 对等互连附带 MD5 身份验证 resource.type="gce_router"
("BGP peering" AND "came up" AND "MD5 authentication enabled")
BGP 对等互连出现故障 resource.type="gce_router"
("BGP peering" AND "went down")
BGP 对等互连断开,因为 Google 对等互连边缘路由器上的链路断开 resource.type="gce_router"
("BGP peering" AND "went down" AND "LINK_DOWN")
由于收到的路由过多,BGP 会话会关停 resource.type="gce_router"
("NOTIFICATION 6/1")
severity="CRITICAL"
超出了 Cloud Router 路由配额限制 resource.type="gce_network_region"
("No more routes" AND "can be programmed")
severity="ERROR"
因配额问题,前缀被丢弃 resource.type="gce_network_region"
severity="ERROR"
jsonPayload.affectedResource.routes.nextHopIpAddresses="PEER_IP_ADDRESS"
BFD 会话正在等待对等方 resource.type="gce_router"
("BFD Event" AND "bfd enabled, state [Init, NoDiagnostic]")
BFD 会话启动 resource.type="gce_router"
("BFD Event" AND "to [Up, NoDiagnostic]")
BFD 会话关闭(Rx 计时器过期) resource.type="gce_router"
("BFD Event" AND "to [Down, ControlDetectionTimeExpired]")
BFD 会话关闭(对等体状态为 DownAdminDown resource.type="gce_router"
("BFD Event" AND "to [Down, NeighborSessionDown]")
BFD 会话已在本地停用 resource.type="gce_router"
("BFD Event" AND "bfd disabled")

指标

Cloud Router 将指标发布到 Cloud Monitoring。如需查看为 Cloud Router 发布的指标列表,请参阅监控 Cloud Router 的指标

所有 Cloud Router 路由器指标都涵盖 IPv4 和 IPv6 流量。

使用 API 查看指标

您可以使用 Cloud Monitoring API 访问这些指标。如需了解详情,请参阅读取指标数据

使用 Monitoring 信息中心查看指标

您还可以在 Cloud Monitoring 中创建自定义信息中心,以帮助分析这些指标。如需了解详情,请参阅管理自定义信息中心

如需创建自定义信息中心,请按以下步骤操作。

控制台

  1. 在 Google Cloud 控制台中,前往 Monitoring 页面。

    转到“监控”

  2. 选择信息中心,然后在信息中心概览页面上点击 创建信息中心

  3. 可选:使用信息中心的描述性名称更新信息中心标题。

  4. 图表库中,选择要添加的图表。例如,如需将折线图添加到信息中心,请点击该条目或将该条目从图表库拖动到图表区域。

  5. 图表标题中,更改图表标题或使用建议的标题。

  6. “您要查看哪些数据?”中,执行以下操作:

    1. 资源类型中,点击输入内容以进行过滤字段,然后输入 Cloud Router
    2. 指标中,添加 Cloud Router 路由器指标。
  7. 使用过滤器控件将视图限制为仅显示某些路由器或会话。

  8. 要添加其他指标,请点击添加其他指标

其中一些指标适用于 Cloud Router,另一些指标适用于给定 Cloud Router 路由器上的 BGP 会话。Cloud Router 路由器指标会显示为 router-name,而 BGP 会话指标会显示为 router-name(bgp-name)

Cloud Router 的 Monitoring 指标

此表中的“指标类型”字符串必须以 router.googleapis.com/ 为前缀。表中的条目已省略该前缀。 查询标签时,请使用 metric.labels. 前缀;例如 metric.labels.LABEL="VALUE"

指标类型发布阶段
显示名
种类、类型、单位
受监控的资源
说明
标签
best_received_routes_count GA
收到的路由数
GAUGEINT641
gce_router
路由器当前收到的最佳路由数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
bfd/control/receive_intervals Beta 版
BFD 控制数据包接收时间间隔
GAUGEINT64ms
gce_router
BFD 控制数据包接收时间间隔。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP 地址。
bfd/control/received_packets_count Beta 版
收到的控制数据包数
DELTAINT641
gce_router
从此 BFD 会话收到的控制数据包数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP 地址。
bfd/control/rejected_packets_count Beta 版
拒绝的控制数据包数
DELTAINT641
gce_router
拒绝来自此 BFD 会话的控制数据包数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP 地址。
bfd/control/transmit_intervals Beta 版
BFD 控制数据包传输时间间隔
GAUGEINT64ms
gce_router
BFD 控制数据包传输时间间隔。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP 地址。
bfd/control/transmitted_packets_count Beta 版
传输的控制数据包数
DELTAINT641
gce_router
从此 BFD 会话传输的控制数据包数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP 地址。
bfd/session_flap_events_count Beta 版
BFD 会话不稳定
DELTAINT641
gce_router
此 BFD 会话中的每个 BFD 缺陷事件数。会话缺陷事件指的是从“向上”状态过渡。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP 地址。
event_type:BFD 缺陷的原因,如“AdminDown”或“ControlDetectionTimeExpired”。
bfd/session_up Beta 版
BFD 会话状态
GAUGEINT641
gce_router
BFD 会话建立成功的指示符。1 表示会话已启动。0 表示会话已关闭。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
peer_ip:BFD 会话的对等 IP 地址。
bgp/received_routes_count GA
BGP 收到的路由数
GAUGEINT641
gce_router
bgp 会话上收到的当前路由数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
bgp_peer_name:bgp 会话的名称。
bgp/sent_routes_count GA
BGP 发送的路由数
GAUGEINT641
gce_router
在 bgp 会话中发送的路由数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
bgp_peer_name:bgp 会话的名称。
bgp/session_up GA
BGP 会话状态
GAUGEINT641
gce_router
bgp 会话建立成功的指示符。1 表示会话已启动。0 表示会话已关闭。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
bgp_peer_name:bgp 会话的名称。
bgp_sessions_down_count GA
关闭的 BGP 会话数
GAUGEINT641
gce_router
路由器上关闭的 BGP 会话数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
bgp_sessions_up_count GA
启动的 BGP 会话数
GAUGEINT641
gce_router
路由器上启动的 BGP 会话数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
dynamic_routes/learned_routes/any_dropped_unique_destinations Beta 版
所有唯一目的地都舍弃
GAUGEBOOL1
gce_network_region
一个布尔值指标,用于判断网络区域中是否有任何唯一目标因超出配额而被舍弃。每 60 秒采样一次。采样后,数据在最长 60 秒的时间内不会显示。
routing_mode:路由的路由模式,是 [“全局性”- 从远程区域获知的;"区域性" - 从本地区域获知的]。
dynamic_routes/learned_routes/dropped_unique_destinations Beta 版
舍弃了唯一目的地
GAUGEINT641
gce_network_region
因超出配额而在一个网络区域中丢弃的唯一目的地的数量。每 60 秒采样一次。采样后,数据在最长 60 秒的时间内不会显示。
routing_mode:路由的路由模式,是 [“全局性”- 从远程区域获知的;"区域性" - 从本地区域获知的]。
dynamic_routes/learned_routes/unique_destinations_limit Beta 版
唯一目的地数量限制
GAUGEINT641
gce_network_region
此网络区域路由配额允许的唯一目标数量上限。每 60 秒采样一次。采样后,数据在最长 60 秒的时间内不会显示。
routing_mode:路由的路由模式,是 [“全局性”- 从远程区域获知的;"区域性" - 从本地区域获知的]。
dynamic_routes/learned_routes/used_unique_destinations Beta 版
使用的唯一目的地数量
GAUGEINT641
gce_network_region
此网络区域的已知路由使用的唯一目标数量。每 60 秒采样一次。采样后,数据在最长 60 秒的时间内不会显示。
routing_mode:路由的路由模式,是 [“全局性”- 从远程区域获知的;"区域性" - 从本地区域获知的]。
nat/allocated_ports GA
已分配的端口数
GAUGEINT64{port}
nat_gateway
NAT 网关分配给所有虚拟机的端口数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
nat_ip:端口的 NAT IP 地址。
nat/closed_connections_count GA
关闭的连接数
DELTAINT64{connection}
nat_gateway
NAT 网关上关闭的连接数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/dropped_received_packets_count GA
收到但被丢弃的数据包数
DELTAINT64{packet}
nat_gateway
NAT 网关收到但丢弃的数据包数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/dropped_sent_packets_count GA
发送但丢弃的数据包数
DELTAINT64{packet}
nat_gateway
NAT 网关发送但丢弃的数据包数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
reason:数据包丢弃的原因。可能的值为 OUT_OF_RESOURCES、ENDPOINT_INDEPENDENCE_CONFLICT。
nat/nat_allocation_failed GA
NAT 分配失败
GAUGEBOOL
nat_gateway
指示在向 NAT 网关中的任何虚拟机分配 NAT IP 地址时是否失败。每 60 秒采样一次。采样后,数据在最长 120 秒的时间内不会显示。
nat/new_connections_count GA
新的连接数
DELTAINT64{connection}
nat_gateway
通过 NAT 网关创建的新连接数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/open_connections GA
打开的连接数
GAUGEINT64{connection}
nat_gateway
目前在 NAT 网关上打开的连接数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/port_usage GA
端口使用量
GAUGEINT64{port}
nat_gateway
从虚拟机到单个互联网端点 (IP:port) 的连接数上限。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/received_bytes_count GA
收到的字节数
DELTAINT64By
nat_gateway
通过 NAT 网关接收的字节数(目的地 -> 虚拟机)。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/received_packets_count GA
收到的数据包数
DELTAINT64{packet}
nat_gateway
通过 NAT 网关接收到的数据包数(目的地 -> 虚拟机)。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/sent_bytes_count GA
已发送的字节数
DELTAINT64By
nat_gateway
通过 NAT 网关发送的字节数(虚拟机 -> 目的地)。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
nat/sent_packets_count GA
已发送的数据包数
DELTAINT64{packet}
nat_gateway
通过 NAT 网关发送的数据包数(虚拟机 -> 目的地)。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。
ip_protocol:连接的协议。可以是 TCP、UDP 或 ICMP。
router_up GA
路由器任务已启动
GAUGEINT641
gce_router
已成功运行的路由器软件任务数。值大于或等于 1 表示路由器已启动,但可能并非所有软件任务都正在运行。将返回的数量与路由器的预期软件任务数进行比较。值为 0 表示路由器已关闭。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。
sent_routes_count GA
已发送的路由数
GAUGEINT641
gce_router
路由器当前发送的路由数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。

世界协调时间 (UTC) 2024-04-11 19:12:46 生成的表。

后续步骤

  • 如需排查使用 Cloud Router 时遇到的问题,请参阅问题排查