查看日志和指标
Cloud Router 路由器将日志记录信息发送到 Cloud Logging,并将监控指标发送到 Cloud Monitoring。本页介绍了如何访问这两种信息。
日志
Cloud Router 路由器将日志记录信息发送到 Cloud Logging,用于记录以下事件:
- 与您的 Cloud Router 路由器相关的路由器事件
- 与 BGP 配置和会话相关的 BGP 事件
- 与两个 BGP 对等端之间的路由公告相关的路由事件
查看日志
控制台
在 Google Cloud 控制台中,前往 Cloud Router 路由器页面。
从 Cloud Router 路由器列表中选择 Cloud Router 路由器。
在日志列中,点击查看。
Cloud Router 日志具有以下格式:
[Event Type]: [Log Text]
如需在 Logs Explorer 中构建查询,请参阅在 Logs Explorer 中构建查询。
参考日志
下表列出了 Logging 信息日志中记录的事件。
事件 | 说明 |
---|---|
路由器事件 | 路由器任务已激活 |
路由器任务已停用 | |
BGP 事件 | 已成功为对等互连添加配置:LIST_OF_PEERS |
X x秒前与 PEER 建立了 BGP 对等互连 |
|
与 PEER 的 BGP 对等互连关闭,原因为 MESSAGE ,其中 MESSAGE 提供了说明,例如 HOLD_TIMER_EXPIRED 或 LINK_DOWN 。如需详细了解 LINK_DOWN ,请参阅 Cloud Router 路由器日志中出现 LINK_DOWN 消息。 |
|
BGP 路由器 ID 设置为 BGP_ROUTER_ID |
|
路由事件 | 向对等体通告前缀:PREFIX |
从对等体中撤消前缀:PREFIX |
|
Cloud Router 路由器收到前缀 PREFIX 下一个跃点 LIST_OF_NEXTHOPS |
|
从 Cloud Router 路由器删除了前缀 PREFIX 下一个跃点 LIST_OF_NEXTHOPS |
常见 Logging 事件
如需查看下表中所列的 Cloud Router 路由器常见 Logging 事件,请按照查看日志的步骤操作。指定表中列出的高级过滤条件之一。根据需要调整 Logging 搜索的时间范围。
事件说明 | Logging 高级过滤条件 |
---|---|
迁移或重启 Cloud Router 路由器进程 | resource.type="gce_router" "task activated" |
添加已学习的路由 | resource.type="gce_router" "received by cloud router" |
移除已知路由 | resource.type="gce_router" "deleted from cloud router" |
导出通告的路由 | resource.type="gce_router" ("Route Event" AND "Advertising prefix") |
BGP 对等互连出现 | resource.type="gce_router" ("BGP peering" AND "came up") |
BGP 对等互连附带 MD5 身份验证 | resource.type="gce_router" ("BGP peering" AND "came up" AND "MD5 authentication enabled") |
BGP 对等互连出现故障 | resource.type="gce_router" ("BGP peering" AND "went down") |
BGP 对等互连断开,因为 Google 对等互连边缘路由器上的链路断开 | resource.type="gce_router" ("BGP peering" AND "went down" AND "LINK_DOWN") |
由于收到的路由过多,BGP 会话会关停 | resource.type="gce_router" ("NOTIFICATION 6/1") severity="CRITICAL" |
超出了 Cloud Router 动态路由前缀配额 | resource.type="gce_network_region" ("No more routes" AND "can be programmed") severity="ERROR" |
路由因配额问题而被丢弃 | resource.type="gce_network_region" severity="ERROR" jsonPayload.affectedResource.routes.nextHopIpAddresses=" PEER_IP_ADDRESS "
|
BFD 会话正在等待对等方 | resource.type="gce_router" ("BFD Event" AND "bfd enabled, state [Init, NoDiagnostic]") |
BFD 会话启动 | resource.type="gce_router" ("BFD Event" AND "to [Up, NoDiagnostic]") |
BFD 会话关闭(Rx 计时器过期) | resource.type="gce_router" ("BFD Event" AND "to [Down, ControlDetectionTimeExpired]") |
BFD 会话关闭(对等体状态为 Down 或 AdminDown ) |
resource.type="gce_router" ("BFD Event" AND "to [Down, NeighborSessionDown]") |
BFD 会话已在本地停用 | resource.type="gce_router" ("BFD Event" AND "bfd disabled") |
指标
Cloud Router 将指标发布到 Cloud Monitoring。如需查看为 Cloud Router 发布的指标列表,请参阅监控 Cloud Router 的指标。
所有 Cloud Router 路由器指标都涵盖 IPv4 和 IPv6 流量。
使用 API 查看指标
您可以使用 Cloud Monitoring API 访问这些指标。如需了解详情,请参阅读取指标数据。
使用 Monitoring 信息中心查看指标
您还可以在 Cloud Monitoring 中创建自定义信息中心,以帮助分析这些指标。如需了解详情,请参阅管理自定义信息中心。
如需创建自定义信息中心,请按以下步骤操作。
控制台
在 Google Cloud 控制台中,前往 Monitoring 页面。
选择信息中心,然后在信息中心概览页面上点击
创建信息中心。可选:使用信息中心的描述性名称更新信息中心标题。
在图表库中,选择要添加的图表。例如,如需将折线图添加到信息中心,请点击该条目或将该条目从图表库拖动到图表区域。
在图表标题中,更改图表标题或使用建议的标题。
在“您要查看哪些数据?”中,执行以下操作:
- 在资源类型中,点击输入内容以进行过滤字段,然后输入
Cloud Router
。 - 在指标中,添加 Cloud Router 路由器指标。
- 在资源类型中,点击输入内容以进行过滤字段,然后输入
使用过滤器控件将视图限制为仅显示某些路由器或会话。
要添加其他指标,请点击添加其他指标。
其中一些指标适用于 Cloud Router,另一些指标适用于给定 Cloud Router 路由器上的 BGP 会话。Cloud Router 路由器指标会显示为 router-name
,而 BGP 会话指标会显示为 router-name(bgp-name)
。
Cloud Router 的 Monitoring 指标
此表中的“指标类型”字符串必须以 router.googleapis.com/
为前缀。表中的条目已省略该前缀。
查询标签时,请使用 metric.labels.
前缀;例如 metric.labels.LABEL="VALUE"
。
指标类型发布阶段 (资源层次结构级别 显示名称 |
|
---|---|
种类、类型、单位 受监控的资源 |
说明 标签 |
best_received_routes_count
GA
(项目)
收到的路由数 |
|
GAUGE 、INT64 、1
gce_router |
路由器当前收到的最佳路由数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。 |
bfd/control/receive_intervals
Beta 版
(项目)
BFD 控制数据包接收时间间隔 |
|
GAUGE 、INT64 、ms
gce_router |
BFD 控制数据包接收时间间隔。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。peer_ip :BFD 会话的对等 IP 地址。
|
bfd/control/received_packets_count
Beta 版
(项目)
收到的控制数据包数 |
|
DELTA 、INT64 、1
gce_router |
从此 BFD 会话收到的控制数据包数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。peer_ip :BFD 会话的对等 IP 地址。
|
bfd/control/rejected_packets_count
Beta 版
(项目)
拒绝的控制数据包数 |
|
DELTA 、INT64 、1
gce_router |
拒绝来自此 BFD 会话的控制数据包数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。peer_ip :BFD 会话的对等 IP 地址。
|
bfd/control/transmit_intervals
Beta 版
(项目)
BFD 控制数据包传输时间间隔 |
|
GAUGE 、INT64 、ms
gce_router |
BFD 控制数据包传输时间间隔。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。peer_ip :BFD 会话的对等 IP 地址。
|
bfd/control/transmitted_packets_count
Beta 版
(项目)
传输的控制数据包数 |
|
DELTA 、INT64 、1
gce_router |
从此 BFD 会话传输的控制数据包数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。peer_ip :BFD 会话的对等 IP 地址。
|
bfd/session_flap_events_count
Beta 版
(项目)
BFD 会话不稳定 |
|
DELTA 、INT64 、1
gce_router |
此 BFD 会话中的每个 BFD 缺陷事件数。会话缺陷事件指的是从“向上”状态过渡。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。peer_ip :BFD 会话的对等 IP 地址。
event_type :BFD 缺陷的原因,如“AdminDown”或“ControlDetectionTimeExpired”。
|
bfd/session_up
Beta 版
(项目)
BFD 会话状态 |
|
GAUGE 、INT64 、1
gce_router |
BFD 会话建立成功的指示符。1 表示会话已启动。0 表示会话已关闭。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。peer_ip :BFD 会话的对等 IP 地址。
|
bgp/received_routes_count
GA
(项目)
BGP 收到的路由数 |
|
GAUGE 、INT64 、1
gce_router |
bgp 会话上收到的当前路由数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。bgp_peer_name :bgp 会话的名称。
|
bgp/sent_routes_count
GA
(项目)
BGP 发送的路由数 |
|
GAUGE 、INT64 、1
gce_router |
在 bgp 会话中发送的路由数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。bgp_peer_name :bgp 会话的名称。
|
bgp/session_up
GA
(项目)
BGP 会话状态 |
|
GAUGE 、INT64 、1
gce_router |
bgp 会话建立成功的指示符。1 表示会话已启动。0 表示会话已关闭。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。bgp_peer_name :bgp 会话的名称。
|
bgp_sessions_down_count
GA
(项目)
关闭的 BGP 会话数 |
|
GAUGE 、INT64 、1
gce_router |
路由器上关闭的 BGP 会话数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。 |
bgp_sessions_up_count
GA
(项目)
启动的 BGP 会话数 |
|
GAUGE 、INT64 、1
gce_router |
路由器上启动的 BGP 会话数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。 |
dynamic_routes/learned_routes/any_dropped_unique_destinations
Beta 版
(项目)
所有唯一目的地都舍弃 |
|
GAUGE 、BOOL 、1
gce_network_region |
一个布尔值指标,用于判断网络区域中是否有任何唯一目标因超出配额而被舍弃。每 60 秒采样一次。采样后,数据在最长 60 秒的时间内不会显示。routing_mode :路由的路由模式,是 [“全局性”- 从远程区域获知的;"区域性" - 从本地区域获知的]。
|
dynamic_routes/learned_routes/dropped_unique_destinations
Beta 版
(项目)
舍弃了唯一目的地 |
|
GAUGE 、INT64 、1
gce_network_region |
因超出配额而在一个网络区域中丢弃的唯一目的地的数量。每 60 秒采样一次。采样后,数据在最长 60 秒的时间内不会显示。routing_mode :路由的路由模式,是 [“全局性”- 从远程区域获知的;"区域性" - 从本地区域获知的]。
|
dynamic_routes/learned_routes/unique_destinations_limit
Beta 版
(项目)
唯一目的地数量限制 |
|
GAUGE 、INT64 、1
gce_network_region |
此网络区域路由配额允许的唯一目标数量上限。每 60 秒采样一次。采样后,数据在最长 60 秒的时间内不会显示。routing_mode :路由的路由模式,是 [“全局性”- 从远程区域获知的;"区域性" - 从本地区域获知的]。
|
dynamic_routes/learned_routes/used_unique_destinations
Beta 版
(项目)
使用的唯一目的地数量 |
|
GAUGE 、INT64 、1
gce_network_region |
此网络区域的已知路由使用的唯一目标数量。每 60 秒采样一次。采样后,数据在最长 60 秒的时间内不会显示。routing_mode :路由的路由模式,是 [“全局性”- 从远程区域获知的;"区域性" - 从本地区域获知的]。
|
nat/allocated_ports
GA
(项目)
已分配的端口数 |
|
GAUGE 、INT64 、{port}
nat_gateway |
NAT 网关分配给所有虚拟机的端口数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。nat_ip :端口的 NAT IP 地址。
|
nat/closed_connections_count
GA
(项目)
关闭的连接数 |
|
DELTA 、INT64 、{connection}
nat_gateway |
NAT 网关上关闭的连接数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。ip_protocol :连接的协议。可以是 TCP、UDP 或 ICMP。
|
nat/dropped_received_packets_count
GA
(项目)
收到但被丢弃的数据包数 |
|
DELTA 、INT64 、{packet}
nat_gateway |
NAT 网关收到但丢弃的数据包数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。ip_protocol :连接的协议。可以是 TCP、UDP 或 ICMP。
|
nat/dropped_sent_packets_count
GA
(项目)
发送但丢弃的数据包数 |
|
DELTA 、INT64 、{packet}
nat_gateway |
NAT 网关发送但丢弃的数据包数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。ip_protocol :连接的协议。可以是 TCP、UDP 或 ICMP。reason :数据包丢弃的原因。可能的值为 OUT_OF_RESOURCES、ENDPOINT_INDEPENDENCE_CONFLICT。
|
nat/nat_allocation_failed
GA
(项目)
NAT 分配失败 |
|
GAUGE 、BOOL 、
nat_gateway |
指示在向 NAT 网关中的任何虚拟机分配 NAT IP 地址时是否失败。每 60 秒采样一次。采样后,数据在最长 120 秒的时间内不会显示。 |
nat/new_connections_count
GA
(项目)
新连接数 |
|
DELTA 、INT64 、{connection}
nat_gateway |
通过 NAT 网关创建的新连接数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。ip_protocol :连接的协议。可以是 TCP、UDP 或 ICMP。
|
nat/open_connections
GA
(项目)
打开的连接数 |
|
GAUGE 、INT64 、{connection}
nat_gateway |
目前在 NAT 网关上打开的连接数。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。ip_protocol :连接的协议。可以是 TCP、UDP 或 ICMP。
|
nat/port_usage
GA
(项目)
端口使用量 |
|
GAUGE 、INT64 、{port}
nat_gateway |
从虚拟机到单个互联网端点 (IP:port) 的连接数上限。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。ip_protocol :连接的协议。可以是 TCP、UDP 或 ICMP。
|
nat/received_bytes_count
GA
(项目)
收到的字节数 |
|
DELTA 、INT64 、By
nat_gateway |
通过 NAT 网关接收的字节数(目的地 -> 虚拟机)。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。ip_protocol :连接的协议。可以是 TCP、UDP 或 ICMP。
|
nat/received_packets_count
GA
(项目)
收到的数据包数 |
|
DELTA 、INT64 、{packet}
nat_gateway |
通过 NAT 网关接收到的数据包数(目的地 -> 虚拟机)。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。ip_protocol :连接的协议。可以是 TCP、UDP 或 ICMP。
|
nat/sent_bytes_count
GA
(项目)
已发送的字节数 |
|
DELTA 、INT64 、By
nat_gateway |
通过 NAT 网关发送的字节数(虚拟机 -> 目的地)。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。ip_protocol :连接的协议。可以是 TCP、UDP 或 ICMP。
|
nat/sent_packets_count
GA
(项目)
已发送的数据包数 |
|
DELTA 、INT64 、{packet}
nat_gateway |
通过 NAT 网关发送的数据包数(虚拟机 -> 目的地)。每 60 秒采样一次。采样后,数据在最长 225 秒的时间内不会显示。ip_protocol :连接的协议。可以是 TCP、UDP 或 ICMP。
|
router_up
GA
(项目)
路由器任务已启动 |
|
GAUGE 、INT64 、1
gce_router |
已成功运行的路由器软件任务数。值大于或等于 1 表示路由器已启动,但可能并非所有软件任务都正在运行。将返回的数量与路由器的预期软件任务数进行比较。值为 0 表示路由器已关闭。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。 |
sent_routes_count
GA
(项目)
已发送的路由数 |
|
GAUGE 、INT64 、1
gce_router |
路由器当前发送的路由数。每 60 秒采样一次。采样后,数据在最长 180 秒的时间内不会显示。 |
世界协调时间 (UTC) 2024-10-24 18:54:10 生成的表。
后续步骤
- 如需排查使用 Cloud Router 时遇到的问题,请参阅问题排查。