性能信息中心概览

通过性能信息中心,您可以了解整个 Google Cloud 网络的性能以及项目资源的性能。

项目性能视图中,性能信息中心会显示拥有 Compute Engine 虚拟机 (VM) 实例的地区丢包和延迟时间指标(在摘要图表和热图视图中)。它提供当前数据以及过去 6 周的指标。例如,您的项目在 Virtual Private Cloud (VPC) 网络中拥有地区 A 和 B 中的虚拟机。在这种情况下,性能信息中心会提供项目在两个地区之间丢包和延迟时间详情的相关数据。如要查看项目指标,请点击性能信息中心页面顶部的查看项目性能。有关所测量内容的更多示例和详细信息,请参阅指标

Google Cloud 性能视图中,性能信息中心显示所有 Google Cloud 中的丢包和延迟时间指标。这些指标可帮助您了解每个项目信息中心中发现的问题是否是您的项目所独有的。全局指标还有助于您规划未来的部署。如需查看全局指标,请点击性能信息中心页面顶部的查看所有 Google Cloud 性能

借助这些性能监控功能,您可以区分应用中的问题和底层 Google Cloud 网络中的问题。此外,您还可以调试历史网络性能问题。

性能信息中心还会将数据导出到 Cloud Monitoring。您可以使用 Monitoring 查询数据并获取其他信息。如需了解详情,请参阅查看监控指标

Google Cloud 性能视图

在此视图中,性能信息中心会显示每个可能的 Google Cloud 地区对的总体 Google Cloud 指标。该视图显示了 Google Cloud 网络的当前状态,并可让您将所有 Google Cloud 性能与项目中观察到的性能进行比较。

Google Cloud 性能视图显示所选时间窗口内最多 50 个地区对的时间序列数据,默认情况下为一小时。

您可以查看任何 Google Cloud 地区对的网络性能,即使您未在这些地区部署您的项目也是如此。您可以查看区域级和地区级的性能。摘要时间序列图显示最多 50 个地区对,这些区域对在所有 Google Cloud 中,虚拟机之间的丢包率或延迟时间最高。

如需查看项目的性能信息中心中的所有 Google Cloud 性能指标,您可以将指针悬停在特定地区对上。如需在性能信息中心内查看整个 Google Cloud 网络的性能,您可以点击查看所有 Google Cloud 性能

指标

性能信息中心提供两种指标:丢包率和延迟时间(往返时间,简称 RTT)。为了获得项目的丢包指标,项目中需要有足够的虚拟机数。如要获得延迟时间指标,您需要有足够的流量。除此之外,性能信息中心无需任何设置。

以下各部分更详细地介绍了这两种指标。

丟包率

丢包率指标显示以下各项之间的主动探测结果:

  • 单个 VPC 网络中的虚拟机。

  • 对等互连的 VPC 网络中的虚拟机(如果其中一个或者两个网络都位于您的项目中)。如果对等互连的网络位于不同的项目中,则丢包率在目标项目中可见。

  • 您的项目使用的共享 VPC 网络中的虚拟机。使用共享 VPC 网络的两个项目之间的丢包率在目标服务项目中可见。

例如,假设项目 A 包含两个 VPC 网络:网络 A(仅在可用区 A 中有虚拟机)和网络 M(仅在可用区 M 中有虚拟机)。如果这两个网络对等互连,则项目 A 的性能信息中心会显示 A/M 地区对的丢包率数据。如果这两个网络没有对等互连,则性能信息中心不显示该地区对的丢包率数据。

另一方面,假设这两个网络不在同一项目中。也就是说,假设网络 A 属于项目 A,而网络 M 属于项目 M。如果这两个网络对等互连并且地区 M 是目标地区,则项目 M 的性能信息中心会显示丢包率数据。相反,当地区 A 是目标地区时,丢包率数据仅对项目 A 可见。如果这两个网络没有对等互连,则两个项目的性能信息中心都不会显示该可用区对的丢包率数据。

性能信息中心汇总通过所有探测收集的数据。也就是说,性能信息中心不允许您分离项目内丢包率与其他类型的数据(例如与另一个项目中的对等互连 VPC 网络相关的丢包率)。但是,您可以使用 Monitoring 深入分析并查看更精细的结果。如需了解详情,请参阅查看监控指标

性能信息中心不会通过 Cloud VPN 连接发送探测。

方法

性能信息中心在承载虚拟机的物理主机上运行工作器。这些工作器会插入和接收与您的流量在同一网络上运行的探测数据包。由于这些工作器在物理主机上而不是虚拟机上运行,因此它们不会消耗虚拟机资源,并且流量在虚拟机上不可见。

探测覆盖了可以相互通信的整个虚拟机网格,这不一定与您的流量模式相同。因此,您可能会在性能信息中心上看到丢包迹象,但在应用中没有丢包迹象。

对于所有要探测的虚拟机,我们尝试通过其内部 IP 地址和外部 IP 地址(如果有)来访问。探测不会离开 Google Cloud,但通过使用外部 IP 地址,性能信息中心可以覆盖外部流量(例如来自互联网的流量)使用的部分路径。

使用 UDP 数据包衡量内部 IP 地址的丢包率,使用 TCP 数据包衡量外部 IP 地址的丢包率。

指标可用性和置信度

性能信息中心探测网络中的一部分虚拟机对。 然后根据收集的数据来估算您可能会遇到的丢包率。Google 对数据的置信度取决于探测速率,探测速率取决于您在每个地区拥有的虚拟机数量以及您部署了虚拟机的地区数。例如,两个地区中的 10 个虚拟机比 10 个地区中的 10 个虚拟机具有更高的置信度。

所有虚拟机(包括由 Google Kubernetes Engine (GKE) 创建的虚拟机)都会计入虚拟机总数。

下表介绍了各种不同的置信度。在热图中,较低的置信度会标注星号或 N/A

Level 每个可用区所需虚拟机数 性能信息中心在热图上显示的内容
95% 置信度 10 个虚拟机 x 项目中的可用区数量。例如,如果您的项目有 12 个可用区,则每个可用区必须有 120 个虚拟机。 没有任何其他标注的测量结果
90% 置信度 2.5 个虚拟机 x 项目中的可用区数量。例如,如果您的项目有 12 个可用区,则每个可用区必须有 30 个虚拟机。 没有任何其他标注的测量结果
置信度较低 带有星号的测量结果
探测不足,无法获得有意义的数据 N/A

Google Cloud 丢包率指标始终可用。只有地区对每分钟的探测次数超过 200 时,每个项目对应的丢包率指标才可用。如果每分钟有 200 到 400 个探测,则会显示一个星号 (*)。

延迟时间

延迟时间指标可通过以下各项之间的实际客户流量来测量:

  • 单个 VPC 网络中的虚拟机。

  • 对等互连的 VPC 网络之间的虚拟机(如果网络均位于同一项目)。

此外,共享 VPC 网络中某个服务项目的性能信息中心仅显示该服务项目中可用区的数据。 也就是说,假设可用区 A 和服务项目 A 中的一个虚拟机使用宿主项目与可用区 B 和服务项目 B 中的一个虚拟机进行通信。这两个服务项目或宿主项目均无法获得关于该流量的测量结果。

性能信息中心不显示以下各项的延迟时间数据:

  • 对等互连的 VPC 网络之间的流量(如果一个 VPC 网络位于不同的项目中)。

  • 通过 Cloud VPN 连接发送的流量。

方法

延迟时间是使用 TCP 数据包来测量的。

根据实际流量样本,延迟时间的计算方式为:发送 TCP 序列号 (SEQ) 与接收包含网络 RTT 和 TCP 堆栈相关延迟时间的相应 ACK 之间经过的时间。界面将延迟时间显示为所有相关测量值的中位数。

延迟时间指标基于与 VPC 流日志相同的数据源和采样方法。

指标可用性

Google Cloud 延迟时间指标始终可用。只有 TCP 流量大约每分钟达到 1000 个数据包或更高时,每个项目才能使用延迟时间指标。

指标摘要表

下表总结了用于报告丢包率和延迟时间指标的探测方法和协议。

丟包率 延迟时间
探测方法 主动探测(综合虚拟机流量) 被动探测(虚拟机实际流量)
协议 UDP(内部 IP 地址)、TCP(外部 IP 地址) TCP(内部/外部 IP 地址)

虽然上表引用了外部 IP 地址,但性能信息中心仅显示有关内部流量的数据。如需查找虚拟机从外部来源接收流量的聚合数据,您可以使用 Cloud Monitoring。

权限

如需通过 Cloud Console 或通过 Monitoring 访问性能信息中心数据,您必须具有 monitoring.timeSeries.list 权限。下表列出的 Monitoring 角色中包含此权限。

角色名称 角色 ID
监控查看者 roles/monitoring.viewer
Monitoring Editor roles/monitoring.editor
监控管理员 roles/monitoring.admin

如需了解包含 monitoring.timeSeries.list 权限的其他角色,请参阅了解角色

查看历史数据时直观呈现数据

查看一天或更长时间段内的数据时,图表将在主要数据周围以浅色(光环)提供其他数据。线条周围的较浅颜色显示了从最低到最高的值范围,这些值会被汇总以绘制主线条。

汇总的历史数据。
汇总的历史数据(点击可放大)

后续步骤