在 Google Cloud 控制台中探索 Anthos Service Mesh

Google Cloud 控制台中的 Anthos Service Mesh 页面提供了汇总指标和深度指标、图表及图形,让您可以观察服务行为。您可以监控服务的整体运行状况,或针对特定服务展开细目以设置服务等级目标 (SLO) 或进行问题排查。

注意:某些功能(包括 Google Cloud 控制台中的 Anthos Service Mesh 页面)仅适用于 GKE on Google Cloud。如需了解每个平台支持的服务网格功能,请参阅支持的功能

查看汇总 SLO 和服务状态

Anthos Service Mesh 页面是您的入口点。该页面顶部附近显示了提醒和 SLO 的汇总。

图片

SLO 状态部分下方是服务网格中服务运行状况的汇总视图:

图片

每个服务名称旁边的图标表示服务的 SLO 状态。如需监控或查看特定服务的详细信息,请点击相应服务名称。您可以应用过滤条件来控制表格中显示哪些服务:

  • 点击 SLO 状态部分中的过滤依据链接可以仅在表格中显示适用服务。例如,您可以对表格进行过滤,使其仅显示未设置 SLO 的服务。
  • 点击表格左上角的 过滤服务可以应用其他条件。

窗口的右上角包含以下控件:

图片

  • 点击时间范围下拉列表可以显示特定时间段的状态信息。
  • 点击拓扑可以显示服务图
  • 点击表格视图可以切换回表格视图。

探索服务图

您可以探索服务拓扑图可视化,其中显示:

  • 您的网格的服务。
  • 支持这些服务的 Kubernetes 工作负载。
  • 服务之间的关系。

在下面的屏幕截图中,前端服务由单个前端 Kubernetes 工作负载提供支持。工作负载进而将请求发送到多个其他服务。每个服务旁边的图标与表格视图中显示的 SLO 状态图标相同。

图片

当您点击某个服务图标时,系统会显示一个卡片,其中包含有关该服务的详细信息,包括一些关键指标。该卡片还包含指向该特定服务概览页面的链接。

图片

您可以通过多种方式与服务图进行交互:

  • 如需在服务图上平移,请在背景中点击并拖动。
  • 如需缩放服务图,请使用鼠标滚轮。
  • 如需在服务图中重新定位服务或工作负载以方便查看,请点击并拖动服务图节点。

您可以将鼠标指针悬停在工作负载图标上,然后点击该图标右上角显示的展开,从而将工作负载展开到其底层组件。通过点击展开多次,您可以从工作负载到部署、副本集、Pod 甚至容器展开细目。

服务及其通信模式随时间推移而变化时,服务图会跟踪这些更改。您可以使用页面底部的时间轴来定义时间点,从而查看服务图的状态。图例会显示服务图的时间间隔。

图片

通信关系以观察到的网络流量为依据。如果服务未在指定时间进行通信,则这些服务之间不存在边缘。

右侧时间轴上方是启用时间差异比较图标:启用时间差异比较

点击此图标后,服务图将进入差异模式,在该模式下您可以比较两个时间点的服务图。
在差异模式下,您可以使用以下图标在不同的可视化之间切换:差异模式图标

窗口底部的时间轴用于控制要比较的两个时间点。您可以调整两个滑块来更改时间段。

图片

监控特定服务

Service Mesh 页面上,您可以从表格或拓扑视图选择要监控的服务。选择服务后,随即会显示左侧导航栏,其中包含指向以下页面的链接:

  • 概览页面显示有关服务的 SLO 状态、关键指标和详细信息。

  • 运行状况页面会显示 SLO 详细信息。

  • 指标页面显示关键流量和基础架构指标的图表。您可以通过多种方式细分指标,例如按集群和 Pod。

  • 关联的服务页面显示有关入站和出站请求的详细信息。

  • 诊断页面显示错误日志。

  • 基础架构页面显示有关每个 Pod 的关键指标和详细信息。您可以点击 Pod 名称以前往 Google Cloud 控制台中的工作负载页面。

使用时间轴

在特定服务每个页面的顶部,您可以点击时间范围下拉列表,以显示特定时间段的信息。

图片

如需指定自定义时间,请点击 显示时间轴

图片

您可以使用时间轴来细化应用于页面的时间间隔。时间轴显示的总时间范围由时间范围下拉列表控制。当您选择新的时间范围后,页面上的时间轴和其他元素就会更新,以反映该时间范围。例如,指标页面上的图表会显示与所选时间范围对应的数据。如需进一步细化时间范围,请拖动蓝色滑块。

图片

查看流量指标

服务网格页面上,点击列表中的服务,然后点击流量以直观显示当前工作负载之间的流量路由。

图片

您可以点击图中的特定工作负载,以在右侧查看所选工作负载的详细信息面板,包括关键详细信息、请求计数、错误率和延迟时间。

图片

查看安全功能

安全性页面上,您可以查看服务网格的安全功能。政策摘要标签页显示 Anthos 安全功能的状态,包括政策和拒绝。

图片

政策审核标签页显示服务网格的安全配置统计信息摘要。

图片

工作负载部分显示每个集群和命名空间的详细工作负载政策状态,包括 Kubernetes 网络政策、服务访问权限控制和 mTLS 详细信息。

图片

查看安全指标

服务网格页面上,点击列表中的服务,然后点击安全性以查看访问服务的工作负载实例。

图片

后续步骤