在 Google Cloud 控制台中探索 Anthos Service Mesh

Google Cloud 控制台中的 Anthos Service Mesh 页面提供了汇总指标和深度指标、图表及图形,让您可以观察服务行为。您可以监控服务的整体运行状况,或针对特定服务展开细目以设置服务等级目标 (SLO) 或进行问题排查。

查看汇总 SLO 和服务状态

Anthos Service Mesh 页面是您的入口点。创建 SLO 后,页面顶部附近会显示提醒和 SLO 的摘要。

图片

SLO 状态部分下方是服务网格中服务运行状况的汇总视图:

图片

每个服务名称旁边的图标表示服务的 SLO 状态。如需监控或查看特定服务的详细信息,请点击相应服务名称。您可以应用过滤条件来控制表格中显示哪些服务:

  • 点击 SLO 状态部分中的过滤依据链接可以仅在表格中显示适用服务。例如,您可以对表格进行过滤,使其仅显示未设置 SLO 的服务。
  • 点击表格左上角的 过滤服务可以应用其他条件。

窗口的右上角包含以下控件:

图片

  • 点击时间范围下拉列表可以显示特定时间段的状态信息。
  • 点击拓扑可以显示服务图
  • 点击表格视图可以切换回表格视图。

探索服务图

您可以探索服务拓扑图可视化,其中显示:

  • 您的网格的服务。
  • 支持这些服务的 Kubernetes 工作负载。
  • 服务之间的关系。

在下面的屏幕截图中,前端服务由单个前端 Kubernetes 工作负载提供支持。工作负载进而将请求发送到多个其他服务。每个服务旁边的图标与表格视图中显示的 SLO 状态图标相同。

图片

当您点击某个服务图标时,系统会显示一个卡片,其中包含有关该服务的详细信息,包括一些关键指标。该卡片还包含指向该特定服务概览页面的链接。

图片

您可以通过多种方式与服务图进行交互:

  • 如需在服务图上平移,请在背景中点击并拖动。
  • 如需缩放服务图,请使用鼠标滚轮。
  • 如需在服务图中重新定位服务或工作负载以方便查看,请点击并拖动服务图节点。

您可以将鼠标指针悬停在工作负载图标上,然后点击该图标右上角显示的展开,从而将工作负载展开到其底层组件。通过点击展开多次,您可以从工作负载到部署、副本集、Pod 甚至容器展开细目。

服务及其通信模式随时间推移而变化时,服务图会跟踪这些更改。您可以使用页面底部的时间轴来定义时间点,从而查看服务图的状态。图例会显示服务图的时间间隔。

图片

通信关系以观察到的网络流量为依据。如果服务未在指定时间进行通信,则这些服务之间不存在边缘。

右侧时间轴上方是启用时间差异比较图标:启用时间差异比较

点击此图标后,服务图将进入差异模式,在该模式下您可以比较两个时间点的服务图。
在差异模式下,您可以使用以下图标在不同的可视化之间切换:差异模式图标

窗口底部的时间轴用于控制要比较的两个时间点。您可以调整两个滑块来更改时间段。

图片

监控特定服务

Service Mesh 页面上,您可以从表格或拓扑视图选择要监控的服务。选择服务后,随即会显示左侧导航栏,其中包含指向以下页面的链接:

  • 概览页面显示有关服务的 SLO 状态、关键指标和详细信息。

  • 运行状况页面会显示 SLO 详细信息。

  • 指标页面显示关键流量和基础架构指标的图表。您可以通过多种方式细分指标,例如按集群和 Pod。

  • 关联的服务页面显示有关入站和出站请求的详细信息。

  • 诊断页面显示错误日志。

  • 基础架构页面显示有关每个 Pod 的关键指标和详细信息。您可以点击 Pod 名称以前往 Google Cloud 控制台中的工作负载页面。

使用时间轴

在特定服务每个页面的顶部,您可以点击时间范围下拉列表,以显示特定时间段的信息。

图片

如需指定自定义时间,请点击 显示时间轴

图片

您可以使用时间轴来细化应用于页面的时间间隔。时间轴显示的总时间范围由时间范围下拉列表控制。当您选择新的时间范围后,页面上的时间轴和其他元素就会更新,以反映该时间范围。例如,指标页面上的图表会显示与所选时间范围对应的数据。如需进一步细化时间范围,请拖动蓝色滑块。

图片

查看流量指标

服务网格页面上,点击列表中的服务,然后点击流量以直观显示当前工作负载之间的流量路由。

图片

您可以点击图中的特定工作负载,以在右侧查看所选工作负载的详细信息面板,包括关键详细信息、请求计数、错误率和延迟时间。

图片

查看安全功能

安全性页面上,您可以查看服务网格的安全功能。政策摘要标签页显示了 Anthos 安全功能的状态,包括 Anthos Service Mesh 授权和身份验证政策。

图片

政策审核标签页显示服务网格的安全配置统计信息摘要。

图片

工作负载部分显示每个集群和命名空间的详细工作负载政策状态,包括 Kubernetes 网络政策、服务访问权限控制和 mTLS 详细信息。

图片

如需了解详情,请参阅监控 Anthos Service Mesh 安全功能的网格安全监控 GKE Enterprise 中的应用安全保障,以了解所有 GKE Enterprise 安全功能。

查看安全指标

服务网格页面上,点击列表中的服务,然后点击安全性以查看访问服务的工作负载实例。

图片

后续步骤