Google Cloud 控制台中的 Anthos Service Mesh 页面提供了汇总指标和深度指标、图表及图形,让您可以观察服务行为。您可以监控服务的整体运行状况,或针对特定服务展开细目以设置服务等级目标 (SLO) 或进行问题排查。
查看汇总 SLO 和服务状态
Anthos Service Mesh 页面是您的入口点。创建 SLO 后,页面顶部附近会显示提醒和 SLO 的摘要。
SLO 状态部分下方是服务网格中服务运行状况的汇总视图:
每个服务名称旁边的图标表示服务的 SLO 状态。如需监控或查看特定服务的详细信息,请点击相应服务名称。您可以应用过滤条件来控制表格中显示哪些服务:
- 点击 SLO 状态部分中的过滤依据链接可以仅在表格中显示适用服务。例如,您可以对表格进行过滤,使其仅显示未设置 SLO 的服务。
- 点击表格左上角的 filter_list 过滤服务可以应用其他条件。
窗口的右上角包含以下控件:
- 点击时间范围下拉列表可以显示特定时间段的状态信息。
- 点击拓扑可以显示服务图。
- 点击表格视图可以切换回表格视图。
探索服务图
您可以探索服务拓扑图可视化,其中显示:
- 您的网格的服务。
- 支持这些服务的 Kubernetes 工作负载。
- 服务之间的关系。
在下面的屏幕截图中,前端服务由单个前端 Kubernetes 工作负载提供支持。工作负载进而将请求发送到多个其他服务。每个服务旁边的图标与表格视图中显示的 SLO 状态图标相同。
当您点击某个服务图标时,系统会显示一个卡片,其中包含有关该服务的详细信息,包括一些关键指标。该卡片还包含指向该特定服务概览页面的链接。
您可以通过多种方式与服务图进行交互:
- 如需在服务图上平移,请在背景中点击并拖动。
- 如需缩放服务图,请使用鼠标滚轮。
- 如需在服务图中重新定位服务或工作负载以方便查看,请点击并拖动服务图节点。
您可以将鼠标指针悬停在工作负载图标上,然后点击该图标右上角显示的展开,从而将工作负载展开到其底层组件。通过点击展开多次,您可以从工作负载到部署、副本集、Pod 甚至容器展开细目。
服务及其通信模式随时间推移而变化时,服务图会跟踪这些更改。您可以使用页面底部的时间轴来定义时间点,从而查看服务图的状态。图例会显示服务图的时间间隔。
通信关系以观察到的网络流量为依据。如果服务未在指定时间进行通信,则这些服务之间不存在边缘。
右侧时间轴上方是启用时间差异比较图标:
点击此图标后,服务图将进入差异模式,在该模式下您可以比较两个时间点的服务图。
在差异模式下,您可以使用以下图标在不同的可视化之间切换:
窗口底部的时间轴用于控制要比较的两个时间点。您可以调整两个滑块来更改时间段。
监控特定服务
在 Service Mesh 页面上,您可以从表格或拓扑视图选择要监控的服务。选择服务后,随即会显示左侧导航栏,其中包含指向以下页面的链接:
概览页面显示有关服务的 SLO 状态、关键指标和详细信息。
运行状况页面会显示 SLO 详细信息。
指标页面显示关键流量和基础架构指标的图表。您可以通过多种方式细分指标,例如按集群和 Pod。
关联的服务页面显示有关入站和出站请求的详细信息。
诊断页面显示错误日志。
基础架构页面显示有关每个 Pod 的关键指标和详细信息。您可以点击 Pod 名称以前往 Google Cloud 控制台中的工作负载页面。
使用时间轴
在特定服务每个页面的顶部,您可以点击时间范围下拉列表,以显示特定时间段的信息。
如需指定自定义时间,请点击 access_time 显示时间轴。
您可以使用时间轴来细化应用于页面的时间间隔。时间轴显示的总时间范围由时间范围下拉列表控制。当您选择新的时间范围后,页面上的时间轴和其他元素就会更新,以反映该时间范围。例如,指标页面上的图表会显示与所选时间范围对应的数据。如需进一步细化时间范围,请拖动蓝色滑块。
查看流量指标
在服务网格页面上,点击列表中的服务,然后点击流量以直观显示当前工作负载之间的流量路由。
您可以点击图中的特定工作负载,以在右侧查看所选工作负载的详细信息面板,包括关键详细信息、请求计数、错误率和延迟时间。
查看安全功能
在安全性页面上,您可以查看服务网格的安全功能。政策摘要标签页显示了 Anthos 安全功能的状态,包括 Anthos Service Mesh 授权和身份验证政策。
政策审核标签页显示服务网格的安全配置统计信息摘要。
工作负载部分显示每个集群和命名空间的详细工作负载政策状态,包括 Kubernetes 网络政策、服务访问权限控制和 mTLS 详细信息。
如需了解详情,请参阅监控 Anthos Service Mesh 安全功能的网格安全或监控 GKE Enterprise 中的应用安全保障,以了解所有 GKE Enterprise 安全功能。
查看安全指标
在服务网格页面上,点击列表中的服务,然后点击安全性以查看访问服务的工作负载实例。