使用团队管理概览

借助舰队团队管理功能,您可以查看团队范围的信息(例如按团队和命名空间汇总的资源利用率),从而优化支出和资源分配。Google Cloud 控制台的团队页面中的监控标签页提供舰队中特定团队范围的概览。

本页面假定您熟悉 Kubernetes 中的资源管理。 如需了解详情,请参阅 Kubernetes 文档中的针对 Pod 和容器的资源管理

Google Cloud 控制台中的团队范围概览仅可供 Google Kubernetes Engine (GKE) Enterprise 版用户使用。

查看信息中心

如需查看监控信息中心,请执行以下操作:

  1. 选择舰队宿主项目后,转到 Google Cloud 控制台中的团队部分。

    转到“团队”

  2. 团队页面中,选择要查看详细信息的团队范围,然后点击监控标签页。

选择时间过滤条件

默认情况下,团队范围概览会显示过去 7 天内的资源利用率。如需更改此时间范围,请使用页面顶部的时间过滤条件选项:

  • 选择要查看范围容器的平均资源利用率的时间范围。选择其中一个预定义选项,或选择自定义以指定自定义时间范围。

查看团队摘要

时间过滤条件下方的行可让您一目了然地查看团队范围信息,包括集群和命名空间数量,以及一段时间内的总资源利用率。资源利用率指标是使用团队集群的 Cloud Monitoring 数据生成的。此部分显示:

  • 与团队关联的集群和命名空间的数量。点击查看所有集群查看所有命名空间以查看团队的完整集群或命名空间列表。
  • 团队内的错误数量(如有)。如果显示错误,请点击在错误日志中查看,以在 Logs Explorer 中查看更多详细信息。
  • 所选时间间隔内容器的重启次数。点击在重启日志中查看,以在 Logs Explorer 中查看更多详细信息。
  • 所选时间间隔内命名空间的平均 CPU、内存和磁盘利用率。如需了解详情,请参阅舰队资源利用率指标

查看详细的资源利用率

此部分提供团队如何使用其资源的详细视图,包括各团队的资源利用率,资源利用率最高的命名空间。如需详细了解如何计算这些指标,请参阅舰队资源利用率指标

查看一段时间内的资源利用率

各团队的 CPU/内存/磁盘利用率部分显示您的团队在一段时间内的资源用量,以及范围内的集群请求的资源与设置的资源限制之间的对比情况。每个面板都显示所选时间范围内按团队汇总的 CPU、内存或磁盘使用量的图表,以下信息显示为不同的折线:

  • 限制:团队范围内容器可以使用的资源量上限,例如 42.5 个 CPU。
  • 已请求:范围内的容器已请求的资源量,例如 3.8 个 CPU。
  • 已使用:容器实际使用的资源量,例如 0.64 个 CPU。

如需查看图表上给定点的详细信息,请滚动查看图表上您感兴趣的时间(例如,图表上的实际使用量峰值)。将会显示该时间的资源限制、已请求和实际使用的资源量信息。

如需切换图表中的一个或多个线条的显示,请点击图表下方的一个或多个相关指标。

查看资源利用率最高的命名空间

CPU/内存/磁盘利用率最高的命名空间行显示资源用量最大的五个命名空间。每个面板按从高到低的顺序列出资源利用率最高的命名空间。对于每个命名空间,您可以看到其在所选时间范围内的资源用量图表,以及相对于资源限制、已使用和已请求资源的平均资源用量。此视图有很多作用,例如可以帮助您查看利用率过高的集群。

如需查看所选时间范围内所有命名空间的资源利用率,请点击查看所有命名空间的 CPU/内存/磁盘利用率

查看各命名空间的错误分布

此卡片显示所选时间范围内错误日志最多的命名空间。如需查看日志详细信息,请点击在 Cloud Logging 中查看所有错误

查看各命名空间的重启次数分布

此部分显示所选时间范围内容器重启次数最多的命名空间。这可帮助您进行评估,例如,如果容器因 CPU 使用率过高而重启,您是否需要调整 CPU 限制和请求的 CPU 数量。如需查看日志详细信息,请点击在 Cloud Logging 中查看所有重启