使用应用性能指标


您可以在 Google Kubernetes Engine (GKE) 上配置工作负载,以将应用性能指标发送到 Cloud Monitoring。然后,您可以使用这些指标检测应用中的性能回归问题。Google Kubernetes Engine 为您的工作负载提供了以下类型的性能指标的可视化:

  • 请求:显示每秒请求速率,按操作分组(如果有)。
  • 错误:显示错误率,按操作和响应代码分组。
  • 延迟时间:按操作显示第 50 百分位和第 95 百分位的响应延迟时间。
  • CPU 和内存:显示 CPU 和内存利用率(以请求量的百分比表示)。

这些指标对应于 Google 站点可靠性工程一书中推荐的黄金信号,用于监控分布式系统。

您还可以查看和探索工作负载的日志。

如需使用应用性能指标,您的应用必须能够将指标发送到 Cloud Monitoring。如需了解推荐的方法,请参阅收集应用性能指标

收集应用性能指标

您可以使用以下受支持的集成,为 Google Kubernetes Engine 收集应用性能指标:

  • Anthos Service Mesh:如果您使用 Anthos Service Mesh,则系统会自动收集应用性能指标。
  • Istio:如果您使用开源 Istio,我们建议您使用 Google Cloud Managed Service for Prometheus 收集指标
  • GKE Ingress:配置适用于应用负载均衡器的 GKE Ingress 时,系统会自动为将流量路由到 GKE Ingress 后面的 GKE Service 和 Deployment 资源的 HTTP/S 负载均衡器收集性能指标。
  • NGINX Ingress:如果您使用的是 NGINX Ingress,我们建议您使用 Google Cloud Managed Service for Prometheus 收集指标
  • Prometheus HTTP 和 gRPC 指标:如果您的应用公开 Prometheus HTTP 或 gRPC 指标,我们建议您按照 HTTP 服务器gRPC 服务器文档使用 Google Cloud Managed Service for Prometheus 收集指标。

查看应用性能指标

在性能数据可供分析后,您可以在应用信息中心上查看 Deployment 的指标