您可以在 Google Kubernetes Engine (GKE) 上配置工作负载,以将应用性能指标发送到 Cloud Monitoring。然后,您可以使用这些指标检测应用中的性能回归问题。Google Kubernetes Engine 为您的工作负载提供了以下类型的性能指标的可视化:
- 请求:显示每秒请求速率,按操作分组(如果有)。
- 错误:显示错误率,按操作和响应代码分组。
- 延迟时间:按操作显示第 50 和第 95 百分位的响应延迟时间。
- CPU 和内存:显示 CPU 和内存利用率(以请求量的百分比表示)。
这些指标对应于 Google 站点可靠性工程一书中推荐的黄金信号,用于监控分布式系统。
您还可以查看和探索工作负载的日志。
如需使用应用性能指标,您的应用必须能够将指标发送到 Cloud Monitoring。如需了解推荐的方法,请参阅收集应用性能指标。
收集应用性能指标
您可以使用以下受支持的集成,为 Google Kubernetes Engine 收集应用性能指标:
- Cloud Service Mesh:如果您使用 Cloud Service Mesh,则系统会自动收集应用性能指标。
- Istio:如果您使用开源 Istio,我们建议您使用 Google Cloud Managed Service for Prometheus 收集指标。
- GKE Ingress:配置适用于应用负载均衡器的 GKE Ingress 时,系统会自动为将流量路由到 GKE Ingress 后面的 GKE Service 和 Deployment 资源的 HTTP/S 负载均衡器收集性能指标。
- NGINX Ingress:如果您使用的是 NGINX Ingress,我们建议您使用 Google Cloud Managed Service for Prometheus 收集指标。
- Prometheus HTTP 和 gRPC 指标:如果您的应用公开 Prometheus HTTP 或 gRPC 指标,我们建议您按照 HTTP 服务器和 gRPC 服务器文档使用 Google Cloud Managed Service for Prometheus 收集指标。
查看应用性能指标
在性能数据可供分析后,您可以在应用信息中心上查看 Deployment 的指标。