深入了解应用和基础架构对于保持性能和稳定性至关重要。因此,Google Distributed Cloud (GDC) 空气隔离设备提供了一个监控平台,用于收集和分析指标。
借助 GDC 监控平台,您可以收集和查询已部署工作负载的指标。您可以使用监控平台的内置可观测性工具来监控和直观呈现系统。
通过有效地收集和查询指标,您可以深入了解隔离环境,并确保工作负载的最佳性能。
主要概念
GDC 监控平台引入了以下概念:
指标是从 GDC 工作负载中收集的定量衡量数据,可提供有关资源利用率和性能的宝贵数据分析。GDC 使用 Prometheus 来实现这一目的。Prometheus 是一种开源监控系统,可确保高效可靠地收集数据。
信息中心是指标的可视化表示形式,可用于观察趋势和系统行为。您的 GDC 项目包含一个用于指标可视化的专用 Grafana 实例。Grafana 是一款分析平台,可让您创建富有洞见的信息中心并探索指标数据。GDC 为标准组件提供预构建的信息中心,让您可以立即了解环境情况。
监控工作流
为了便于监控组件的进程,GDC 监控平台按以下工作流程运行:
收集指标:当 GDC 环境正常运行后,系统会自动收集核心组件的指标,并在预配置的 Grafana 信息中心内显示这些指标。此功能可提供即时网络和服务器监控。
您还可以通过部署自定义资源来为自己的应用和服务配置抓取目标,这些自定义资源定义了要收集的工作负载特定指标以及收集频率。
查询指标:您可以使用 PromQL(Prometheus 查询语言)查询收集的指标。通过查询指标,您可以执行以下操作:
- 根据标签和值过滤指标。
- 随时间推移汇总数据。
- 对指标值执行计算。
构建信息中心并直观呈现指标:使用 Grafana 构建可直观呈现指标的自定义信息中心。这些信息中心可清晰全面地显示系统性能,让您能够执行以下操作:
- 发现趋势和异常情况。
- 有效排查问题。
- 做出明智的资源分配和优化决策。
指标保留
保留政策定义了指标和日志的存储时长。这些政策对于满足合规性要求和支持运营分析至关重要。
GDC 使用保留时间来设置指标的生命周期和保留政策。系统会为指标保留时间应用 90 天的默认值。
访问方法
您可以使用以下访问方法来处理组件指标:
- Grafana 界面:您可以通过 GDC 控制台或直接使用网址访问项目的 Grafana 实例。通过该界面,您可以查询和直观呈现指标。
- HTTP API:以编程方式使用 HTTP API 检索指标数据。 此方法可与外部工具和自动化脚本集成。