Service MonitoringBeta 版

Service Monitoring 支持 Istio、Anthos Service Mesh、App Engine 以及其他客户定义的服务。

“现代应用监控”图示

监控现代应用

现代应用由多项服务组成,为一个应用或使用场景提供支持的不同依赖项多达数十个甚至数百个。 当其中一个依赖项出现问题时,看起来往往就像很多依赖项同时出现了问题。为帮助处理这种复杂情况,Service Monitoring 现在支持对通过 Anthos 和 Istio 服务网格技术提供的服务进行监控。Service Monitoring 还可以监控 App Engine 服务和客户定义的服务。

设置服务等级目标

设置服务等级目标 (SLO)

借助服务监控功能,您可以根据服务等级目标 (SLO) 来设置、监控和提醒团队,让他们将精力集中在对您的业务至关重要的事情上。Istio(和 App Engine)以固有的方式设置插桩 (instrumentation),因此,我们确切地知道服务之间的事务计数、错误计数和延迟分布情况。您只需设置可用性和性能目标,我们就可以自动生成一些图表,用于展示服务等级指标 (SLI)、一段时间内的目标达成情况以及剩余的“错误预算”。如果未达到目标,系统会提醒您采取措施来修复服务。

服务可观测性

Anthos Service Mesh 中的服务可观测性

服务内的依赖关系理解起来很难,服务间的关系和连接模式也复杂而多变。Service Monitoring 提供一个服务图,其中显示了您的应用中的所有服务及其相互关系,让您一目了然地掌握依赖关系。服务拓扑图还会显示服务之间的流量、错误和延迟,以便您了解哪些服务可能影响了其他服务的性能或可用性。除此之外,服务拓扑图还可让您查看随时间变化的情况,以便更轻松地找出问题所在。Service Monitoring 服务图可为您提供服务及其依赖项的实时视图和历史视图,这样一来,您不但可以直观查看应用状况,还可以缩短根本原因分析和恢复的时间。

可观测性方面的工效学

可观测性方面的工效学

Service Monitoring 提供交互式信息中心,让您可以深入了解某个服务在所有标志信号中的表现,而无需在 SLO、指标、日志和提醒之间跳转。您有一个按照具体服务划分范围的信息中心,并可按特定时间范围进一步划分。在诊断可用性问题时,您可以深入查看指标、热图和跟踪记录,还可以探索日志。服务信息中心提供了一种连贯的缩小排查范围的方式:您可以从某项服务的一条警报开始,先将范围缩小到特定时间段,再到部分流量,最后到潜在的原因。这是查明服务问题的最快的可能方式。

Service Monitoring 的实际运用

  • 使用 Service Monitoring SLO 监控和检测应用何时出现问题
  • 使用 Anthos Service Mesh 中的服务拓扑图弄清服务的依赖关系以及哪项服务最有可能是问题原因
  • 使用服务信息中心排查来自服务的各种信号,查出问题的根本原因
Google Cloud

开始使用

学习和构建

刚接触 GCP?您可以领取 $300 赠金,免费开始使用任意 GCP 产品。

需要更多帮助?

我们的专家会根据您的需求,帮助您打造合适的解决方案,或者寻找合适的合作伙伴。

此页面上列出的产品和功能目前为 Alpha 版或 Beta 版。如需详细了解我们的产品发布阶段,请点击此处