Stackdriver Service MonitoringAlpha 版

适用于 Istio 和 Google App Engine 服务的 Stackdriver Service Monitoring。

Stackdriver Istio Hero Isometric

Stackdriver Service Monitoring

现代应用由多项服务组成,为一个应用或使用场景提供支持的不同依赖项多达数十个甚至数百个。当其中一个依赖项出现问题时,看起来往往就像很多依赖项同时出现了问题。为帮助处理这种复杂情况,Stackdriver 现在支持对通过 Cloud Services Platform 和 Istio 服务网格技术提供的服务进行监控。Stackdriver Service Monitoring 还可以监控 Google App Engine 服务。

服务可观察性

服务可观察性

服务内的依赖关系理解起来很难,服务间的关系和连接模式也复杂而多变。Stackdriver Service Monitoring 可提供一个服务图,其中显示了您的应用中的所有服务及其关系,让您一目了然地掌握依赖关系。服务图还会显示服务之间的流量、错误和延迟,以便您了解哪些服务可能影响了其他服务的性能或可用性。除此之外,服务图还可让您查看随时间变化的情况,以便更轻松地找出问题所在。Stackdriver Service Monitoring 服务图可为您提供服务及其依赖项的实时视图和历史视图,这样一来,您不但可以直观查看应用状况,还可以缩短根本原因分析和恢复的时间。

设置服务等级目标

设置服务等级目标

借助服务监控功能,您可以根据服务等级目标来设置、监控和提醒团队,让他们将精力集中在对您的业务至关重要的事情上。Istio(和 App Engine)用自己的方式设置插桩 (instrumentation),因此,我们确切地知道事务计数、错误计数和服务之间的延迟分布情况。您只需设置可用性和性能目标,我们就可以自动生成一些图表,用于展示服务等级指标 (SLI)、一段时间内的目标达成情况以及剩余的“错误预算”。如果未达到目标,系统会提醒您采取措施来修复服务。

可观察性方面的工效学

可观察性方面的工效学

Stackdriver Service Monitoring 提供交互式信息中心,让您可以深入了解服务在所有信号中的表现,而无需在指标、日志和跟踪记录之间跳转。您将获得针对各项具体服务的信息中心,并可进一步将其限定为特定时间范围。在诊断可用性问题时,您可以深入查看指标热图和跟踪记录,探索日志和错误报告,查询堆栈轨迹,还可以使用实时生产调试器(如果设置了插桩)。服务信息中心提供了一种连贯的缩小排查范围的方式:您可以从某项服务的一条警报开始,先将范围缩小到特定时间段,再到部分流量,最后到潜在的原因。如需让服务问题水落石出,这是最快的方式。

Istio Service Monitoring 的实际运用

  • 使用 Stackdriver Service Monitoring SLO 监控和检测应用何时出现问题
  • 使用 Stackdriver 的服务图弄清服务的依赖关系以及哪项服务最有可能是问题原因
  • 使用服务信息中心排查来自服务的各种信号,追查问题的根本原因

此产品目前为 Alpha 版。如需详细了解我们的产品发布阶段,请点击此处