Google Cloud 的运维套件(以前称为 Stackdriver)
适用于在 Google Cloud 及其他环境上运行的应用和系统的集成式监控、日志记录和跟踪记录代管式服务。
-
通过 Monitoring 和 Logging 快速入门指南开始使用运维套件
-
研究表明,成功的可靠性包含可观测性的几率比不包含可观测性的几率高 4.1 倍
-
了解 Google Cloud 的运维套件如何帮助客户提高云可观测性
-
下载概况简明介绍:Google Cloud 中的可观测性
主要特性
主要特性
实时日志管理与分析
Cloud Logging 是一项可大规模实现出色性能的全代管式服务,能够注入 GKE 环境、虚拟机以及 Google Cloud 内部和外部的其他服务中的应用和平台日志数据以及自定义日志数据。利用日志分析获得高级的性能、问题排查、安全性和业务数据洞见,从而将 BigQuery 的强大功能集成到 Cloud Logging 中。
规模化的内置指标可观测性
Cloud Monitoring 可帮助您了解云应用的性能、正常运行时间以及总体健康状况。它可从以下来源收集指标、事件和元数据:Google Cloud 服务、托管的正常运行时间探测工具、应用插桩 (instrumentation) 以及各种常见应用组件。在图表和信息中心内直观呈现此数据,并创建提醒,以便在指标超出预期范围时通知您。
用于运行和伸缩 Prometheus 的独立代管式服务
Managed Service for Prometheus 是一种与 Prometheus 兼容的全代管式监控解决方案,它基于与 Cloud Monitoring 相同的全球可扩缩数据存储服务。保留现有的可视化、分析和提醒服务,因为您可以使用 PromQL 或 Cloud Monitoring 查询这些数据。
监控并改善应用性能
应用性能管理 (APM) 将 Cloud Logging 和 Cloud Monitoring 的监控和问题排查功能与 Cloud Trace 和 Cloud Profiler 相结合,可帮助您缩短延迟时间并降低费用,以便您可以运行更高效的应用。
文档
文档
运维套件文档
查看关于运维套件的所有文档。
开始使用 Cloud Monitoring
了解指标范围、监控代理、拨测和其他功能。
开始使用 Cloud Logging
帮助您上手运行 Cloud Logging 的指南和设置文档。
为 GKE 提供监控和日志记录支持
了解 Google Kubernetes Engine 与 Cloud Monitoring 和 Cloud Logging 的原生集成。
Google Cloud 指标
查看 Cloud Monitoring 支持哪些指标。
实操实验:Google Cloud 的运维套件
在这一基础级的挑战任务中,您将学习 Google Cloud 运维套件的各个方面,从而洞悉应用的运行状况。
Dashboard API:构建您自己的 Cloud Monitoring 信息中心
关于创建可共享和可重复使用的信息中心的提示。
Cloud Audit Logs
了解 Cloud Audit Logs 如何维护三类审核日志:管理员活动、数据访问和系统事件。
混合部署和多云端部署
本文档讨论了混合部署和多云端部署的监控和日志记录架构。
使用场景
使用场景
利用 Cloud Logging 和 Cloud Monitoring,您的 IT Ops/SRE/DevOps 团队可以获得监控基础架构和应用所需的现成的观测功能。Cloud Logging 会自动提取 Google Cloud 审核和平台日志,以便您立即上手使用。Cloud Monitoring 可免费显示所有 Google Cloud 指标,并与各种供应商产品集成,从而呈现非 Google Cloud 监控的指标内容。
利用全套 Cloud 运维工具缩短平均恢复时间 (MTTR) 并优化应用的性能。使用信息中心同时通过服务和自定义应用指标来深入了解您的应用。使用 Monitoring SLO 和提醒帮助识别错误。
所有特性
所有特性
日志管理 | 日志路由器可让客户控制将日志发送到何处。所有日志(包括审核日志、平台日志和用户日志)都会发送到 Cloud Logging API,并流经日志路由器。日志路由器会依据现有规则检查每条日志条目,以确定哪些日志条目应该舍弃,哪些应该提取,以及哪些应该包括在导出内容中。 |
主动监控 | Cloud Monitoring 让您可以创建提醒政策,以便在各项指标、健康检查结果和正常运行时间检查结果达到指定阈值时收到通知。该产品集成了多种通知渠道,包括 Slack 和 PagerDuty。 |
Prometheus 作为代管式服务 | 使用 Managed Service for Prometheus 减轻 Prometheus 基础架构、更新、存储空间等的扩缩和管理负担。避免供应商锁定,并保留您当前用于直观呈现、提醒和分析 Prometheus 指标的所有开源工具。 |
自定义可视化内容 | Cloud Monitoring 提供默认的开箱即用型信息中心,让您可以利用强大的可视化工具根据需求来自定义信息中心。 |
健康检查监控 | Cloud Monitoring 为您的云环境中运行的 Web 应用和其他可通过互联网访问的服务提供拨测功能。您可以配置与网址、群组或资源(例如实例和负载均衡器)关联的拨测。 |
服务监控 | Service Monitoring 提供开箱即用的遥测功能和信息中心,让您可通过拓扑图和情境图在具体情境中排查问题;另外,还通过 SLO 和错误预算管理功能实现了运行状况监控的自动化。 |
延迟管理 | Cloud Trace 提供 App Engine 延迟采样和报告功能,并可显示每个网址的统计数据和延迟分布。 |
性能和费用管理 | Cloud Profiler 可持续对您的生产应用中的资源使用情况进行性能剖析,从而帮助您识别并消除潜在的性能问题。 |
安全管理 | Cloud Audit Logs 提供覆盖整个 Google Cloud 的近乎实时的用户活动可见性。 |
价格
价格
Google Cloud 运维产品按照数据量计费,提供免费每月配额以及对 Google Cloud Platform 指标和审核日志的无限使用权限。所有功能都可以使用,无需有任何其他价格方面的顾虑。
产品 | 价格 |
---|---|
Cloud Monitoring | 所有产品功能和 Google Cloud 指标均包含在内,无需额外付费。对于每个结算帐号,在每月 150 MiB 的指标数据量免费额度用尽后,按照 $0.2580/MiB 的价格计费。 |
Cloud Logging | 所有产品功能和 Google Cloud 审核日志均包含在内,无需额外付费。对于每个项目,在每月 50 GiB 的数据量免费额度用尽后,按照 $0.50/GiB 的价格计费。 |
BindPlane 是 Blue Medora 的注册商标。