运维套件(原 Stackdriver)

在 Google Cloud 环境中监控应用性能,排查其中的问题并加以改善。

免费试用 Google Cloud
  • action/check_circle_24px 使用 Sketch 创建。

    跨 Google Cloud Platform 及应用收集指标、日志和跟踪记录

  • action/check_circle_24px 使用 Sketch 创建。

    使用内置的开箱即用型信息中心和视图来监控平台及应用

  • action/check_circle_24px 使用 Sketch 创建。

    查询和分析这些信号

  • action/check_circle_24px 使用 Sketch 创建。

    设置适当的性能和可用性指标

  • action/check_circle_24px 使用 Sketch 创建。

    使用现有系统设置提醒和通知规则

主要特性

实时日志管理与分析

Cloud Logging 是一项可大规模实现出色性能的全代管式服务,能够从 GKE 环境及虚拟机中提取应用和系统日志数据以及自定义日志数据。Cloud Logging 让您可以实时分析所选日志并将其导出至长期存储空间中。

规模化的内置监测功能

Cloud Monitoring 可帮助您了解云应用的性能、正常运行时间以及总体运行状况。它会从以下来源收集指标、事件和元数据:Google Cloud 服务、托管的正常运行时间探测工具、应用插桩 (instrumentation) 工具以及各种常见应用组件。

监控并改善应用性能

应用性能管理 (APM) 工具可帮助您缩短延迟时间并降低费用,让您更高效地运行应用。借助 Cloud TraceCloud DebuggerCloud Profiler,您可以深入了解代码和服务的运行情况,并在需要时对其进行问题排查。

查看所有特性

客户

Dacsee 创始人
Dacsee:借助 Google Kubernetes Engine 颠覆叫车业务。
阅读案例

案例亮点

  • 减少在基础架构管理方面所花的时间

  • 在一个集中式平台管理所有运维产品

  • 节省大约 80% 的问题排查时间。

合作伙伴

文档

教程
Dashboard API:构建您自己的 Cloud Monitoring 信息中心

关于创建可共享和可重复使用的信息中心的提示。

教程
开始使用 Cloud Logging

帮助您上手运行 Cloud Logging 的指南和设置文档。

教程
Cloud Audit Logs

了解 Cloud Audit Logs 如何维护三类审核日志:管理员活动、数据访问和系统事件。

教程
开始使用 Cloud Monitoring

了解工作区、监控代理、正常运行时间检查和其他功能。

架构
Google Cloud 指标

查看 Cloud Monitoring 支持哪些指标。

Google Cloud 基础知识
为 GKE 提供监控和日志记录支持

了解 Google Kubernetes Engine 与 Cloud Monitoring 和 Cloud Logging 的原生集成。

架构
混合部署和多云端部署

本文档讨论了混合部署和多云端部署的监控和日志记录架构。

教程
Qwiklabs 挑战任务:Google Cloud 的运维套件

在这一基础级的挑战任务中,您将学习 Google Cloud 运维套件的方方面面,从而洞悉应用的运行状况。

使用场景

使用场景
集中管理日志记录和运维

集成式日志记录工具可为开发团队、DevOps/SRE 团队和安全团队提供有关平台事件的重要数据洞见。 从 Google Cloud 服务和外部来源提取日志,并将其用于短期运维和长期日志分析。利用集成式审核日志记录工具执行详细的取证分析。通过实时日志导出功能与第三方日志记录系统相集成。

Cloud Logging 会收集所有日志(包括审核日志、平台日志、用户日志和发送到 API 的外部日志),这些日志会发送到日志路由器并由其传输给 Cloud Logging、BigQuery 或外部(借助与 Pub/Sub 的集成)。
使用场景
将监测功能内置到应用和基础架构中

Cloud Logging 和 Cloud Monitoring 服务可为您的 SRE/DevOps 团队提供所需的监测功能,以便监控 Google Cloud、本地环境和第三方提供商。Logging 和 Monitoring 与 Security Command Center 相集成,可为安全和运维团队提供所需的数据洞见。

Cloud Logging 和 Cloud Monitoring 服务可为您的 SRE/DevOps 团队提供所需的监测功能,以便监控 Google Cloud、本地环境和第三方提供商。Logging 和 Monitoring 与 Security Command Center 相集成,可为安全和运维团队提供所需的数据洞见。
使用场景
利用 APM 缩短延迟时间并提升效率

通过使用应用性能管理工具缩短延迟时间并降低费用提升应用的运行速度和可靠性,而无论其是否托管在 Google Cloud 上。通过 Cloud Trace 的分布式跟踪记录,了解请求如何在您的应用中传播。借助 Cloud Profiler 确定导致延迟和低效的代码。使用 Cloud Debugger 对生产环境中的应用进行问题排查,而不用停止或拖慢应用。

利用 APM 缩短延迟时间并提升效率

所有特性

日志管理 日志路由器让客户可以控制将日志发送到何处。所有日志(包括审核日志、平台日志和用户日志)都会发送到 Cloud Logging API,并流经日志路由器。日志路由器会依据现有规则检查每条日志条目,以确定哪些日志条目应该舍弃,哪些应该提取,以及哪些应该包括在导出内容中。
日志数据分析 Error Reporting 可分析并汇总云端应用中的错误,并在检测到新错误时向您发出通知。
主动监控 Cloud Monitoring 让您可以创建提醒政策,以便在各项指标、运行状况检查结果和正常运行时间检查结果达到指定阈值时收到通知。该产品集成了多种通知渠道,包括 Slack 和 PagerDuty。
自定义可视化内容 Cloud Monitoring 信息中心提供默认的开箱即用型信息中心,让您可以利用强大的可视化工具根据需求来自定义信息中心。
运行状况检查监控 Cloud Monitoring 为您的云环境中运行的 Web 应用和其他可通过互联网访问的服务提供端点检查功能。您可以配置与网址、群组或资源(例如实例和负载平衡器)关联的正常运行时间检查。
服务监控 Service Monitoring 提供开箱即用的遥测功能和信息中心,让您可通过拓扑图和情境图在具体情境中排查问题;另外还通过 SLO 和错误预算管理功能实现了运行状况监控的自动化。
延迟管理 Cloud Trace 提供 App Engine 延迟采样和报告功能,并可显示每个网址的统计数据和延迟分布。
调试 Cloud Debugger 可让您在生产环境中的任意代码位置检查应用状态,从而将应用的生产环境数据关联至您的源代码。在此过程中您无需中止或者减缓请求处理。
性能和费用管理 Cloud Profiler 可持续分析您的生产应用中的资源使用情况,从而帮助您识别并消除潜在的性能问题。
安全管理 Cloud Audit Logs 在整个 Google Cloud 中提供近乎实时的用户活动可见性。

价格

控制您自己的用量和支出:只需为所用资源付费。免费用量配额让您无需预付费用或做出承诺,即可开始使用服务。

免费用量配额让您无需预付费用或做出承诺,即可开始使用服务。

合作伙伴

从丰富且不断发展的技术集成生态系统中获得支持,拓展 Google Cloud 客户可用的 IT 运维、安全和合规功能。