下载有关 SRE 的新白皮书,了解关键概念以及 Google Cloud 如何帮助您完成 SRE 之旅

跳转到

Cloud Monitoring

直观了解您的应用和基础架构的性能、可用性和运行状况。

  • action/check_circle_24px 使用 Sketch 创建。

    查看从 Google Cloud 服务自动收集的系统指标

  • action/check_circle_24px 使用 Sketch 创建。

    采用 Google 自身广泛使用的 SRE 最佳做法(包括 SLO 和 SLI)

  • action/check_circle_24px 使用 Sketch 创建。

    使用代管式指标收集流水线从 GKE 上的工作负载收集应用指标

  • action/check_circle_24px 使用 Sketch 创建。

    使用 Ops Agent 从虚拟机收集应用指标和深度系统指标

  • action/check_circle_24px 使用 Sketch 创建。

    创建自定义信息中心并创建与突发事件管理工具集成的提醒

优势

适用于 Google Cloud 和其他环境

Cloud Monitoring 为 Google Cloud 服务提供了自动开箱即用的指标收集信息中心。此外,它还支持监控混合环境和多云端环境。

发现趋势,预防问题

支持使用丰富的查询语言显示指标、事件和元数据,有助于识别问题和发现模式。服务等级目标可以衡量用户体验,并加强与开发者之间的协作。

降低监控开销

这是一项包含指标、正常运行时间监控、信息中心和提醒的集成式服务,可节省在不同系统之间导航所用的时间。上下文内可观测性在 Google Cloud 资源页面中显示指标。

主要特性

主要特性

SLO 监控

针对应用自动推断或自定义服务等级目标 (SLO),并在出现 SLO 违规情况时收到提醒。 请查看我们的分步指南,了解如何按照 SRE 最佳做法设置 SLO。

自定义指标

对应用进行插桩处理,以通过 Cloud Monitoring 监控应用和业务层面指标

Google Cloud 集成

发现并监控所有 Google Cloud 资源和服务,此功能直接集成于 Google Cloud Console 中,无需额外插桩。

查看所有特性

最新资讯

最新资讯

订阅 Google Cloud 简报,了解产品动态、活动安排、特别优惠以及更多资讯。

文档

文档

教程
安装控制台中的 Ops Agent

在本教程中,您将直接在 Google Cloud Console 中操作,创建一个 Compute Engine 实例(虚拟机),安装 Ops Agent,并测试它是否正常运行。

快速入门
监控 Compute Engine 实例

了解如何使用 Cloud Monitoring 监控 Compute Engine 虚拟机 (VM) 实例。

快速入门
Cloud Monitoring API 简介

本页面介绍 Cloud Monitoring API v3 的一些功能。

教程
监控 API 使用量

了解如何跟踪 API 的整体用量并监控 API 的性能。

最佳做法
服务监控中的概念

熟悉服务等级指标 (SLI) 和服务等级目标 (SLO)。

教程
创建服务等级指标

为自定义服务及自动检测到的服务创建服务等级目标 (SLO)。确定您想在服务等级指标 (SLI) 中使用的指标。

所有特性

所有特性

SLO 监控 针对应用自动推断或自定义服务等级目标 (SLO),并在出现 SLO 违规情况时收到提醒。
自定义指标 对您的应用进行插桩处理,以通过 Cloud Monitoring 监控应用和业务层面指标
Google Cloud Console 集成 发现和监控所有 Google Cloud 资源和服务,无需任何额外配置,直接集成在 Google Cloud Console 中。
Ops Agent 在 Google Cloud 虚拟机上部署 Ops Agent,以便从应用和系统中收集详细的指标和日志。试用控制台中的分步教程,了解如何在运行中的虚拟机上安装代理。 
集成日志记录服务 从信息中心和图表到日志,层层深入分析。根据日志数据,创建和直观呈现指标,并发出相关提醒。
信息中心 无需配置,即可深入了解您的云资源和服务。设置自定义信息中心并利用 Google 强大的数据可视化工具。
支持多个项目和群组/集群 创建指标范围以监控一个项目或同时监控多个项目,并创建资源组以基于资源名称、标记、安全群组、项目、区域、帐号和其他条件定义关系。利用这些关系,创建有针对性的信息中心和拓扑感知型提醒政策。
提醒 配置提醒政策,以便在有事件发生或特定系统指标/自定义指标违反了您所定义的规则时收到通知。可使用多个条件定义复杂的提醒规则。通过电子邮件、短信、Slack、PagerDuty 等接收通知。
正常运行时间监控 借助遍布全球的探测器并使用正常运行时间检查,监控您可通过互联网访问的网址、虚拟机、API 和负载均衡器的可用性。创建提醒以便在服务中断时主动收到通知。

价格

价格

Cloud Monitoring 涵盖所有 Google Cloud 指标和所有产品特性,无需另外付费即可使用。下表列出了免费配额和收费指标的价格。如需了解详情,请参阅价格指南

功能 价格1 每月免费配额 生效日期
Monitoring 数据

$0.2580/MiB:150–100000 MiB

$0.1510/MiB: 100,000–250,000 MiB

$0.0610/MiB: >250,000 MiB

所有 Google Cloud 指标2

每个结算帐号的前 150 MiB(针对收费指标

2018 年 7 月 1 日
监控使用 GKE 工作负载指标注入的数据

$0.15/百万个样本3:前 0-500 亿个样本

$0.12/百万个样本:接下来的 500-2500 亿个样本

$0.09/百万个样本:超过 2500 亿个样本

不适用 2021 年 12 月 1 日
Monitoring API 调用 $0.01/1000 次 API 调用(写入 API 调用免费) 包括每个结算帐号的前 100 万次 API 调用 2018 年 7 月 1 日

1 在计费时,所有单位(例如 MB、GB)均表示二进制计量单位。例如,1 MB 是 220 字节。1 GB 是 230 字节。这些二进制单位也称作兆比字节 (MiB)吉比字节 (GiB)

2 以不超过每分钟 1 个数据点的速度(目前最高的解析度)计量的 Google Cloud 指标或 Anthos 指标均免费。今后,以更高解析度计量的指标可能会产生费用。

Google 推荐的的方法是将 GKE 工作负载指标与 Cloud Monitoring 搭配使用,从而监控 Kubernetes 应用。GKE 工作负载指标根据注入的样本(而非字节数)进行计量,从而与 Prometheus 的惯例保持一致。