监控

本页面介绍了监控对 Cloud Storage 的请求(包括跟踪错误、请求速率和数据使用量)的选项。

监控选项

在 Google Cloud 控制台中,您可以通过多个级别的资源层次结构来监控 Cloud Storage 请求:

  • 单个存储桶:在每个存储桶详情页面中,有一个可观测性标签页,用于报告该特定存储桶的指标。

  • 所有存储桶:每个项目都有一个 Cloud Storage Monitoring 页面,可通过 Cloud Storage 的左侧窗格访问。您也可以使用以下网址直接访问此页面:

    https://console.cloud.google.com/storage/monitoring?project=PROJECT_ID

    其中,PROJECT_ID 是您要监控其指标的项目的 ID。

  • 所有 Google Cloud 资源:如需监控 Google Cloud 项目、文件夹或组织中的所有服务和资源,请使用 Google Cloud 控制台中的 Cloud Monitoring 服务。您可以访问 https://console.cloud.google.com/monitoring 来使用此服务。

默认监控

默认情况下,以下图表会显示在各个存储桶监控和 Cloud Storage Monitoring 页面中:

图表 说明
服务器错误率 包含 5xx 错误代码的请求。这些错误通常是由 Google Cloud 内部的问题引起的,并且可重试

5xx 错误代码在 Cloud Storage 服务等级协议 (SLA) 涵盖范围内。

客户端错误率 包含 4xx 错误代码或 304 状态代码以及 FAILED_PRECONDITION 错误的请求。这些错误表明需要由请求者或为请求者做出更改,例如授予请求者足够的权限以访问相关的 Cloud Storage 资源或缩减请求以防止用尽配额。
读取错误数 对象读取错误,尤其是响应代码为 INTERNALUNAVAILABLEDEADLINE_EXCEEDED 的错误。此图不包含与存储桶元数据、对象列表或对象元数据的请求相关的错误。
  • 对于单存储桶监控,系统会汇总整个存储桶的错误。
  • 对于 Cloud Storage Monitoring,系统会为每个存储桶汇总错误,并默认显示读取错误最多的 5 个存储桶。图表可以自定义以显示其他存储桶。
写入错误数 对象写入错误,尤其是响应代码为 INTERNALUNAVAILABLEDEADLINE_EXCEEDED 的错误。此图表中不包含与对象重写、对象组合、元数据更新和 XML API 分段上传请求相关的错误。
  • 对于单存储桶监控,系统会汇总整个存储桶的错误。
  • 对于 Cloud Storage Monitoring,系统会为每个存储桶汇总错误,并默认显示写入错误最多的 5 个存储桶。图表可以自定义以显示其他存储桶。
读取/列出/获取请求总数
  • 对于单存储桶监控,这是向存储桶发出的获取请求总数。
  • 对于 Cloud Storage Monitoring,这是向不同位置发出的获取请求总数。

计数按方法类型分组,例如存储桶元数据请求、对象元数据请求、对象数据请求和列出对象请求。

写入请求总数
  • 对于单存储桶监控,这是向存储桶发出的对象写入请求总数。
  • 对于 Cloud Storage Monitoring,这是向不同位置发出的对象写入请求总数。

此图表中不包含有关对象重写、对象组合、元数据更新和 XML API 分段上传的请求。

网络的数据入站流量速率
  • 对于单存储桶监控,这是存储桶接收字节的速率。
  • 对于 Cloud Storage Monitoring,这是每个位置所有存储桶接收字节的速率。
通过网络的数据出站流量速率
  • 对于单存储桶监控,这是存储桶发送字节的速率。
  • 对于 Cloud Storage Monitoring,这是每个位置所有存储桶发送字节的速率。

特定于“可观测性”页面的图表

默认情况下,每个存储桶可用的可观测性标签页还包含以下监控图表:

图表 说明
超过 RPO 的分钟数所占百分比 适用于双区域和多区域中的存储桶。在不同地理位置之间复制一个或多个对象所用的时间超出其 RPO(恢复点目标)时间的分钟数所占百分比。指标是过去 30 天的汇总指标。在发生复制与监控报告关联的指标之间存在延迟,通常为几个小时。

如需了解详情(包括不同复制选项的 RPO 时间),请参阅性能监控

超过目标的对象所占百分比 适用于双区域和多区域中的存储桶。在 RPO(恢复点目标)时间内在不同地理位置之间未复制的对象所占的百分比。指标是过去 30 天的汇总指标。跟踪默认复制指标时,此图表还包含一条线,用于衡量 1 小时设计目标内在不同地理位置之间未复制的对象所占的百分比。在发生复制与监控报告关联的指标之间存在延迟,通常为几个小时。

如需了解详情(包括不同复制选项的 RPO 时间),请参阅性能监控

存储桶符合 RPO 适用于双区域和多区域中的存储桶。一个布尔值,表示存储桶中的所有对象是否符合 RPO。

如需了解详情(包括不同复制选项的 RPO 时间),请参阅性能监控

增强型复制的最长延迟时间 适用于具有增强型复制功能的双区域中的存储桶。存储桶中最早未复制的对象的存在时间(以秒为单位)。

特定于 Monitoring 页面的图表

默认情况下,Cloud Storage Monitoring 页面还包含以下监控图表:

图表 说明
Google 出站流量带宽用量 从 Cloud Storage 到其他 Google Cloud 服务的数据出站流量。此图表仅跟踪位于区域的存储桶中的出站流量,并按区域对数据进行分组。如需了解详情,请参阅 Cloud Storage 中的带宽用量

您可以通过点击自定义信息中心按钮(显示在单个存储桶监控标签页和 Cloud Storage 监控页面中)来创建自己的信息中心布局和自定义收集的数据。如需了解详情,请参阅管理自定义信息中心