在数据库中查找热点

本页介绍了如何使用 Hotspot Insights 信息中心检测 Spanner 数据库中的热点。

热点分析洞见概览

热点会导致 Spanner 数据库出现延迟。“热点分析”信息中心可帮助您检测受热点影响的分块。请按照以下步骤确定热点是否导致了延迟,如果是,如何解决此问题:

  1. 打开信息中心
  2. 确定热点是否需要您的干预。
  3. 找出有问题的热分块。

热点分析适用于单区域、多区域和双区域配置。

价格

热点数据分析不会产生额外费用。

数据保留

热点数据分析图表和表格的数据保留期限上限为 6 小时。

对于最热门的分块表,系统会从 SPANNER_SYS.SPLIT_STATS_TOP_MINUTE 表中提取数据,该表的保留期限上限为 6 小时。如需了解详情,请参阅数据保留

所需的角色

您可能需要不同的 IAM 角色和权限,具体取决于您是 IAM 用户还是精细访问权限控制用户。

Identity and Access Management (IAM) 用户

如需获得查看热点数据分析页面所需的权限,请让您的管理员向您授予实例的以下 IAM 角色:

如需查看热点分析页面,您必须拥有 Cloud Spanner Database Reader (roles/spanner.databaseReader) 角色中的以下权限:

  • spanner.databases.beginReadOnlyTransaction
  • spanner.databases.select
  • spanner.sessions.create

精细访问权限控制用户

如果您是精细访问权限控制用户,请确保:

  • 拥有 Cloud Spanner Viewer (roles/spanner.viewer)
  • 拥有精细访问权限控制权限,并被授予 spanner_sys_reader 系统角色或其成员角色之一。
  • 在数据库的概览页面上,选择 spanner_sys_reader 或成员角色作为您的当前系统角色。

如需了解详情,请参阅精细访问权限控制概览精细访问权限控制系统角色

打开“热点数据分析”信息中心

热点分析信息中心会显示分块 CPU 使用率峰值百分比。此指标是一个介于 0 到 100 之间的抽象百分比,反映了访问分块内行时所使用的 CPU 数量。

如需查看数据库的热点分析信息中心,请执行以下操作:

  1. 在 Google Cloud 控制台中,打开 Spanner 页面。

    转到 Spanner

  2. 从列表中选择一个实例。

  3. 在导航菜单中,点击热点数据分析标签页。

  4. 数据库字段中,从列表中选择一个数据库。该信息中心会显示数据库的峰值分块 CPU 使用率得分。

信息中心包含以下部分:

  • 峰值拆分 CPU 使用率得分图表:与较低的分数相比,较高的 CPU 使用率得分(例如接近 100)表示相应分块较热,很可能导致服务器上出现热点。
  • “数据库”字段:过滤特定数据库或所有数据库上的热分块信息。
  • 时间范围过滤器:按 1 分钟的增量过滤峰值分块 CPU 使用率,最多可过滤 6 小时。
  • “TopN 个分块”表:按分块 CPU 使用率得分显示热门分块列表。

热点数据分析信息中心

确定热点是否需要干预

如果您在图表中看到与总体延迟时间和持续较高的峰值拆分 CPU 使用率得分相对应的峰值或上升幅度,则可能需要进一步调查。

查看图表,探索以下问题:

  • 哪个数据库出现了延迟时间下降问题?数据库列表中选择不同的数据库,找出延迟时间最长的数据库。如需了解哪个数据库的负载最高,您还可以在 Google Cloud 控制台中查看数据库的延迟时间图表

    延迟时间

  • 延迟时间是否较长?延迟时间与工作负载的预期延迟时间相比是否较长?图表是否随着时间推移或上升?如果您没有看到高延迟,则热点不存在问题。

  • 分块 CPU 使用率最高分数是否为 100%?图表是否随着时间推移或上升?如果您至少 10 分钟内没有看到持续的 100% 峰值分屏 CPU 使用率百分比,则热点可能不是问题。如果分块 CPU 使用率峰值高于 10 分钟,您可能需要进一步调查,看看数据库的延迟时间是否高于预期。

如果您发现分块 CPU 使用率峰值持续超过 10 分钟,则热点可能需要您进行干预。接下来,您可以通过识别数据库中的热分块来继续调试过程。

识别有问题的热分块

如需识别可能存在问题且存在热点的分块,请参阅 Google Cloud 控制台中的 TopN 分块部分,如下所示。

最热的 N 个分块

热门分块数表格概要显示了在所选时间范围内可能较热的分块,按最新到最早的顺序排序。TopN 分块的数量上限为 100。

对于图表,Spanner 会从 TopN 分块统计信息表中提取数据,精确到分钟级。图表中每个数据点的值代表一分钟间隔内的平均值。

下表显示了以下属性:

  • 间隔结束时间:CPU 使用率高峰结束的日期和时间。
  • 分块起始:分块中行范围的起始键。如果分块起始键为 <begin>,则表示数据库的键范围的起始位置。
  • 分块限制键:分块中行范围的限制键。如果限制键为 <end>,则表示数据库的键范围的结束位置。
  • 分块 CPU 使用率分数:介于 0 到 100 之间的抽象分数,反映了用户访问单个服务器分块内的行时所使用的 CPU 数量。使用 CPU 使用率分数有助于评估是否存在热点。
  • 受影响的表:可能有行位于分块中的表。

后续步骤