监控健康状况、资源利用率和作业

作为 BigQuery 管理员,您可以使用运行状况和资源利用率图表来监控组织的健康状况、槽用量和作业性能随时间变化的情况。BigQuery 提供可配置的图表,可帮助您完成以下任务:

准备工作

  • 如需查看运行健康状况,您必须使用可通过管理项目访问的预留。查看资源利用率图表不需要此权限。

所需的角色

如需获得查看运营状况和资源利用率图表中所有数据所需的权限,请让您的管理员为您授予组织的以下 IAM 角色:

如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限

这些预定义角色可提供查看运营状况和资源利用率图表中所有数据所需的权限。如需查看所需的确切权限,请展开所需权限部分:

所需权限

查看运营状况和资源利用率图表中的所有数据需要以下权限:

  • 如需查看组织运行健康状况和资源利用率图表中的所有数据:
    • 针对组织的 bigquery.jobs.listExecutionMetadata or bigquery.jobs.listAll 权限
    • 针对用于创建预留的管理项目的 bigquery.reservationAssignments.list 权限
    • 针对用于创建预留的管理项目的 bigquery.capacityCommitments.list 权限
  • 作为按需付费用户,如需查看组织资源利用率图表中的所有数据,请执行以下操作: 点击组织上的 bigquery.jobs.listExecutionMetadata or bigquery.jobs.listAll
  • 如需查看 BigQuery 表存储的运行健康状况摘要数据: 针对项目的 bigquery.tables.get or bigquery.tables.list 权限
  • 如需查看预留级层的运行健康状况和资源利用率图表:
    • 针对用于创建预留的管理项目的 bigquery.reservations.list 权限
    • 针对用于创建预留的管理项目的 bigquery.reservationAssignments.list 权限
  • 如需在项目级层查看资源利用率图表: 针对项目的 bigquery.jobs.listAll 权限

您也可以使用自定义角色或其他预定义角色来获取这些权限。

监控整个组织的运行健康状况

运行健康状况信息中心会显示您组织及其所有预留位置中的关键指标及其预留。您可以使用此信息中心来监控以下指标:

  • 槽用量
  • Shuffle 使用情况
  • 作业并发
  • 错误
  • 作业时长
  • 处理的字节数
  • 总存储空间

查看运营健康状况图表

如需查看组织的运行健康状况信息,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 BigQuery 监控页面。

    转到“监控”

  2. 选择用于购买槽和创建预留的管理项目。

  3. 监控页面中,前往运行健康状况标签页,查看组织在所有位置和预留方面的关键指标摘要。

  4. 可选:如需查看实时指标(每 5 分钟根据最新数据运行查询),请点击实时数据切换开关。默认情况下,此设置处于关闭状态,数据的最大过时时间约为一小时。

  5. 如需过滤指标,请配置以下字段:

    • 选择位置列表中,选择要监控的区域。
    • 选择预留列表中,选择预留。
    • 选择项目列表中,选择相应项目。
    • 时间范围列表中,选择一个时间范围。
  6. 可选:如需通过资源利用率图表作业浏览器查看有关运营状况的更多详细信息,请点击探索更多

BigQuery 通过查询以下 INFORMATION_SCHEMA 视图来收集指标:

视图

运行健康状况标签页会显示以下摘要视图和详细视图。

摘要视图

摘要视图可让您查看组织子系统的健康状况,包括过去 30 分钟内的预留和区域。

如需查看摘要视图,请执行以下操作:

  • 运行健康状况标签页中,在选择位置列表中,选择所有位置

详细视图

详细视图显示了不同指标在位置或预留级层的详细时间表图。

如需查看详细视图,请执行以下操作:

  • 运行健康状况标签页的选择位置列表中,选择相应区域或版本。

您可以使用以下可选过滤条件优化详细信息视图中显示的数据:

  • 选择预留列表中,选择预留名称。
  • 选择项目列表中,选择相应项目。

图表

BigQuery 提供以下表格和图表选项,可让您详细探索运营健康状况指标。

摘要表

摘要表显示以下指标:

  • 槽用量。平均槽利用率。总槽容量等于基准容量和自动缩放的最大容量。
  • Shuffle 用量。所有预留 Shuffle 总使用率的最大值。
  • 并发数。同时运行的作业数上限。
  • 处理的字节数。已完成的作业处理的总字节数。
  • 作业时长。 作业完成的平均运行时,根据创建作业开始到作业结束计算得出。
  • 总存储空间。上次更新时间的总活跃逻辑字节数。

视图中显示两个摘要表:位置摘要预留摘要。表中每一行代表一个位置或一个预留的使用情况。

这些表会显示上次更新之前的 30 分钟的指标。如果启用了实时数据,查询到的数据会每五分钟刷新一次。如果停用实时数据,则最大数据过时大约为一小时。

如果指标高于预定义的阈值,并且重复作业的性能分析次数增加,则表单元格会进行颜色编码:

  • 如果上次更新之前的 30 分钟内的指标值大于同一天前一周用量的 P99 值,则表单元格标有深蓝色背景。
  • 如果 30 分钟内的指标值处于同一天前一周用量的 P95 - P99 值之间,则表单元格标有浅蓝色背景。

所有阈值都是预定义的,无法自定义。您可以点击 信息 图标 信息来查看阈值。

BigQuery 管理摘要表。

过滤数据

您可以根据以下值过滤图表中的数据:

BigQuery 管理过滤数据。

  • 位置。提供组织在过去 30 天内有活动的区域。摘要视图会显示一个表格,其中汇总了所有活跃区域中的用量。
  • 预留。此字段仅在详细视图中可用。管理项目拥有的所有预留均可以使用。您只能选择一个预留。
  • 项目。此字段仅在详细视图中可用。组织中所有有流量的项目均可使用。您只能选择一个项目。
  • 时间范围。此字段仅在详细视图中可用。它会影响详细视图中的 Metrics 时间表图错误圆环图指标时间表图中的数据规模会根据所选时间范围自动调整。

热门活跃查询图表

此图表显示了按降序排序的前 10 个具有活跃资源的作业。在下拉菜单中,您可以根据槽用量或作业时长选择排序选项。作业 ID 和相关资源用量编号显示在条形图中。在热门活跃查询图表中选择探索更多或作业 ID,以便在作业探索器中查看更多详细信息。如需详细了解执行详情并诊断 BigQuery 作业的性能问题,请参阅获取查询性能分析洞见

错误圆环图

此图表显示了所选时间段内失败的主要原因比例。在摘要视图中,默认值为过去 30 分钟。在详细视图中,时间范围选择器可控制其覆盖率。 您可以按类型、所有者项目或预留对错误进行分组。 失败的作业数显示在圆环图中。

BigQuery 错误圆环图。

指标时间表图

这些图表显示最多 30 天的受支持指标概览。默认时间段为 1 小时。随着所选时间段的变化,图表中每个数据点的精细度会自动扩缩。

这些图表显示某个区域或预留的汇总值。 不支持显示多个区域或多个预留的数据。

BigQuery 指标时间表图。

指标时间表图支持以下指标:

  • 槽用量。所选时间段内的平均槽用量。该页面分别显示所有作业和失败作业的总体槽用量。
  • 作业并发数。在所选时间段内同时运行的作业数上限。这会单独显示正在运行的作业和待处理作业的计数,并显示为堆叠条形图。
  • 扫描的字节数。在选定时间段内已完成作业处理的总字节数。
  • Shuffle。选定时间段内所有预留平均 shuffle 使用率的最大值。
  • 作业时长。 所选时间段内作业的平均运行时间,根据作业创建时间到作业结束时间计算得出。
  • 按类型划分的错误。错误圆环图显示所选时间段内不同失败原因的比例。

除了指标趋势之外,这些图表还显示了前一周同一天用量的 P95 和 P99 指标值的参考线。作业并发图表会显示待处理作业和运行作业总和的阈值。这些引用值用作摘要表中的颜色编码阈值。

如需详细了解图表,请点击探索更多。 系统会将您重定向至资源利用率标签页。

数据分析表

此表汇总了在所选时间段内作业执行期间收集到的配额错误、访问权限被拒错误和性能分析数据。 分析洞见数据会按预留汇总。每行都提供了有关分析洞见类型、位置、预留、分析洞见详情和示例作业 ID 的信息。点击作业 ID,在作业探索器中查看更多作业详情。在摘要视图中,默认观察时间段为过去 30 分钟。在详细视图中,时间范围选择器可控制显示观测数据的特定时间段。

BigQuery 数据分析表。

监控单个项目的运行健康状况

如果您无权访问整个组织,或者您的项目没有任何预留,则默认会显示项目运行健康状况信息中心。此视图可帮助项目分析师监控其项目的系统运行状况,类似于组织级层的运营状况信息中心,但其图表和过滤条件中仅显示项目级数据。

查看 BigQuery 资源利用率

BigQuery 资源图表可帮助您跟踪过去的资源使用情况,以便规划未来的需求并排查性能问题。

资源利用率视图,显示组织或管理项目的指标时间轴以及用于配置图表的窗格

图表通过查询以下 INFORMATION_SCHEMA 视图来收集指标:

数据可以实时更新,最多可回溯 30 天。

查看资源利用率时,您可以配置以下内容:

  • 事件时间轴图表最多显示 30 天内的数据概览。默认值为 6 小时。

  • 主图表会显示一段时间内,为组织或管理项目选择的指标(例如槽用量或处理的字节数)。图表的图例会提供有关所显示数据的更多详细信息。

  • 借助图表配置窗格,您可以选择指标的预定义视图,也可以为视图自定义指标。

资源利用率图表包含以下元素:

  • 在“资源利用率”标签页中,将指针悬停在图表顶部的状态块上,即可显示有关指标的更多信息。
  • 状态条状标签还会显示以下信息:

    • 如果指标仍在加载,则会显示加载图标。
    • 如果指标使用的是过时数据,系统会显示时钟图标。
    • 如果由于不受支持的网页级过滤条件而无法加载指标,则该指标会显示为带删除线。
    • 如果指标加载失败,状态条状标签会突出显示。

查看和配置资源利用率图表

如需查看和配置资源利用率图表,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 BigQuery 监控页面。

    转到“监控”

  2. 选择相应项目。作为监控预留资源使用情况的管理员,请选择用于购买槽和创建预留的管理项目。作为监控作业资源使用情况的数据分析师,请选择相应的项目。

  3. 监控页面中,前往资源利用率标签页,查看按位置细分的资源使用情况摘要。

  4. 为此视图中的指标选择一个时间段,例如1 天。如需查看基于最新数据运行查询的实时指标,请点击实时数据切换开关。此设置默认处于关闭状态,以提高性能,数据最长过时时间约为一小时。

  5. 图表配置窗格中,配置以下字段:

    • 指标视图字段中,选择一个视图。
    • 指标字段中,选择要查看的指标。您可以添加或修改指标。
    • 分组依据字段中,选择数据的分组方式。
    • 过滤条件字段中,选择如何过滤数据。
  6. 如需保存对图表配置所做的更改,请点击应用

指标视图

BigQuery 提供预配置的资源利用率指标视图。以下各部分介绍了您可以在这些视图中配置的指标。

预留槽用量

此视图显示了管理项目中预留的槽使用量细分指标。每个指标都具有以下默认设置,您可以在图表配置窗格中点击指标名称进行修改:

  • 默认使用情况数据来自预留资源。
  • 默认范围是项目。
  • 默认聚合方式是按所选时间段内的平均用量进行聚合。
指标名称 说明
预留 - 槽用量 监控所选时间段内的总槽用量。
预留 - 空闲槽用量 监控所选时间段内槽用量超出预留容量的情况。借助此指标,您可以监控从其他预留和承诺借用的空闲槽,或者用量数据中的舍入不精确情况。即使停用空闲槽共享,后者也可能会导致此指标的值不为零。
空闲槽使用量是一个近似值,根据槽使用量承诺的槽数自动扩缩的槽数计算得出。如果槽用量值超出承诺容量自动扩缩槽,则图表会将剩余的槽归为闲置槽。
预留 - 已使用的基准槽 监控从预留基准使用的槽数。
预留 - 已使用的自动扩缩槽 监控预留自动扩缩槽中使用的槽。
版本使用情况概览

此视图显示了管理项目中版本资源的槽用量和容量相关指标。每个指标都具有以下默认设置,您可以在图表配置窗格中点击指标名称进行修改:

  • 默认使用情况数据来自预留资源,容量数据来自版本资源。
  • 默认范围是项目。
指标名称 说明
预留 - 槽用量 监控所选时间段内的槽用量。默认聚合方式是按所选时间段内的 p99 槽用量进行聚合。
预留 - 空闲槽用量 监控所选时间段内槽用量超出预留容量的情况。借助此指标,您可以监控从其他预留和承诺借用的空闲槽,或者用量数据中的舍入不精确情况。即使停用空闲时段共享,后者也可能会导致此指标具有非零值。
空闲槽使用量是一个近似值,根据槽使用量承诺的槽数自动扩缩的槽数计算得出。如果槽用量值超出承诺容量自动扩缩槽,则图表会将剩余部分归为闲置槽。
默认聚合方式是按所选时间段内的 p99 资源用量进行聚合。
版本 - 基准容量 监控相应管理项目中预留的基准大小。
版本 - 最大容量 监控所选时间段内的可用槽数上限。该指标是承诺容量、基准容量和自动扩缩容量的总和。默认聚合方式是按所选时间段内的最大资源用量进行聚合。
版本 - 已分配容量 监控所选时间段内分配给您的版本资源的实际槽数。默认聚合方式是按所选时间段内的最大资源用量进行聚合。
当前项目概览

此视图会显示您运行查询的项目中作业资源的相关指标。每个指标都有以下默认设置,您可以在图表配置窗格中点击指标名称来修改这些设置:

  • 默认资源是作业资源。
  • 默认范围是项目。
指标名称 说明
作业 - 项目 - 槽用量 监控所选时间段内的槽用量。默认的聚合方式是按所选时间段内的最大资源用量进行聚合。
作业 - 项目 - 处理的字节数 监控选定时间段内已完成作业处理的总字节数。默认聚合方式是按所选时间段内处理的字节数总和进行聚合。
作业 - 项目 - 作业并发数 监控所选时间段内同时运行的作业数。默认聚合方式是按所选时间段内的最大资源用量进行聚合。
作业 - 项目 - 作业时长 监控所选时间段内已完成作业的运行时长。运行时长是指从作业创建到作业完成之间的时间。默认的聚合方式是按所选时间段内的平均运行时。
拥有的预留概览

此视图显示了管理项目中包含预留资源的作业活动的指标。每个指标都有以下默认设置,您可以在图表配置窗格中点击指标名称进行修改:

  • 默认资源是预留资源。
  • 默认范围是项目。
指标名称 说明
预留 - 槽用量 监控所选时间段内的槽用量。默认的聚合方式是按所选时间段内的最大资源用量进行聚合。
预留 - 处理的字节数 监控选定时间段内已完成作业处理的总字节数。默认聚合方式是按所选时间段内处理的字节数总和进行聚合。
预留 - 作业并发数 监控所选时间段内同时运行的作业数。默认聚合方式是按所选时间段内的最大资源用量进行聚合。
预留 - 作业时长 监控所选时间段内已完成作业的运行时长。 运行时长是指从作业创建到作业完成之间的时间。它包括排队和重试。默认聚合方式是按所选时间段内的平均运行时。
预留 - Shuffle 用量 监控所选时间段内的 Shuffle 用量比率。默认聚合方式是按所选时间段内的平均用量进行聚合。
自定义视图

如需创建自定义指标视图,您可以从头开始添加指标,也可以先使用预定义的指标视图(例如预留概览指标视图),然后自定义其中的指标。

您可以保存自定义视图以供日后使用。保存的视图会保留指标、分组依据和过滤条件配置,但用户邮箱过滤条件除外。保存的视图存储在用户级。您可以创建、更新、重命名和删除已保存的视图。

指标

配置图表时,您可以添加、修改或删除图表所监控的资源利用率指标。

如需配置资源利用率图表指标,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,查看 BigQuery 资源利用率图表

  2. 图表配置窗格中,配置指标字段:

    1. 依次点击添加项> 选择指标
    2. 选择指标对话框中,选择以下内容:

      1. 要监控的资源类型:作业预留版本
      2. 要监控的范围。例如,如需监控当前项目中的作业指标,请选择项目范围。
      3. 选择要监控的指标。例如,如需监控作业槽使用情况,请选择槽使用情况
    3. 点击应用

    4. 新建内容对话框中,选择聚合。例如,如需监控所选时间段内超出预留容量的槽用量上限,请选择上限

    5. 点击完成以保存指标。

  3. 可选:如需更改现有指标,请点击相应指标名称,然后修改其设置或将其删除。

指标支持的资源类型和范围

资源利用率指标按资源类型和范围进行分类。

资源类型

您可以监控以下资源类型:

资源 说明
作业 有关给定范围和时间段内 BigQuery 作业详情的指标。
预订 有关指定范围和时间段内 BigQuery 预留使用情况的指标。这些指标按预留汇总作业详细信息。 如果您仅拥有预留级的部分数据访问权限,则可以查看汇总的预留使用情况指标,但无法访问作业级详细信息。
版本 有关指定范围和时间段内 BigQuery 版本容量的指标。

范围类型

为指标选择资源后,您需要选择范围。

  • 预留和版本资源默认采用项目级范围。
  • 作业资源可以设置为项目级、文件夹级或组织级范围。更广泛的范围需要额外的权限。

分组依据

如需在资源利用率图表中对数据进行分组,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,查看 BigQuery 资源利用率图表

  2. 图表配置窗格中,通过选择以下选项之一来配置分组依据字段:

    • :此选项可让您大致了解整个组织在一段时间内的所选指标。
    • 项目:此选项可按项目对所选指标进行分组。如果项目超过 50 个,则仅显示槽用量最高的前 50 个项目。
    • 所有其他分组依据选项:这些选项与项目视图类似,数据按相应的维度进行分组。如果分组依据选项不受所有所选指标的支持,则无法选择该选项。

配置资源利用率图表时,您可以对数据应用过滤条件,例如显示企业版资源的资源使用情况,或按资源 ID 显示资源使用情况。

如需过滤图表数据,请在过滤条件窗格中应用过滤条件。只有当所选指标支持某个过滤条件时,您才能选择该过滤条件。如需查看所需权限,请点击过滤条件菜单。

查看项目级资源利用率数据

您可以按照与查看组织级数据相同的配置步骤来分析项目级资源利用率。图表仅显示项目级数据和配置选项(组织级选项会灰显)。此项目级范围会显示上下文项目中的整体资源利用率,无论其采用的是哪种结算模式。

资源利用率图表限制

  • 页面中间的图表和表格会显示与所选时间段和粒度相关的指标。
  • 具有相同单位的指标共用同一比例。该图表最多支持两种不同的比例。

切换到旧版界面

默认情况下,从预留管理项目导航时,您可以访问版本资源图表。 您可以在预留管理项目(预览版)中的按需资源图表和版本资源图表之间进行切换。

如需查看资源图表,请按以下步骤操作:

  1. 转到 BigQuery 页面。
    前往 BigQuery
  2. 在项目菜单中,选择用于购买槽和创建预留的管理项目。
  3. 在导航菜单中,点击 Monitoring
  4. 图表选项 > 范围部分中,您可以从列表中选择结算模式,其中包括三种类型的版本和按需版本。默认情况下,结算模式设置为企业版。
  5. 图表选项 > 图表配置部分中,执行以下操作:
    1. 图表列表中选择图表类型。如需了解不同的图表选项,请参阅图表选项
    2. 指标列表中,选择可用的指标类型。
    3. 分组依据列表中,选择您要对图表中的数据进行分组依据的维度。如需了解不同的维度,请参阅分组选项
    4. 过滤条件列表中,选择可用的过滤条件选项。如需了解不同的过滤条件,请参阅过滤条件和搜索
    5. 设置要在图表中查看数据的时间范围。

图表配置

您可以通过更改以下图表配置选项来调整资源图表的视图。

图表选项

BigQuery 提供以下指标类型以显示在图表中:

  • 槽用量。平均槽用量。如果分组依据选项设为总体,或者过滤条件或单个预订,则系统还会显示容量和借用槽位使用情况指标。
    • 总用量:所选时间段内的平均槽用量。
    • 借用的槽用量。平均用量超出预留的容量。这通常是因为从其他预留和承诺借用空闲槽,或者是用量数据舍入不精确。即使停用了闲置槽共享,资源利用率图表中也会显示额外的闲置槽。空闲槽使用量是一个近似值,根据槽使用量承诺的槽数自动扩缩的槽数计算得出。 如果槽用量值超过承诺容量,则图表会将这些槽归为闲置槽。
    • 承诺容量。版本承诺大小。
    • 基准容量。预留的基准大小。
    • 自动扩缩容量。自动扩缩的槽大小。
    • 最大容量。用户可访问的最大槽位数。
  • 作业并发。在所选时间段内同时运行的作业数上限。
  • 作业性能:已完成作业的平均作业运行时间,从作业创建时间到作业结束时间计算得出。
  • 失败的作业:所选时间段内失败作业的平均槽用量。
  • 处理的字节数。在选定时间段内已完成作业处理的总字节数。
  • Shuffle 用量:所选时间段内的平均 Shuffle 用量比率(预览版)。
表组件

表格中会显示与您在资源图表中选择的时间段和维度相关的指标。

槽用量图表显示在所选时间段内运行的所有作业的平均槽用量。在所选时间段内未完成的作业仅包含该时间段内使用的槽。

对于作业性能图表,表组件会显示以下指标:

  • 作业数:在所选时间段内已完成作业运行或部分运行的数量。
  • 平均作业时长。在所选时间段内至少部分运行的已完成作业的平均作业时长。
  • 中间值作业时长:在所选时间段内至少部分运行的已完成作业的中间值作业时长。
  • 最短作业时长:在所选时间段内至少部分运行的已完成作业的最短作业时长。此列在默认情况下处于隐藏状态,但您可以在列显示选项中启用此列。
  • 最长作业时长:在所选时间段内至少部分运行的已完成作业的最长作业时长。此列在默认情况下处于隐藏状态,但您可以在列显示选项中启用此列。

对于失败的作业数图表,表组件会显示以下数据:

  • 平均槽用量:与槽用量图表相同,但仅适用于失败的作业。
  • 失败的作业总数:在所选时段内失败的作业数量。
按选项分组

根据图表类型,您可以按多个维度对图表视图中的数据进行分组:

  • 整体视图:整体视图简要展示了整个组织在一段时间内的所选指标。对于槽使用情况,容量和用量显示在同一个图表上,方便您了解一段时间内槽总体利用率。
  • 项目。项目视图显示所选指标按项目分组的情况。如果组织的项目超过 10 个,则仅显示所选时间段内槽用量、作业并发性、作业持续时间或作业失败率最高的前 10 个项目。对于槽用量,所有其他项目都会被归入图表底部的其他类别,以方便与总体容量进行比较。
  • 所有其他分组依据视图与项目视图类似,数据按相应的维度进行分组。
时间范围选项

您可以通过以下方式修改时间段:

  • 选择时间段并将其拖动到事件时间轴图表中。
  • 选择时间段并将其拖动到主图表中。

校准时间段会随着所选时间范围的变化而自动更新。校准时间段越小,视图就越详细。如需更好地查看频繁更改的资源(例如槽用量选项),请缩短校准时间段。

过滤和搜索

要缩小图表数据的范围,请在过滤器面板中应用过滤器。 某些过滤条件仅适用于特定图表。预留文件夹项目用户过滤条件填充了在所选时间范围内消耗槽的相应资源。例如,如果某个项目在过去 30 天内未被使用过,则该项目不会显示在项目过滤条件列表中。

在应用过滤条件后,图表便会刷新,以显示所选参数中的数据。

排查槽争用问题

如果槽不足以运行您的所有作业,就会发生槽争用,从而导致性能问题。如需排查槽争用问题,请参阅以下步骤和最佳实践。

如果您已尝试这些最佳实践,但仍遇到作业性能问题,可以请求支持

作业并发数激增

使用详细信息视图检查是否存在同时存在槽位使用量激增的情况,以便检查作业运行是否突然激增。这可能表示有太多作业在争夺受预留限制的槽位。

  • 最佳实践:考虑优化资源密集型查询或预订的槽位容量。如需详细了解如何优化查询性能,请参阅优化查询计算

槽用量高

使用详细信息视图检查作业时长是否增加,尤其是当有作业超出预留的最大容量时。槽使用率一直很高可能表示槽争用正在进行中。

  • 最佳实践:使用作业探索器器的槽争用过滤器检查查询,以找出消耗槽最多的查询并对其进行优化。

作业时长过长

如果作业需要更长时间才能完成,请查看详细信息。作业并发数和槽用量高峰可能表明存在槽争用。

  • 最佳实践:通过暂时暂停不太重要的作业或降低整体作业提交速率,隔离关键作业。

槽争用消息

分析洞见表可以显示 There were NUMBER jobs detected with slot_contention in the reservation. 等消息,以指明槽争用问题。请查看作业探索器,了解这些消息中标记的特定作业的详细信息。

  • 最佳做法:优化已确定的查询,或调整预订的槽位分配。

后续步骤