JOBS 视图

INFORMATION_SCHEMA.JOBS 视图包含当前项目中所有 BigQuery 作业的近乎实时元数据。

所需角色

如需获得查询 INFORMATION_SCHEMA.JOBS 视图所需的权限，请让您的管理员为您授予项目的 BigQuery Resource Viewer (roles/bigquery.resourceViewer) IAM 角色。如需详细了解如何授予角色，请参阅管理对项目、文件夹和组织的访问权限。

此预定义角色可提供 bigquery.jobs.listAll 权限，查询 INFORMATION_SCHEMA.JOBS 视图需要该权限。

您也可以使用自定义角色或其他预定义角色来获取此权限。

如需详细了解 BigQuery 权限，请参阅使用 IAM 进行访问权限控制。

架构

底层数据按 creation_time 列进行分区，并按 project_id 和 user_email 进行聚簇。query_info 列包含有关查询作业的详细信息。

INFORMATION_SCHEMA.JOBS 视图具有如下架构：

列名	数据类型	值
`bi_engine_statistics`	`RECORD`	如果项目配置为使用 BI Engine，则此字段包含 BiEngineStatistics。否则为 `NULL`。
`cache_hit`	`BOOLEAN`	查询此作业的查询结果是否来自缓存。如果您有多查询语句作业，则父查询的 `cache_hit` 为 `NULL`。
`creation_time`	`TIMESTAMP`	（分区列）此作业的创建时间。分区基于相应时间戳的世界协调时间 (UTC)。
`destination_table`	`RECORD`	结果的目标表（如果有）。
`end_time`	`TIMESTAMP`	此作业的结束时间（从纪元开始计算，以毫秒为单位）。此字段表示作业进入 `DONE` 状态的时间。
`error_result`	`RECORD`	作为 ErrorProto 对象的任何错误的详细信息。
`job_creation_reason.code`	`STRING`	指定创建作业的大致原因。可能的值包括： `REQUESTED`：已请求创建作业。 `LONG_RUNNING`：查询请求运行超出 `QueryRequest` 中的 timeoutMs 字段指定的系统定义超时时间。因此，查询被视为为其创建作业的长时间运行的操作。 `LARGE_RESULTS`：查询结果无法放入内嵌响应。 `OTHER`：系统已确定查询需要作为作业执行。
`job_id`	`STRING`	作业的 ID（如果已创建作业）。否则，该值是使用可选作业创建模式的查询的 ID。例如 `bquxjob_1234`。
`job_stages`	`RECORD`	作业的查询阶段。注意：对于从具有行级访问权限政策的表中读取的查询，此列的值为空。如需了解详情，请参阅 BigQuery 中行级安全性的最佳实践。
`job_type`	`STRING`	作业的类型。可以是 `QUERY`、`LOAD`、`EXTRACT`、`COPY` 或 `NULL`。`NULL` 值表示后台作业。
`labels`	`RECORD`	作为键值对应用于作业的标签数组。
`parent_job_id`	`STRING`	父级作业的 ID（如有）。
`priority`	`STRING`	此作业的优先级。有效值包括 `INTERACTIVE` 和 `BATCH`。
`project_id`	`STRING`	（聚簇列）项目的 ID。
`project_number`	`INTEGER`	项目编号。
`query`	`STRING`	SQL 查询文本。只有 `JOBS_BY_PROJECT` 视图具有查询列。
`referenced_tables`	`RECORD`	作业引用的表数组。仅针对非缓存命中的查询作业进行填充。
`reservation_id`	`STRING`	分配给此作业的主要预留的名称，格式为 `RESERVATION_ADMIN_PROJECT:RESERVATION_LOCATION.RESERVATION_NAME`。在此输出中： `RESERVATION_ADMIN_PROJECT`：管理预留的 Google Cloud 项目的名称 `RESERVATION_LOCATION`：预留的位置 `RESERVATION_NAME`：预留的名称
`edition`	`STRING`	与分配给此作业的预留关联的版本。如需详细了解版本，请参阅 BigQuery 版本简介。
`session_info`	`RECORD`	此作业在其中运行的会话的详细信息（如果有）。
`start_time`	`TIMESTAMP`	此作业的开始时间（从纪元开始计算，以毫秒为单位）。此字段表示作业从 `PENDING` 状态转换为 `RUNNING` 或 `DONE` 的时间。
`state`	`STRING`	作业的运行状态。有效状态包括 `PENDING`、`RUNNING` 和 `DONE`。
`statement_type`	`STRING`	查询语句的类型。例如 `DELETE`、`INSERT`、`SCRIPT`、`SELECT` 或 `UPDATE`。如需查看有效值的列表，请参阅 QueryStatementType。
`timeline`	`RECORD`	作业的查询时间轴。包含查询执行情况的快照。
`total_bytes_billed`	`INTEGER`	如果项目配置为使用按需价格，则此字段包含作业的总计费字节数。如果项目配置为使用固定价格，则您无需为字节付费，并且此字段仅供参考。注意：对于从具有行级访问权限政策的表中读取的查询，此列的值为空。如需了解详情，请参阅 BigQuery 中行级安全性的最佳实践。
`total_bytes_processed`	`INTEGER`	作业处理的字节总数。注意：对于从具有行级访问权限政策的表中读取的查询，此列的值为空。如需了解详情，请参阅 BigQuery 中行级安全性的最佳实践。
`total_modified_partitions`	`INTEGER`	作业修改的分区总数。系统会针对 `LOAD` 和 `QUERY` 作业填充此字段。
`total_slot_ms`	`INTEGER`	作业在其整个时间段内处于 `RUNNING` 状态（包括重试）的槽毫秒数。
`transaction_id`	`STRING`	此作业在其中运行的事务的 ID（如果有）。（预览版）
`user_email`	`STRING`	（聚簇列）运行作业的用户的电子邮件地址或服务账号。
`query_info.resource_warning`	`STRING`	查询处理期间的资源用量超出系统内部阈值时出现的警告消息。成功的查询作业会填充 `resource_warning` 字段。借助 `resource_warning`，您可以获得更多数据点来优化查询，并使用 `query_hashes` 对等效的一组查询的性能趋势设置监控。
`query_info.query_hashes.normalized_literals`	`STRING`	包含查询的哈希值。`normalized_literals` 是一个十六进制 `STRING` 哈希值，忽略注释、参数值、UDF 和字面量。如果底层视图发生更改，或者查询隐式引用列（例如 `SELECT *`）且表架构发生更改，则哈希值会不同。系统会对非缓存命中的成功 GoogleSQL 查询显示此字段。
`query_info.performance_insights`	`RECORD`	作业的性能数据分析。
`query_info.optimization_details`	`STRUCT`	作业的基于历史记录的优化。
`transferred_bytes`	`INTEGER`	跨云查询（例如 BigQuery Omni 跨云转移作业）转移的总字节数。
`materialized_view_statistics`	`RECORD`	查询作业中考虑的具体化视图的统计信息。（预览版）
`metadata_cache_statistics`	`RECORD`	查询作业中引用的表的元数据列索引使用情况统计信息。
`search_statistics`	`RECORD`	搜索查询的统计信息。
`query_dialect`	`STRING`	此字段将于 2025 年 5 月某个时间提供。用于作业的查询方言。有效值包括： `GOOGLE_SQL`：请求作业使用 GoogleSQL。 `LEGACY_SQL`：请求作业使用 LegacySQL。 `DEFAULT_LEGACY_SQL`：作业请求中未指定查询方言。BigQuery 使用了 LegacySQL 的默认值。 `DEFAULT_GOOGLE_SQL`：作业请求中未指定查询方言。BigQuery 使用了 GoogleSQL 的默认值。此字段仅针对查询作业进行填充。查询方言的默认选择可以通过配置设置进行控制。
`continuous`	`BOOLEAN`	作业是否为持续查询。
`continuous_query_info.output_watermark`	`TIMESTAMP`	表示持续查询已成功处理数据的进度。
`vector_search_statistics`	`RECORD`	向量搜索查询的统计信息。

当您查询 INFORMATION_SCHEMA.JOBS 以查找查询作业的汇总费用时，请排除 SCRIPT 语句类型，否则某些值会被重复计算。SCRIPT 行包含在此作业中执行的所有子作业的汇总值。

多语句查询作业

多语句查询作业是指使用过程语言的查询作业。多语句查询作业通常使用 DECLARE 定义变量，或者包含控制流语句（例如 IF 或 WHILE）。查询 INFORMATION_SCHEMA.JOBS 时，您可能需要了解多语句查询作业与其他作业之间的区别。多语句查询作业具有以下特征：

statement_type = SCRIPT
reservation_id = NULL

子作业

多语句查询作业的每个子作业都有一个指向多语句查询作业本身的 parent_job_id。其中包含在此作业中执行的所有子作业的汇总值。

如果您查询 INFORMATION_SCHEMA.JOBS 以查找查询作业的汇总费用，则应排除 SCRIPT 语句类型。否则某些值（例如 total_slot_ms）可能会被计入两次。

数据保留

此视图包含当前正在运行的作业和过去 180 天的作业历史记录。

范围和语法

针对此视图的查询必须包含区域限定符。下表说明了此视图的区域范围：

视图名称	资源范围	区域范围
[PROJECT_ID.]`region-REGION`.INFORMATION_SCHEMA.JOBS[_BY_PROJECT]	项目级	`REGION`

请替换以下内容：

可选：PROJECT_ID：您的 Google Cloud 项目的 ID。如果未指定，则使用默认项目。
REGION：任何数据集区域名称。例如 `region-us`。

注意：您必须使用区域限定符来查询 INFORMATION_SCHEMA 视图。查询执行的位置必须与 INFORMATION_SCHEMA 视图的区域相匹配。

示例

如需对非默认项目运行查询，请按以下格式添加项目 ID：

`PROJECT_ID`.`region-REGION_NAME`.INFORMATION_SCHEMA.JOBS

替换以下内容：

PROJECT_ID：项目的 ID。
REGION_NAME：项目的区域。

例如 `myproject`.`region-us-central1`.INFORMATION_SCHEMA.JOBS。

将按需作业用量与结算数据进行比较

对于使用按需价格的项目，您可以使用 INFORMATION_SCHEMA.JOBS 视图查看给定时间段内的计算费用。

对于使用基于容量（槽）的价格的项目，您可以使用 INFORMATION_SCHEMA.RESERVATIONS_TIMELINE 查看给定时间段内的计算费用。

以下查询会生成您的结算 TiB 和所产生费用的每日估算汇总。限制部分说明了这些估算值何时可能与您的账单不符。

仅针对此示例，必须设置以下其他变量。可以在此处进行修改，以方便使用。

START_DATE：汇总计算所涵盖的最早日期（包括该日期）。
END_DATE：汇总计算所涵盖的最晚日期（包括该日期）。
PRICE_PER_TIB：用于账单估算的每 TiB 按需价格。

CREATE TEMP FUNCTION isBillable(error_result ANY TYPE)
AS (
  -- You aren't charged for queries that return an error.
  error_result IS NULL
  -- However, canceling a running query might incur charges.
  OR error_result.reason = 'stopped'
);

-- BigQuery hides the number of bytes billed on all queries against tables with
-- row-level security.
CREATE TEMP FUNCTION isMaybeUsingRowLevelSecurity(
  job_type STRING, tib_billed FLOAT64, error_result ANY TYPE)
AS (
  job_type = 'QUERY'
  AND tib_billed IS NULL
  AND isBillable(error_result)
);

WITH
  query_params AS (
    SELECT
      date 'START_DATE' AS start_date,  -- inclusive
      date 'END_DATE' AS end_date,  -- inclusive
  ),
  usage_with_multiplier AS (
    SELECT
      job_type,
      error_result,
      creation_time,
      -- Jobs are billed by end_time in PST8PDT timezone, regardless of where
      -- the job ran.
      EXTRACT(date FROM end_time AT TIME ZONE 'PST8PDT') billing_date,
      total_bytes_billed / 1024 / 1024 / 1024 / 1024 total_tib_billed,
      CASE statement_type
        WHEN 'SCRIPT' THEN 0
        WHEN 'CREATE_MODEL' THEN 50 * PRICE_PER_TIB
        ELSE PRICE_PER_TIB
        END AS multiplier,
    FROM `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
  )
SELECT
  billing_date,
  sum(total_tib_billed * multiplier) estimated_charge,
  sum(total_tib_billed) estimated_usage_in_tib,
  countif(isMaybeUsingRowLevelSecurity(job_type, total_tib_billed, error_result))
    AS jobs_using_row_level_security,
FROM usage_with_multiplier, query_params
WHERE
  1 = 1
  -- Filter by creation_time for partition pruning.
  AND date(creation_time) BETWEEN date_sub(start_date, INTERVAL 2 day) AND end_date
  AND billing_date BETWEEN start_date AND end_date
  AND isBillable(error_result)
GROUP BY billing_date
ORDER BY billing_date;

限制

对于针对具有行级安全性的表进行的查询，BigQuery 会隐藏一些统计信息。提供的查询将受影响的作业数计为 jobs_using_row_level_security，但无权访问计费用量。
BigQuery ML 的按需查询价格取决于所创建模型的类型。INFORMATION_SCHEMA.JOBS 不会跟踪创建的模型类型，因此所提供的查询假定所有 CREATE_MODEL 语句都是创建结算费用较高的模型类型。
Apache Spark 过程使用相似价格模式，但费用会报告为BigQuery 企业版随用随付 SKU。INFORMATION_SCHEMA.JOBS 会将此用量作为 total_bytes_billed 进行跟踪，但无法确定相应用量代表哪个 SKU。

计算平均槽利用率

以下示例会计算指定项目在过去 7 天内所有查询的平均槽利用率。请注意，此计算对于在一周内槽使用量一致的项目最为准确。如果项目的槽使用量不一致，则此数字可能会低于预期。

要运行查询，请执行以下操作：

SELECT
  SUM(total_slot_ms) / (1000 * 60 * 60 * 24 * 7) AS avg_slots
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE
  -- Filter by the partition column first to limit the amount of data scanned.
  -- Eight days allows for jobs created before the 7 day end_time filter.
  creation_time BETWEEN TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 8 DAY) AND CURRENT_TIMESTAMP()
  AND job_type = 'QUERY'
  AND statement_type != 'SCRIPT'
  AND end_time BETWEEN TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 7 DAY) AND CURRENT_TIMESTAMP();

结果类似于以下内容：

+------------+
| avg_slots  |
+------------+
| 3879.1534  |
+------------+

您可以使用 WHERE reservation_id = "…" 检查特定预留的使用率。这可能有助于确定预留在一段时间内的使用百分比。对于脚本作业，父级作业还会报告其子作业的总体槽使用量。为了避免重复计算，请使用 WHERE statement_type != "SCRIPT" 排除父作业。

如果您希望查看各个作业的平均槽利用率，请使用 total_slot_ms / TIMESTAMP_DIFF(end_time, start_time, MILLISECOND)。

按查询优先级统计近期活跃查询数

以下示例显示了过去 7 小时内启动的查询数量，按优先级（交互式或批量）分组：

SELECT
  priority,
  COUNT(*) active_jobs
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE
  creation_time > TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 7 hour)
  AND job_type = 'QUERY'
GROUP BY priority;

结果类似于以下内容：

+-------------+-------------+
| priority    | active_jobs |
+-------------+-------------+
| INTERACTIVE |           2 |
| BATCH       |           3 |
+-------------+-------------+

priority 字段指明查询是 INTERACTIVE 还是 BATCH。

查看加载作业历史记录

以下示例会列出针对指定项目提交批量加载作业的所有用户或服务账号。由于未指定时间边界，因此该查询会扫描所有可用历史记录。

SELECT
  user_email AS user,
  COUNT(*) num_jobs
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE
  job_type = 'LOAD'
GROUP BY
  user_email;

结果类似于以下内容：

+--------------+
| user         |
+--------------+
| abc@xyz.com  |
| xyz@xyz.com  |
| bob@xyz.com  |
+--------------+

获取加载作业数量以确定每天使用的作业配额

以下示例按天、数据集和表返回作业数，以便确定使用的每日作业配额量。

SELECT
    DATE(creation_time) as day,
    destination_table.project_id as project_id,
    destination_table.dataset_id as dataset_id,
    destination_table.table_id as table_id,
    COUNT(job_id) AS load_job_count
 FROM
   `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
 WHERE
    creation_time BETWEEN TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 8 DAY) AND CURRENT_TIMESTAMP()
    AND job_type = "LOAD"
GROUP BY
    day,
    project_id,
    dataset_id,
    table_id
ORDER BY
    day DESC;

注意：“INFORMATION_SCHEMA”视图名称区分大小写。结果类似于以下内容：

+-------------+------------+-------------+----------+-----------------+
|day          | project_id | dataset_id  | table_id | load_job_count  |
+-------------+------------+-------------+----------+-----------------+
| 2020-10-10  | my_project | dataset1    | orders   | 58              |
| 2020-10-10  | my_project | dataset1    | product  | 20              |
| 2020-10-10  | my_project | dataset1    | sales    | 11              |
+-------------+------------+-------------+----------+-----------------+

获取最近几个失败的作业

以下示例展示了最近 3 个失败的作业：

SELECT
   job_id,
  creation_time,
  user_email,
   error_result
 FROM `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS_BY_PROJECT
WHERE
  error_result.reason != "Null"
ORDER BY
  creation_time DESC
LIMIT 3;

结果应如下所示：

+------------+--------------------------+------------------+-------------------------------------+
| job_id     | creation_time            | user_email       | error_result                        |
+------------+--------------------------+------------------+-------------------------------------+
| bquxjob_1  | 2020-10-10 00:00:00 UTC  | abc@example.com  | Column 'col1' has mismatched type...|
| bquxjob_2  | 2020-10-11 00:00:00 UTC  | xyz@example.com  | Column 'col1' has mismatched type...|
| bquxjob_3  | 2020-10-11 00:00:00 UTC  | bob@example.com  | Column 'col1' has mismatched type...|
+------------+--------------------------+------------------+-------------------------------------+

查询长时间运行的作业列表

以下示例展示了运行时间超过 30 分钟且处于 RUNNING 或 PENDING 状态的长时间运行作业的列表：

SELECT
  job_id,
  job_type,
  state,
  creation_time,
  start_time,
  user_email
 FROM `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
 WHERE
  state!="DONE" AND
  creation_time <= TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 30 MINUTE)
ORDER BY
  creation_time ASC;

结果类似于以下内容：

+-----------+----------+---------+--------------------------------+--------------------------------+------------------+
| job_id    | job_type | state   | creation_time                  | start_time                     | user_email       |
+-----------+----------+---------+--------------------------------+--------------------------------+------------------+
| bquxjob_1 | QUERY    | RUNNING | 2023-05-03 05:07:22.818000 UTC | 2023-05-03 05:07:22.905000 UTC | abc@example.com  |
| bquxjob_2 | QUERY    | PENDING | 2023-05-01 02:05:47.925000 UTC | 2023-05-01 02:05:47.998000 UTC | xyz@example.com  |
| bquxjob_3 | QUERY    | PENDING | 2023-05-01 02:05:47.925000 UTC | 2023-05-01 02:05:47.998000 UTC | abc@example.com  |
+-----------+----------+---------+--------------------------------+--------------------------------+------------------+

使用可选作业创建模式的查询

以下示例展示了在可选作业创建模式下执行且 BigQuery 没有为其创建作业的查询列表。

SELECT
 job_id,
FROM
 `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE
 TIMESTAMP_TRUNC(creation_time, DAY) = '2024-06-12'
 AND job_creation_reason.code IS NULL
LIMIT 3;

结果应如下所示：

+-----------+
| job_id    |                                          |
+-----------+
| bquxjob_1 |
| bquxjob_2 |
| bquxjob_3 |
+-----------+

以下示例展示了在可选作业创建模式下执行且 BigQuery 没有为其创建作业的查询的相关信息。

SELECT
 job_id,
 statement_type,
 priority,
 cache_hit,
 job_creation_reason.code AS job_creation_reason_code,
 total_bytes_billed,
 total_bytes_processed,
 total_slot_ms,
 state,
 error_result.message AS error_result_message,
FROM
 `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE
 TIMESTAMP_TRUNC(creation_time, DAY) = '2024-06-12'
 AND job_id = '2Lm09bHxDEsoVK8zwzWJomLHU_Ud%1910479b151' -- queryId

注意：如果没有为此查询创建作业，job_id 字段会包含该查询的 queryId。

结果应如下所示：

+-----------+----------------+-------------+-----------+--------------------------+--------------------+---------------------+---------------+-------+----------------------+
| job_id    | statement_type | priority    | cache_hit | job_creation_reason_code | total_bytes_billed | total_bytes_processed | total_slot_ms | state | error_result_message |
+-----------+----------------+-------------+-----------+--------------------------+--------------------+---------------------+---------------+-------+----------------------+
| bquxjob_1 | SELECT         | INTERACTIVE | false     | null                     | 161480704          | 161164718             | 3106          | DONE  | null                 |
+-----------+----------------+-------------+-----------+--------------------------+--------------------+---------------------+---------------+-------+----------------------+

以下示例展示了在可选作业创建模式下执行且 BigQuery 为其创建了作业的查询列表。

SELECT
 job_id,
 job_creation_reason.code AS job_creation_reason_code
FROM
 `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE
 TIMESTAMP_TRUNC(creation_time, DAY) = '2024-06-12'
 AND job_creation_reason.code IS NOT NULL
 AND job_creation_reason.code != 'REQUESTED'
LIMIT 3

结果应如下所示：

+-----------+--------------------------+
| job_id    | job_creation_reason_code |
+-----------+--------------------------+
| bquxjob_1 | LARGE_RESULTS            |
| bquxjob_2 | LARGE_RESULTS            |
| bquxjob_3 | LARGE_RESULTS            |
+-----------+--------------------------+

每个用户身份处理的字节数

以下示例展示了每个用户的查询作业结算的总字节数：

SELECT
  user_email,
  SUM(total_bytes_billed) AS bytes_billed
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE
  job_type = 'QUERY'
  AND statement_type != 'SCRIPT'
GROUP BY
  user_email;

注意：请参阅 JOBS 视图的架构文档中的 total_bytes_billed 列的注意事项。

结果应如下所示：

+---------------------+--------------+
| user_email          | bytes_billed |
+---------------------+--------------+
| bob@example.com     | 2847932416   |
| alice@example.com   | 1184890880   |
| charles@example.com | 10485760     |
+---------------------+--------------+

已处理的字节数的每小时明细

以下示例显示了查询作业按小时间隔计费的总字节数：

SELECT
  TIMESTAMP_TRUNC(end_time, HOUR) AS time_window,
  SUM(total_bytes_billed) AS bytes_billed
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE
  job_type = 'QUERY'
  AND statement_type != 'SCRIPT'
GROUP BY
  time_window
ORDER BY
  time_window DESC;

结果类似于以下内容：

+-------------------------+--------------+
| time_window             | bytes_billed |
+-------------------------+--------------+
| 2022-05-17 20:00:00 UTC | 1967128576   |
| 2022-05-10 21:00:00 UTC | 0            |
| 2022-04-15 17:00:00 UTC | 41943040     |
+-------------------------+--------------+

每个表的查询作业

以下示例显示了 my_project 中查询的每个表被查询作业引用的次数：

SELECT
  t.project_id,
  t.dataset_id,
  t.table_id,
  COUNT(*) AS num_references
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS, UNNEST(referenced_tables) AS t
GROUP BY
  t.project_id,
  t.dataset_id,
  t.table_id
ORDER BY
  num_references DESC;

结果类似于以下内容：

+------------+------------+----------+----------------+
| project_id | dataset_id | table_id | num_references |
+------------+------------+----------+----------------+
| my_project | dataset1   | orders   | 58             |
| my_project | dataset1   | products | 40             |
| other_proj | dataset1   | accounts | 12             |
+------------+------------+----------+----------------+

每个项目的旧版 SQL 查询作业数

INFORMATION_SCHEMA 中的“query_dialect”字段将于 2025 年 5 月某个时间提供。以下示例显示了项目执行的旧版 SQL 查询作业数量。

SELECT
  project_id,
  -- Implicitly defaulted to LegacySQL since the query dialect was not specified
  -- in the request.
  COUNTIF(query_dialect = 'DEFAULT_LEGACY_SQL') AS default_legacysql_query_jobs,
  -- Explicitly requested LegacySQL.
  COUNTIF(query_dialect = 'LEGACY_SQL') AS legacysql_query_jobs,
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE
  query_dialect = 'DEFAULT_LEGACY_SQL'
  OR query_dialect = 'LEGACY_SQL'
GROUP BY
  project_id
ORDER BY
  default_legacysql_query_jobs DESC,
  legacysql_query_jobs DESC;

每个表由查询和加载作业修改的分区数

以下示例展示了每个表中使用 DML 语句和加载作业的查询修改的分区数。请注意，此查询不会显示复制作业的 total_modified_partitions。

SELECT
  destination_table.table_id,
  SUM(total_modified_partitions) AS total_modified_partitions
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE
  DATE(creation_time, "America/Los_Angeles") = CURRENT_DATE()
GROUP BY
  table_id
ORDER BY
  total_modified_partitions DESC

作业每毫秒使用的平均槽数

以下示例展示了如何计算作业在执行期间使用的平均槽数。在排查查询速度慢的问题以及将查询的执行速度慢与执行速度快的查询进行比较时，这可能会有所帮助。将此值与总预留大小和项目或预留中执行的并发作业的平均数量进行比较，有助于您了解在执行期间是否有多个查询同时争夺槽位。

槽位平均数量越高，分配给作业的资源就越多，这通常会导致执行速度更快。

SELECT ROUND(SAFE_DIVIDE(total_slot_ms,TIMESTAMP_DIFF(end_time, start_time, MILLISECOND)), 1) as avg_slots_per_ms
FROM `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS_BY_PROJECT
WHERE job_id = 'JOB_ID'

将 JOB_ID 替换为您要调查的 job_id。

结果将如下所示：

+------------------+
| avg_slots_per_ms |
+------------------+
|             17.0 |
+------------------+

费用最高的查询（按项目）

以下示例按槽使用时间列出了 my_project 中费用最高的查询：

SELECT
 job_id,
 query,
 user_email,
 total_slot_ms
FROM `my_project`.`region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE EXTRACT(DATE FROM  creation_time) = current_date()
ORDER BY total_slot_ms DESC
LIMIT 3

您还可以使用以下示例按处理的数据列出费用最高的查询：

SELECT
 job_id,
 query,
 user_email,
 total_bytes_processed
FROM `my_project`.`region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE EXTRACT(DATE FROM  creation_time) = current_date()
ORDER BY total_bytes_processed DESC
LIMIT 3

任一示例的结果都类似于以下内容：

+-----------+---------------------------------+-----------------------+---------------+
| job_id    | query                           | user_email            | total_slot_ms |
+-----------+---------------------------------+--------------------------+------------+
| bquxjob_1 | SELECT ... FROM dataset.table1  | bob@example.com       | 80,000        |
| bquxjob_2 | SELECT ... FROM dataset.table2  | alice@example.com     | 78,000        |
| bquxjob_3 | SELECT ... FROM dataset.table3  | charles@example.com   | 75,000        |
+-----------+---------------------------------+-----------------------+---------------+

获取有关资源警告的详细信息

如果您收到超出资源数错误消息，则可以在时间段内查看查询：

SELECT
  query,
  query_info.resource_warning
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE
 creation_time BETWEEN TIMESTAMP("2022-12-01")
 AND TIMESTAMP("2022-12-08")
 AND query_info.resource_warning IS NOT NULL
LIMIT 3;

监控按日期分组的资源警告

如果您收到超出资源数错误消息，可以监控按日期分组的资源警告总数，以了解工作负载是否有任何变化：

WITH resource_warnings AS (
  SELECT
    EXTRACT(DATE FROM creation_time) AS creation_date
  FROM
    `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
  WHERE
    creation_time >= TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 14 DAY)
    AND query_info.resource_warning IS NOT NULL
)
SELECT
  creation_date,
  COUNT(1) AS warning_counts
FROM
  resource_warnings
GROUP BY creation_date
ORDER BY creation_date DESC;

估算查询的槽用量和费用

以下示例使用 estimated_runnable_units 计算每个作业的平均槽数和最大槽数。

如果您没有任何预留，则 reservation_id 为 NULL。

SELECT
  project_id,
  job_id,
  reservation_id,
  EXTRACT(DATE FROM creation_time) AS creation_date,
  TIMESTAMP_DIFF(end_time, start_time, SECOND) AS job_duration_seconds,
  job_type,
  user_email,
  total_bytes_billed,

  -- Average slot utilization per job is calculated by dividing total_slot_ms by the millisecond duration of the job

  SAFE_DIVIDE(job.total_slot_ms,(TIMESTAMP_DIFF(job.end_time, job.start_time, MILLISECOND))) AS job_avg_slots,
  query,

  -- Determine the max number of slots used at ANY stage in the query.
  -- The average slots might be 55. But a single stage might spike to 2000 slots.
  -- This is important to know when estimating number of slots to purchase.

  MAX(SAFE_DIVIDE(unnest_job_stages.slot_ms,unnest_job_stages.end_ms - unnest_job_stages.start_ms)) AS jobstage_max_slots,

  -- Check if there's a job that requests more units of works (slots). If so you need more slots.
  -- estimated_runnable_units = Units of work that can be scheduled immediately.
  -- Providing additional slots for these units of work accelerates the query,
  -- if no other query in the reservation needs additional slots.

  MAX(unnest_timeline.estimated_runnable_units) AS estimated_runnable_units
FROM `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS AS job
  CROSS JOIN UNNEST(job_stages) as unnest_job_stages
  CROSS JOIN UNNEST(timeline) AS unnest_timeline
WHERE
  DATE(creation_time) BETWEEN DATE_SUB(CURRENT_DATE(), INTERVAL 7 DAY) AND CURRENT_DATE()
  AND project_id = 'my_project'
  AND (statement_type != 'SCRIPT' OR statement_type IS NULL)
GROUP BY 1,2,3,4,5,6,7,8,9,10
ORDER BY job_id;

示例的结果都类似于以下内容：

+-----------+-----------+----------------+---------------+----------------------+----------+-----------------+--------------------+--------------+--------------------------------+--------------------+--------------------------+
|project_id | job_id    | reservation_id | creation_date | job_duration_seconds | job_type | user_email      | total_bytes_billed | job_avg_slots| query                          | jobstage_max_slots | estimated_runnable_units |
+-----------+-----------+----------------+---------------+----------------------+----------+-----------------+--------------------+--------------+--------------------------------+--------------------+--------------------------+
| project1  | bquxjob1  | reservation1   | 2020-10-10    | 160                  | LOAD     | abc@example.com | 161480704          | 2890         | SELECT ... FROM dataset.table1 | 2779.1534          | 1000                     |
| project1  | bquxjob2  | reservation2   | 2020-12-10    | 120                  | LOAD     | abc@example.com | 161480704          | 2890         | SELECT ... FROM dataset.table1 | 2779.1534          | 1000                     |
| project1  | bquxjob3  | reservation1   | 2020-12-10    | 120                  | LOAD     | abc@example.com | 161480704          | 2890         | SELECT ... FROM dataset.table1 | 1279.1534          | 998                     |
+-----------+-----------+----------------+---------------+----------------------+----------+-----------------+--------------------+--------------+--------------------------------+--------------------+--------------------------+

查看查询的性能数据分析

以下示例会返回过去 30 天内具有项目中性能数据分析的所有查询作业，以及链接到 Google Cloud 控制台中的查询执行图的网址。

SELECT
  `bigquery-public-data`.persistent_udfs.job_url(
    project_id || ':us.' || job_id) AS job_url,
  query_info.performance_insights
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS_BY_PROJECT
WHERE
  DATE(creation_time) >= CURRENT_DATE - 30 -- scan 30 days of query history
  AND job_type = 'QUERY'
  AND state = 'DONE'
  AND error_result IS NULL
  AND statement_type != 'SCRIPT'
  AND EXISTS ( -- Only include queries which had performance insights
    SELECT 1
    FROM UNNEST(
      query_info.performance_insights.stage_performance_standalone_insights
    )
    WHERE slot_contention OR insufficient_shuffle_quota
    UNION ALL
    SELECT 1
    FROM UNNEST(
      query_info.performance_insights.stage_performance_change_insights
    )
    WHERE input_data_change.records_read_diff_percentage IS NOT NULL
  );

查看元数据刷新作业

以下示例列出了过去六小时内的元数据刷新作业：

SELECT
 *
FROM
 `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS_BY_PROJECT
WHERE
 job_id LIKE '%metadata_cache_refresh%'
 AND creation_time > TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 6 HOUR)
ORDER BY start_time desc
LIMIT 10;

将 REGION_NAME 替换为您的区域。

分析相同查询在一段时间内的表现

以下示例会返回过去 7 天内运行同一查询的前 10 个最慢的作业：

DECLARE querytext STRING DEFAULT(
  SELECT query
  FROM `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
  WHERE job_id = 'JOB_ID'
  LIMIT 1
);

SELECT
  start_time,
  end_time,
  project_id,
  job_id,
  TIMESTAMP_DIFF(end_time, start_time, SECOND) AS run_secs,
  total_bytes_processed / POW(1024, 3) AS total_gigabytes_processed,
  query
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE
  query = querytext
  AND total_bytes_processed > 0
  AND creation_time >= TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 7 DAY)
ORDER BY 5 DESC
LIMIT 3;

将 JOB_ID 替换为运行您所分析的查询的任何 job_id。

当天扫描字节数排名前五的作业

以下示例演示了如何查找当天在组织中扫描字节数排名前五的作业。您可以根据 statement_type 进一步过滤，以查询其他信息，例如加载、导出和查询。

SELECT
  job_id,
  user_email,
  total_bytes_billed
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS_BY_ORGANIZATION
WHERE
  EXTRACT(DATE FROM  creation_time) = current_date()
ORDER BY
  total_bytes_billed DESC
LIMIT 3;

结果类似于以下内容：

+--------------+--------------+---------------------------+
| job_id       |  user_email  |  total_bytes_billed       |
+--------------+--------------+---------------------------+
| bquxjob_1    |  abc@xyz.com |    999999                 |
| bquxjob_2    |  def@xyz.com |    888888                 |
| bquxjob_3    |  ghi@xyz.com |    777777                 |
+--------------+--------------+---------------------------+

查看待处理作业或正在运行的作业

SELECT
  job_id,
  creation_time,
  query
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS_BY_USER
WHERE
  state != 'DONE';

结果类似于以下内容：

+--------------+---------------------------+---------------------------------+
| job_id       |  creation_time            |  query                          |
+--------------+---------------------------+---------------------------------+
| bquxjob_1    |  2019-10-10 00:00:00 UTC  |  SELECT ... FROM dataset.table1 |
| bquxjob_2    |  2019-10-10 00:00:01 UTC  |  SELECT ... FROM dataset.table2 |
| bquxjob_3    |  2019-10-10 00:00:02 UTC  |  SELECT ... FROM dataset.table3 |
+--------------+---------------------------+---------------------------------+

查看包含槽争用分析洞见的作业

如需查看包含槽争用分析洞见的作业，请运行以下查询：

SELECT
  job_id,
  creation_time,
  query_info.performance_insights,
FROM
  `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS j,
  UNNEST(query_info.performance_insights.stage_performance_standalone_insights) i
WHERE
  (j.statement_type != "SCRIPT" OR j.statement_type IS NULL)
  AND i IS NOT NULL
  AND i.slot_contention

输出显示了有关作业的不同性能分析洞见，包括槽争用：

+------------+-------------------------+-------------------------------------------------+----------------------------------------------------------------------------+
| job_id     | creation_time           | performance_insights.avg_previous_execution_ms  | performance_insightsstage_performance_standalone_insights.slot_contention  |
+------------+-------------------------+-------------------------------------------------+----------------------------------------------------------------------------+
| bquxjob_1  | 2025-08-08 00:00:00 UTC | null                                            | true                                                                       |
| bquxjob_2  | 2025-08-08 00:00:00 UTC | 42689                                           | true                                                                       |
| bquxjob_3  | 2025-08-08 00:00:00 UTC | 42896                                           | true                                                                       |
+------------+-------------------------+-------------------------------------------------+----------------------------------------------------------------------------+

查看同一项目中与特定作业同时运行的平均并发作业数

以下示例演示了如何计算同一项目中与特定查询作业同时运行的作业的平均数量。

此计算有助于确定同一项目内并发作业数量的增加是否导致了槽争用问题。在排查查询速度慢的问题或比较查询运行速度快慢时，收集此数据。

如果运行的并发查询数量远超预期，请检查是否启动了更多作业、查询的数据是否发生了变化，或者两者兼而有之。

WITH job_metadata AS (
 SELECT creation_time, end_time, job_type
 FROM `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS_BY_PROJECT
 WHERE job_id = 'JOB_ID'
-- If you know the date the job was created, add the following line to speed up the query by providing the date in UTC:
-- AND DATE(creation_time) = 'YYYY-MM-DD'
),
intervals AS (
 SELECT TIMESTAMP_ADD(creation_time, INTERVAL (seconds_offset) SECOND) AS ts,
 job_type
 FROM job_metadata,
 UNNEST (GENERATE_ARRAY(0, IF(TIMESTAMP_DIFF(end_time, creation_time, SECOND) > 0, TIMESTAMP_DIFF(end_time, creation_time, SECOND), 1))) as seconds_offset
),
concurrent_jobs AS (
 SELECT int.ts, COUNT(*) as concurrent_jobs_count
 FROM intervals int JOIN
 `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS_BY_PROJECT j
 ON int.ts BETWEEN j.creation_time and j.end_time
 WHERE job_id != 'JOB_ID'
 AND j.job_type = int.job_type
 GROUP BY int.ts)

SELECT ROUND(AVG(concurrent_jobs_count),1) as average_concurrent_jobs FROM concurrent_jobs

替换以下内容：

JOB_ID：您正在分析的查询的作业 ID
REGION_NAME：项目的区域

结果类似于以下内容：

+-------------------------+
| average_concurrent_jobs |
+-------------------------+
|                     2.8 |
+-------------------------+

获取导出作业处理的字节数

以下示例计算 EXTRACT 作业类型的 total_bytes_processed 值。如需了解导出作业的配额，请参阅导出作业的配额政策。处理的总字节数可用于监控总用量，并核实导出作业保持在每天 50 TB 的限制以下：

SELECT
    DATE(creation_time) as day,
    project_id as source_project_id,
    SUM(total_bytes_processed) AS total_bytes_processed
 FROM
   `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
 WHERE
    creation_time BETWEEN TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 8 DAY) AND CURRENT_TIMESTAMP()
    AND job_type = "EXTRACT"
GROUP BY
    day,
    source_project_id
ORDER BY
    day DESC;

获取复制作业的用量

如需了解复制作业，请参阅复制表。以下示例展示了复制作业的用法：

SELECT
    DATE(creation_time) as day,
    project_id as source_project_id,
CONCAT(destination_table.project_id,":",destination_table.dataset_id,".",destination_table.table_id) as destination_table,
    COUNT(job_id) AS copy_job_count
 FROM
   `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
 WHERE
    creation_time BETWEEN TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 8 DAY) AND CURRENT_TIMESTAMP()
    AND job_type = "COPY"
GROUP BY
    day,
    source_project_id,
    destination_table
ORDER BY
    day DESC;

在 BigQuery 存储空间优化中获取适用于 Apache Iceberg 的 BigLake 表的用量

以下示例介绍了 BigQuery 存储空间优化中 BigLake Iceberg 表的用法。

SELECT
    job_id, reservation_id, edition,
    total_slot_ms, total_bytes_processed, state
FROM `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
WHERE creation_time > TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 6 HOUR)
    AND user_email = "bigquery-adminbot@system.gserviceaccount.com"
    AND query LIKE "CALL BQ.OPTIMIZE_STORAGE(%)";

在 BigQuery 导出表元数据中获取 BigLake Iceberg 表的使用情况

以下示例展示了 Iceberg EXPORT TABLE METADATA FROM 的用法。

SELECT
   job_id,
   user_email,
   start_time,
   end_time,
   TIMESTAMP_DIFF(end_time, start_time, SECOND) AS duration_seconds,
   total_bytes_processed,
   reservation_id,
   CASE
     WHEN reservation_id IS NULL THEN 'PAYG (On-demand)'
     WHEN reservation_id != '' THEN 'Reservation'
     ELSE 'Unknown'
   END AS compute_type,
   query
 FROM
   `region-REGION_NAME`.INFORMATION_SCHEMA.JOBS
 WHERE
   job_type = 'QUERY'
   AND end_time IS NOT NULL
   -- Filter for queries containing the specified pattern (case-insensitive)
   AND REGEXP_CONTAINS(LOWER(query), r"export table metadata from")
 ORDER BY
   start_time DESC
 LIMIT 3;

匹配管理资源图表中的槽用量行为

如需探索槽用量行为（类似于管理资源图表中的信息），请查询 INFORMATION_SCHEMA.JOBS_TIMELINE 视图。