管理表数据

本文档介绍如何在 BigQuery 中管理表数据。您可以通过以下方式处理 BigQuery 表数据：

如需了解如何管理表架构，请参阅修改表架构。

准备工作

向需要执行本文档中每项任务的用户授予必要权限的角色。执行任务所需的权限（如果有）列在任务的“所需权限”部分中。

您可以在创建表时加载数据，也可以先创建空表，然后再加载数据。加载数据时，您可以针对支持的数据格式使用架构自动检测功能，也可以指定架构。

如需详细了解如何加载数据，请参阅关于源数据格式和位置的文档：

您可以使用加载或查询操作覆盖表数据。您可以通过执行加载附加操作或将查询结果附加到表，将其他数据附加到现有表。

如需详细了解如何在加载数据时对表执行附加或覆盖操作，请参阅关于源数据格式的文档：

如需使用查询结果覆盖或附加到表，请指定目标表并将写入配置设置为以下某项：

您可以使用以下查询将记录从一个表附加到另一个表：

  INSERT INTO <projectID>.<datasetID>.<table1> (
    <column2>,
    <column3>) (SELECT * FROM <projectID>.<datasetID>.<table2>)

如需详细了解如何使用查询结果执行数据附加或覆盖操作，请参阅写入查询结果。

您可以通过以下方式浏览或读取表数据：

如需读取表和分区数据，您需要拥有 bigquery.tables.getData Identity and Access Management (IAM) 权限。

以下预定义的 IAM 角色均包含浏览表和分区数据所需的权限：

如果您拥有 bigquery.datasets.create 权限，则可以浏览您创建的数据集的表和分区中的数据。

如需详细了解 BigQuery 中的 IAM 角色和权限，请参阅预定义的角色和权限。

如需浏览表数据，请执行以下操作：

发出带 --max_rows 标志的 bq head 命令，即可列出特定表行数对应的所有列。如果未指定 --max_rows，则默认值为 100。

如需浏览表中的列的子集（包括嵌套和重复的列），请使用 --selected_fields 标志以英文逗号分隔列表的形式输入列。

如需指定显示表数据之前要跳过的行数，请使用 --start_row=integer 标志（或 -s 快捷方式）。默认值为 0。如需检索表中的行数，您可以使用 bq show 命令检索表信息。

如果要浏览的表在非默认项目中，请按以下格式将相应项目 ID 添加到命令：project_id:dataset.table。

bq head \
--max_rows integer1 \
--start_row integer2 \
--selected_fields "columns" \
project_id:dataset.table

其中：

示例：

输入以下命令以列出 mydataset.mytable 中前 10 行的所有列。mydataset 在默认项目中。

bq head --max_rows=10 mydataset.mytable

输入以下命令以列出 mydataset.mytable 中前 100 行的所有列。mydataset 在 myotherproject 中，不在默认项目中。

bq head myotherproject:mydataset.mytable

输入以下命令，仅显示 mydataset.mytable 中的 field1 和 field2。该命令使用 --start_row 标志跳转到第 100 行。mydataset.mytable 在默认项目中。

bq head --start_row 100 --selected_fields "field1,field2" mydataset.mytable

因为 bq head 命令不会创建查询作业，所以 bq head 命令不会显示在查询历史记录中，您也无需为此付费。

通过调用 tabledata.list 可浏览表中的数据。在 tableId 参数中指定表的名称。

配置以下可选参数来控制输出：

返回的值会封装在一个 JSON 对象中，您必须对此对象进行解析，具体请参阅 tabledata.list 参考文档。