数据集简介

此页面简要介绍 BigQuery 中的数据集。

数据集

数据集包含在特定项目中,数据集是用来组织和控制视图访问权限的顶级容器。表或视图必须属于数据集,因此需要创建至少一个数据集,才能将数据加载到 BigQuery 中。 使用 GoogleSQL 时,请使用 projectname.datasetname 格式来完全限定数据集名称;使用 bq 命令行工具时,请使用 projectname:datasetname 格式来完全限定数据集名称。

位置

您在创建数据集时会指定一个位置用于存储 BigQuery 数据。如需查看 BigQuery 数据集位置的列表,请参阅 BigQuery 位置。在创建数据集后,您无法更改该位置,但可以将数据集复制到其他位置,或手动将数据集移动到其他位置(在其他位置重新创建数据集)

BigQuery 在包含待查询表的数据集所在的位置处理查询。 BigQuery 根据服务专用条款将您的数据存储在选定位置。

限制

BigQuery 数据集有以下限制:

  • 数据集位置只能在创建时设置。创建数据集后,就无法再更改其位置。
  • 查询中引用的所有表必须存储在位于同一位置的数据集中。

  • 复制表时,包含源表和目标表的数据集必须位于同一位置。

  • 各个项目的数据集名称不得重复。

配额

要详细了解数据集配额和限制,请参阅配额和限制

数据保留

数据集使用时间旅行故障安全期可在短时间内保留已删除和已修改的数据,以防您需要恢复数据。如需了解详情,请参阅通过时间旅行和故障安全进行数据保留

存储计费模型

创建数据集时,该数据集使用的存储空间会计入您的结算费用,并且以逻辑字节数作为默认用量单位。不过,您可以选择改用物理字节数进行结算。您还可以将现有数据集的存储计费模型更改为使用物理字节数。

更改数据集的结算模式后,更改需要 24 小时才能生效。 更改数据集的结算模式时,长期存储中的任何表或表分区都不会重置为活跃存储空间。更改数据集的结算模式不会影响查询性能和查询延迟时间。

更改数据集的存储结算模式后,您必须等待 14 天才能再次更改存储结算模式。

如果您将存储计费模型设置为使用物理字节数,您需要支付的总活跃存储费用将包含时间旅行和故障安全存储所用字节数的费用。您可以配置时间旅行窗口,以在存储费用和数据保留需求之间进行权衡。如需详细了解如何预测存储空间费用,请参阅预测存储空间结算费用

资格条件:

仅当您的组织尚无任何与数据集位于同一区域的固定费率槽承诺时,数据集存储结算模型才适用于数据集。如果没有与数据集位于同一区域的固定费率承诺,您的组织可以注册数据集以进行物理存储结算。

价格

您无需为创建、更新或删除数据集付费。

要详细了解 BigQuery 价格,请参阅价格

安全

如需控制对 BigQuery 中数据集的访问权限,请参阅控制对数据集的访问权限。 如需了解数据加密,请参阅静态加密

后续步骤