创建开发环境

本快速入门将引导您完成在 Dataform 中创建各个开发环境的步骤,以便每个开发者都能在自己的开发环境中工作:

准备工作

  1. 登录您的 Google Cloud 账号。如果您是 Google Cloud 新手,请创建一个账号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
  2. 在 Google Cloud Console 中的项目选择器页面上,选择或创建一个 Google Cloud 项目

    转到“项目选择器”

  3. 确保您的 Google Cloud 项目已启用结算功能

  4. 启用 BigQuery and Dataform API。

    启用 API

  5. 在 Google Cloud Console 中的项目选择器页面上,选择或创建一个 Google Cloud 项目

    转到“项目选择器”

  6. 确保您的 Google Cloud 项目已启用结算功能

  7. 启用 BigQuery and Dataform API。

    启用 API

所需的角色

如需获取执行本教程中所有任务所需的权限,请让管理员授予您以下 IAM 角色:

如需详细了解如何授予角色,请参阅管理访问权限

您也可以通过自定义角色或其他预定义角色来获取所需的权限。

创建 Dataform 代码库

  1. 在 Google Cloud 控制台中,前往 Dataform 页面。

    前往 Dataform

  2. 点击 创建代码库

  3. 创建代码库页面上,执行以下操作:

    1. 代码库 ID 字段中,输入 quickstart-dev

    2. 区域列表中,选择 europe-west4

    3. 点击创建

  4. 点击完成

向 Dataform 授予对 BigQuery 的访问权限

如需在 BigQuery 中执行工作流,Dataform 服务帐号必须具有以下必需的角色:

如需授予这些角色,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,转到 IAM 页面。

    进入 IAM 页面

  2. 点击添加

  3. 新的主账号字段中,输入您的 Dataform 服务帐号 ID。

  4. 选择角色下拉列表中,选择 BigQuery Job User 角色。

  5. 点击添加其他角色,然后在选择角色下拉列表中选择 BigQuery Data Editor 角色。

  6. 点击添加其他角色,然后在选择角色下拉列表中选择 BigQuery Data Viewer 角色。

  7. 点击保存

配置工作区编译替换

如需使用 Dataform 工作区编译替换创建隔离的开发环境,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Dataform 页面。

    前往 Dataform

  2. 点击 quickstart-dev

  3. 点击设置,然后点击修改

  4. 工作区编译替换窗格的架构后缀字段中,输入 ${workspaceName}

    在工作区中触发执行时,Dataform 会将工作区名称作为后缀附加到 dataform.json 中设置的默认架构。本快速入门将默认 Dataform 设置与 dataform 默认架构搭配使用。

  5. 点击保存

Dataform 会将工作区编译替换应用于代码库中的所有工作区。

使用此配置时,当您在工作区中手动执行 SQL 工作流时,Dataform 会使用工作区编译替换来执行该工作流。因此,Dataform 在 BigQuery 中的 dataform_workspaceName 架构中执行 SQL 工作流,将工作区转换为独立的开发环境。

例如,当您在 sasha 工作区中手动触发执行时,Dataform 会在 BigQuery 的 dataform_sasha 架构中执行 SQL 工作流。

如需在未设置工作区编译替换的情况下执行 SQL 工作流,但针对开发环境保留工作区编译替换,您可以创建版本配置以配置其他执行环境,例如 stagingproduction

清理

为避免因本页中使用的资源导致您的 Google Cloud 账号产生费用,请按照以下步骤操作。

删除在 BigQuery 中创建的数据集

为避免 BigQuery 资产产生费用,请删除名称以 dataform 开头的数据集,例如 dataform-sasha

  1. 在 Google Cloud 控制台中,转到 BigQuery 页面。

    转到 BigQuery

  2. 浏览器面板中,展开您的项目并选择数据集。

  3. 点击 操作菜单,然后选择删除

  4. 删除数据集对话框的字段中输入 delete,然后点击删除

删除 Dataform 代码库

创建 Dataform 代码库不会产生任何费用。但是,如果要删除代码库及其所有内容,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Dataform 页面。

    前往 Dataform

  2. 通过 quickstart-dev,点击 更多菜单,然后选择删除

    1. 删除代码库窗口中,输入代码库的名称以确认删除。
  3. 请点击删除来确认操作。

后续步骤