创建开发环境
本快速入门将引导您完成在 Dataform 中创建各个开发环境的步骤,以便每个开发者都能在自己的开发环境中工作:
- 创建 Dataform 代码库。
- 向 Dataform 授予对 BigQuery 的访问权限。
-
配置编译替换,Dataform 将应用于代码库中的所有工作区,从而将工作区转换为独立的开发环境。
准备工作
- 登录您的 Google Cloud 账号。如果您是 Google Cloud 新手,请创建一个账号来评估我们的产品在实际场景中的表现。新客户还可获享 $300 赠金,用于运行、测试和部署工作负载。
-
在 Google Cloud Console 中的项目选择器页面上,选择或创建一个 Google Cloud 项目。
-
启用 BigQuery and Dataform API。
-
在 Google Cloud Console 中的项目选择器页面上,选择或创建一个 Google Cloud 项目。
-
启用 BigQuery and Dataform API。
所需的角色
如需获取执行本教程中所有任务所需的权限,请让管理员授予您以下 IAM 角色:
-
代码库的 Dataform Admin (
roles/dataform.admin
) -
针对工作区和 WorkflowInvocations 的 Dataform Editor (
roles/dataform.editor
)
如需详细了解如何授予角色,请参阅管理访问权限。
创建 Dataform 代码库
在 Google Cloud 控制台中,前往 Dataform 页面。
点击
创建代码库。在创建代码库页面上,执行以下操作:
在代码库 ID 字段中,输入
quickstart-dev
。在区域列表中,选择
europe-west4
。点击创建。
点击完成。
向 Dataform 授予对 BigQuery 的访问权限
如需在 BigQuery 中执行工作流,Dataform 服务帐号必须具有以下必需的角色:
- 需要对 Dataform 同时具有读写权限的项目使用 BigQuery Data Editor。它们通常包括托管 Dataform 代码库的项目。
- 对 Dataform 需要只读权限的项目拥有 BigQuery Data Viewer 权限。
- 托管 Dataform 代码库的项目的 BigQuery Job User。
如需授予这些角色,请按以下步骤操作:
在 Google Cloud 控制台中,转到 IAM 页面。
点击添加。
在新的主账号字段中,输入您的 Dataform 服务帐号 ID。
在选择角色下拉列表中,选择 BigQuery Job User 角色。
点击添加其他角色,然后在选择角色下拉列表中选择 BigQuery Data Editor 角色。
点击添加其他角色,然后在选择角色下拉列表中选择 BigQuery Data Viewer 角色。
点击保存。
配置工作区编译替换
如需使用 Dataform 工作区编译替换创建隔离的开发环境,请按以下步骤操作:
在 Google Cloud 控制台中,前往 Dataform 页面。
点击
quickstart-dev
。点击设置,然后点击修改。
在工作区编译替换窗格的架构后缀字段中,输入
${workspaceName}
。在工作区中触发执行时,Dataform 会将工作区名称作为后缀附加到
dataform.json
中设置的默认架构。本快速入门将默认 Dataform 设置与dataform
默认架构搭配使用。点击保存。
Dataform 会将工作区编译替换应用于代码库中的所有工作区。
使用此配置时,当您在工作区中手动执行 SQL 工作流时,Dataform 会使用工作区编译替换来执行该工作流。因此,Dataform 在 BigQuery 中的 dataform_workspaceName
架构中执行 SQL 工作流,将工作区转换为独立的开发环境。
例如,当您在 sasha
工作区中手动触发执行时,Dataform 会在 BigQuery 的 dataform_sasha
架构中执行 SQL 工作流。
如需在未设置工作区编译替换的情况下执行 SQL 工作流,但针对开发环境保留工作区编译替换,您可以创建版本配置以配置其他执行环境,例如 staging
和 production
。
清理
为避免因本页中使用的资源导致您的 Google Cloud 账号产生费用,请按照以下步骤操作。
删除在 BigQuery 中创建的数据集
为避免 BigQuery 资产产生费用,请删除名称以 dataform
开头的数据集,例如 dataform-sasha
。
在 Google Cloud 控制台中,转到 BigQuery 页面。
在浏览器面板中,展开您的项目并选择数据集。
点击
操作菜单,然后选择删除。在删除数据集对话框的字段中输入
delete
,然后点击删除。
删除 Dataform 代码库
创建 Dataform 代码库不会产生任何费用。但是,如果要删除代码库及其所有内容,请按以下步骤操作:
在 Google Cloud 控制台中,前往 Dataform 页面。
通过
quickstart-dev
,点击 更多菜单,然后选择删除。- 在删除代码库窗口中,输入代码库的名称以确认删除。
请点击删除来确认操作。
后续步骤
如需详细了解 Dataform 中的代码生命周期,请参阅 Dataform 中的代码生命周期简介。
如需详细了解 Dataform 中代码生命周期的最佳实践,请参阅管理代码生命周期。
如需详细了解 Dataform 中的工作区编译替换,请参阅创建工作区编译替换。
如需了解如何在 Dataform 中安排生产环境的执行,请参阅安排生产环境的执行。