创建开发环境
本快速入门将引导您逐步创建单个开发环境, 让每个开发者都能在自己的环境中 开发环境:
- 创建 Dataform 代码库。
-
配置 Dataform 将应用于所有对象的编译替换 工作区,从而将工作区转换为独立的工作区 开发环境
准备工作
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
所需的角色
如需获取执行本教程中的所有任务所需的权限, 请让管理员向您授予 项目的以下 IAM 角色:
-
Dataform Admin (
roles/dataform.admin
) - 代码库 -
Dataform Editor (
roles/dataform.editor
) - 工作区和工作流调用
如需详细了解如何授予角色,请参阅管理访问权限。
创建 Dataform 代码库
在 Google Cloud 控制台中,前往 Dataform 页面。
点击
创建制品库。在创建代码库页面上,执行以下操作:
在代码库 ID 字段中,输入
quickstart-dev
。在区域列表中,选择
europe-west4
。点击创建。
点击完成。
向 Dataform 授予对 BigQuery 的访问权限
为了在 BigQuery 中执行工作流,Dataform 服务账号必须具有以下必需角色:
- BigQuery 数据编辑者 。他们 通常包括托管 Dataform 代码库的项目。
- BigQuery 数据查看者 (针对 Dataform 需要只读访问权限的项目)。
- BigQuery 作业用户 对托管 Dataform 代码库的项目执行此步骤。
如需授予这些角色,请按以下步骤操作:
在 Google Cloud 控制台中,转到 IAM 页面。
点击添加。
在新的主账号字段中,输入您的 Dataform 服务 账号 ID。
在选择角色下拉列表中, BigQuery Job User 角色。
点击添加其他角色,然后在选择角色下拉菜单中 列表中,选择 BigQuery Data Editor 角色。
点击添加其他角色,然后在选择角色下拉菜单中 列表中,选择 BigQuery Data Viewer 角色。
点击保存。
配置工作区编译替换
使用 Dataform 工作区创建隔离的开发环境 编译替换,请按以下步骤操作:
在 Google Cloud 控制台中,前往 Dataform 页面。
点击
quickstart-dev
。点击设置,然后点击修改。
在工作区编译替换窗格的架构后缀字段中,输入
${workspaceName}
。当您在工作区中触发执行时,Dataform 会将 工作区名称作为在 中设置的默认架构的后缀 工作流设置。 本快速入门使用默认的 Dataform 设置和
dataform
默认架构。点击保存。
Dataform 将工作区编译替换应用于以下项中的所有工作区: 代码库
使用此配置时,如果您在 Google Cloud 控制台中手动执行 SQL 工作流,
Dataform 会通过工作区编译替换执行它。
因此,Dataform 在 BigQuery 的 dataform_workspaceName
架构中执行 SQL 工作流,从而将
隔离为独立的开发环境。
例如,当您在 sasha
工作区中手动触发执行时,
Dataform 在 dataform_sasha
架构中执行 SQL 工作流
BigQuery。
在没有工作区编译替换的情况下执行 SQL 工作流,但保留
工作区编译替换,您可以创建
版本配置来配置其他执行环境,例如
staging
和production
。
清理
为避免因本页中使用的资源导致您的 Google Cloud 账号产生费用,请按照以下步骤操作。
删除在 BigQuery 中创建的数据集
为避免 BigQuery 资产产生费用,请删除数据集
使用以 dataform
开头的名称,例如 dataform-sasha
。
在 Google Cloud 控制台中,转到 BigQuery 页面。
在浏览器面板中,展开您的项目并选择数据集。
点击
操作菜单,然后选择 删除。在删除数据集对话框中的字段中输入
delete
,然后 点击删除。
删除 Dataform 代码库
创建 Dataform 代码库不会产生任何相关费用。 但是,如果您想删除代码库及其所有内容,请按照以下指示操作 步骤:
在 Google Cloud 控制台中,前往 Dataform 页面。
quickstart-dev
后,点击 的更多菜单,然后 然后选择删除。- 在删除代码库窗口中,输入代码库的名称以确认删除。
请点击删除来确认操作。
后续步骤
如需详细了解 Dataform 中的代码生命周期,请参阅简介 Dataform 中的代码生命周期。
如需详细了解 Dataform 中代码生命周期的最佳实践, 请参阅管理代码生命周期。
如需详细了解 Dataform 中的工作区编译替换, 请参阅创建工作区编译 替换。
如需了解如何在 Dataform 中安排生产环境的执行,请参阅 安排制作 执行。