代码库简介

本文档可帮助您了解 Dataform 中的代码库。

每个 Dataform 代码库都包含一系列 SQLX 和 JavaScript 以及构成 SQL 工作流的 Dataform 文件 配置文件和软件包您与 代码库(位于开发工作区中)。

Dataform 会在 Dataform 页面上以 代码库 ID 的字母顺序。您可以对它们进行排序和过滤。

转到 Dataform

每个 Dataform 代码库都与一个服务账号相关联。您可以 在创建代码库时选择服务账号, 或者修改服务账号

默认情况下,Dataform 使用基于您的 项目编号,格式如下:

service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com

Dataform 使用 Git 来记录更改并管理文件版本。 每个 Dataform 代码库都与一个 Git 代码库相对应。 创建 Dataform 代码库后,您可以连接该代码库 远程 GitHub、GitLab 或 Bitbucket 代码库。

Dataform 会在 Dataform 代码库中存储代码库代码。 在关联的代码库中,第三方代码库会存储代码库代码。 Dataform 与第三方代码库交互,让您能够修改 并在 Dataform 开发工作区中执行其内容。

Dataform 代码库页面包含以下组件:

“开发工作区”标签页
显示代码库中创建的开发工作区。
“版本配置”标签页
用于检查、创建、修改和删除 版本
工作流执行日志标签页
显示 Dataform 工作流执行日志
工作流配置标签页
用于检查、创建、修改和删除 工作流配置
“设置”标签页
显示代码库的名称和位置。对于连接的代码库 显示第三方代码库源代码 默认分支名称和密钥令牌。显示用于 将代码库关联到第三方 Git 代码库并修改 Git 连接
“创建开发工作区”按钮
用于创建开发工作区

创建并初始化开发工作区后,您可以 修改工作流程设置文件 代码库的以下 Dataform 设置:

  • 默认数据库(Google Cloud 项目 ID)
  • 默认架构(BigQuery 数据集 ID)
  • 默认 BigQuery 位置
  • 断言的默认架构(BigQuery 数据集 ID)
  • 仓库,必须设置为 bigquery
  • 在编译期间可供项目代码使用的用户定义变量

如需详细了解 Dataform 代码库设置,请参阅 Dataform 核心参考文档中的 IProjectConfig

后续步骤