本文档可帮助您了解 Dataform 中的代码库。
每个 Dataform 代码库都包含一系列 SQLX 和 JavaScript 以及构成 SQL 工作流的 Dataform 文件 配置文件和软件包您与 代码库(位于开发工作区中)。
Dataform 会在 Dataform 页面上以 代码库 ID 的字母顺序。您可以对它们进行排序和过滤。
每个 Dataform 代码库都与一个服务账号相关联。您可以 在创建代码库时选择服务账号, 或者修改服务账号 。
默认情况下,Dataform 使用基于您的 项目编号,格式如下:
service-YOUR_PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
Dataform 使用 Git 来记录更改并管理文件版本。 每个 Dataform 代码库都与一个 Git 代码库相对应。 创建 Dataform 代码库后,您可以连接该代码库 远程 GitHub、GitLab 或 Bitbucket 代码库。
Dataform 会在 Dataform 代码库中存储代码库代码。 在关联的代码库中,第三方代码库会存储代码库代码。 Dataform 与第三方代码库交互,让您能够修改 并在 Dataform 开发工作区中执行其内容。
Dataform 代码库页面包含以下组件:
- “开发工作区”标签页
- 显示代码库中创建的开发工作区。
- “版本配置”标签页
- 用于检查、创建、修改和删除 版本。
- 工作流执行日志标签页
- 显示 Dataform 工作流执行日志。
- 工作流配置标签页
- 用于检查、创建、修改和删除 工作流配置。
- “设置”标签页
- 显示代码库的名称和位置。对于连接的代码库 显示第三方代码库源代码 默认分支名称和密钥令牌。显示用于 将代码库关联到第三方 Git 代码库并修改 Git 连接。
- “创建开发工作区”按钮
- 用于创建开发工作区。
创建并初始化开发工作区后,您可以 修改工作流程设置文件 代码库的以下 Dataform 设置:
- 默认数据库(Google Cloud 项目 ID)
- 默认架构(BigQuery 数据集 ID)
- 默认 BigQuery 位置
- 断言的默认架构(BigQuery 数据集 ID)
- 仓库,必须设置为
bigquery
- 在编译期间可供项目代码使用的用户定义变量
如需详细了解 Dataform 代码库设置,请参阅 Dataform 核心参考文档中的 IProjectConfig。
后续步骤
- 如需了解如何创建和初始化工作区,请参阅 创建工作区。
- 如需了解如何配置 Dataform 代码库设置,请参阅 配置 Dataform 设置。
- 了解如何将 Dataform 代码库连接到第三方 Git 代码库,请参阅连接到第三方 Git 代码库。
- 如需了解如何查看工作流执行日志,请参阅 监控执行日志。
- 如需了解如何创建 Dataform 编译版本,请参阅 创建编译版本。
- 如需详细了解仓库大小对 Dataform 中的开发有何影响, 请参阅代码库大小概览。
- 了解如何通过工作流安排 Dataform 执行 请参阅使用工作流配置安排执行。
- 如需详细了解如何在 Dataform 中拆分仓库,请参阅 拆分代码库简介。