创建公共实例

本页面介绍如何创建 Cloud Data Fusion 实例

准备工作

  • 启用 Cloud Data Fusion API
  • 创建 Cloud Data Fusion 实例需要具备以下权限:instances.create。如需了解详情,请参阅访问权限控制
  • Cloud Data Fusion 实例作为 Compute Engine 默认服务账号运行。如需了解可用的类型和角色,请参阅服务账号
  • 默认情况下,Cloud Data Fusion 使用项目中的 Dataproc 集群执行流水线。确保您的项目满足 Dataproc 网络要求
  • 新项目起初都有一个默认网络。 默认网络预填充了防火墙规则 default-allow-ssh,该规则在 TCP 端口 22 上允许任何来源与网络中的任意实例建立入站连接。在 6.2.0 之前的版本中,如果此规则允许 TCP 上的入站流量 您的 Cloud Data Fusion 使用的网络中不存在端口 22 实例,则必须创建此规则

创建实例

控制台

如果 API 已启用,则 Google Cloud 控制台中的 Cloud Data Fusion 部分显示了 实例页面,您可以在其中创建和管理您的 Cloud Data Fusion 实例。

  1. 在控制台中,前往 Cloud Data Fusion 页面。
  2. 点击实例,然后点击创建实例

    创建实例

  3. 输入实例名称
  4. 输入实例的说明
  5. 指定要在其中创建实例的区域
  6. 指定 Cloud Data Fusion 版本
  7. 选择版本。 默认值为基本
  8. 可选:点击添加加速器以选择要在实例中使用的加速器。
  9. 指定 Dataproc 服务账号,用于在 Dataproc 中运行 Cloud Data Fusion 流水线。默认是 Compute Engine 账号。无论使用何种版本,请确保服务账号具有满足您需求的适当 Identity and Access Management 角色。如需了解详情,请参阅向服务账号授予用户权限
  10. 可选:指定任意高级选项。如果您不指定任何对象 系统将使用以下默认值:

    类别 设置 说明 默认
    专用 IP 启用内部 IP 地址 创建 具有内部 IP 地址的 Cloud Data Fusion 实例 已停用
    日志记录和监控 启用 Cloud Logging 在 Cloud Logging 中查看流水线日志 已停用
    Dataplex 数据沿袭 集成 启用或停用与 Dataplex 数据沿袭的集成 查看 Dataplex 中的沿袭) 已停用
    加密 使用客户管理的加密密钥 (CMEK) 使用 6.5 及更高版本中为“基于角色的访问权限控制” 已停用
    标签 键值对 实例的资源标签,用于为任何对象添加注释 相关的底层资源,例如 Compute Engine 虚拟机标签键和标签值只能包含字母、数字、短划线和下划线。标签键必须以 字母或数字。
    维护 启用维护窗口 设置 Cloud Data Fusion 可以执行的时间范围 对实例执行的维护操作如需了解详情,请参阅 配置维护窗口 已停用
  11. 点击创建。完成实例创建过程最多需要 30 分钟。

当 Cloud Data Fusion 创建实例时,实例页面上实例名称的旁边会显示一个进度轮。创建完成后,该进度轮将变成一个绿色对勾标记,指明您可以开始使用实例了。

API

创建实例:

如需使用 Cloud Data Fusion REST API 创建 Cloud Data Fusion 实例,请构建一个 instances.create API 请求,并填入 Instance 资源。

后续步骤