创建 Cloud Data Fusion 实例

本页面介绍如何创建 Cloud Data Fusion 实例

准备工作

  • 启用 Cloud Data Fusion API
  • 创建 Cloud Data Fusion 实例需要具备以下权限:instances.create。如需了解详情,请参阅访问权限控制
  • Cloud Data Fusion 实例作为 Compute Engine 默认服务帐号运行。如需了解可用的类型和角色,请参阅服务帐号
  • 默认情况下,Cloud Data Fusion 使用项目中的 Dataproc 集群执行流水线。确保您的项目满足 Dataproc 网络要求
  • 新项目起初都有一个默认网络。 默认网络预填充了防火墙规则 default-allow-ssh,该规则在 TCP 端口 22 上允许任何来源与网络中的任意实例建立入站连接。在低于 6.2.0 的版本中,如果允许 TCP 端口 22 的入站流量的规则不在您的 Cloud Data Fusion 实例使用的网络中,您必须创建此规则

创建实例

控制台

如果已启用 API,Cloud Console 中的 Cloud Data Fusion 部分会显示一个实例页面,在此页面中,您可以建立并管理 Cloud Data Fusion 实例。

  1. 点击创建实例

    打开“创建实例”页面

  2. 输入实例名称
  3. 输入实例的说明
  4. 指定要在其中创建实例的区域
  5. 指定您所需的 Cloud Data Fusion 版本
  6. 选择您所需的 Cloud Data Fusion 版本
  7. 在 Cloud Data Fusion 6.2.3 及更高版本中,指定用于在 Dataproc 中运行 Cloud Data Fusion 流水线的 Dataproc 服务帐号。界面会预先选择默认的 Compute Engine 帐号。无论使用何种版本,请确保服务帐号具有满足您需求的适当 Identity and Access Management 角色。如需了解详情,请参阅向服务帐号授予用户权限
  8. 指定任何其他设置。如果您没有为其他设置指定任何内容,则使用以下默认值:

    类别
    设置
    说明
    默认
    版本
    开发者版、基本版或企业版
    实例和流水线特性
    基本版
    高级选项
    专用 IP
    启用专用 IP 地址
    创建使用专用 IP 地址的 Cloud Data Fusion 实例
    已停用
    加速器 启用 Cloud Logging 服务
    用于启用 Cloud Logging 的选项
    已停用
    Logging 和 Monitoring 启用 Cloud Logging 服务
    用于启用 Cloud Logging 的选项
    已停用

    启用 Cloud Monitoring 服务
    用于启用 Cloud Monitoring 的选项
    已停用
    标签
    <Key> <Value> 配对
    实例用来注释任何相关底层资源(例如 Compute Engine 虚拟机)的资源标签。标签键和标签值只能包含字母、数字、短划线和下划线。标签键必须以字母或数字开头。

  9. 点击创建。完成实例创建过程最多需要 30 分钟。

当 Cloud Data Fusion 创建实例时,实例页面上实例名称的旁边会显示一个进度轮。创建完成后,该进度轮将变成一个绿色对勾标记,指明您可以开始使用实例了。

API

创建实例:

如需使用 Cloud Data Fusion REST API 创建 Cloud Data Fusion 实例,请构建一个 instances.create API 请求,并填入 Instance 资源。

后续步骤