升级复制作业

本页介绍了如何在升级 Cloud Data Fusion 实例后升级复制作业。升级到 6.6.0 及更低版本时,流程会有所不同。

6.7.0 及更高版本

如需将复制作业升级到 6.7.0 或更高版本,请使用与升级批处理流水线相同的步骤执行复制作业升级。

6.6.0 及更低版本

如需备份复制作业并将其升级到 6.6.0 或更低版本,请按以下步骤操作:

  1. 停止复制作业

  2. 在 Cloud Data Fusion Web 界面或 REST API 中发出 HTTP GET() 请求,以获取生成 ID。路径类似于以下内容:

    namespaces/NAMESPACE_ID/apps/REPLICATION_JOB_ID</workers/DeltaWorker
    

    替换以下内容:

    • NAMESPACE_ID:复制作业的命名空间的字符串名称。如果您的流水线属于基本版实例,则 ID 始终为 default

    • REPLICATION_JOB_ID:复制作业的字符串名称。

    接口

    如需在 Cloud Data Fusion 界面中发出 HTTP GET() 请求,请按以下步骤操作:

    1. 前往您的实例:
      1. 在 Google Cloud 控制台中,前往 Cloud Data Fusion 页面。

      2. 如需在 Cloud Data Fusion Studio 中打开实例,请点击实例,然后点击查看实例

        转到实例

    2. 依次点击系统管理 > 配置
    3. 点击进行 HTTP 调用
    4. 选择 GET,然后输入第 2 步中所述的路径。
    5. 点击发送,然后在调用响应中找到生成 ID。

    REST API

    如需在 API 中发出 GET() 请求,请参阅 CDAP API 参考文档

  3. 备份现有的 Cloud Storage 目录。

    1. 如需在 Google Cloud 控制台中修改目录,请前往存储分区页面。

      进入“存储桶”

    2. 点击存储分区名称以打开存储分区详情页面。存储分区名称是生成 ID 编号。

    Google Cloud 控制台中的 Cloud Storage 存储分区路径的格式类似于以下示例:

    存储分区 > OFFSET_BASE_PATH > NAMESPACE_ID > REPLICATION_JOB_ID

    您可以通过作业的 offsetBasePath 值找到该存储分区。如需获取该值,请在 Cloud Data Fusion 中使用以下路径发出 GET() 请求:

    namespaces/NAMESPACE_ID/apps/REPLICATION_JOB_ID
    
  4. 升级时,请按照升级批处理流水线中的步骤操作。

  5. 升级后的作业具有新的生成 ID。将新 ID 用作 Cloud Storage 目录名称。

  6. 启动复制作业

后续步骤