本页面介绍了如何升级实例版本或批量 流水线。
将 Cloud Data Fusion 实例和批处理流水线升级到最新版本 平台和插件版本,提供最新功能、bug 修复和性能 改进。
准备工作
- 为升级计划安排的停机时间。 该过程最多需要一个小时。
-
In the Google Cloud console, activate Cloud Shell.
限制
创建 Cloud Data Fusion 实例后,您便无法更改其 甚至可以通过升级操作。
不支持升级实时流水线(创建的流水线除外) 具有 Kafka 实时源的 6.8.0 版。有关解决方法,请参阅 升级实时流水线。
Cloud Data Fusion 不会重启因以下原因停止的流水线 升级操作
升级 Cloud Data Fusion 实例
将 Cloud Data Fusion 实例升级到新的 Cloud Data Fusion 版本,请转到实例详情页面:
在 Google Cloud 控制台中,转到 Cloud Data Fusion 页面。
点击实例,然后点击相应实例的名称以转到实例详情页面。
然后,使用 Google Cloud 控制台或 gcloud CLI 执行升级:
控制台
点击升级以获取可用版本的列表。
选择一个版本。
点击升级。
验证升级是否成功:
刷新实例详情页面。
点击查看实例以访问已升级的实例, Cloud Data Fusion 网页界面。
点击菜单栏中的系统管理员。
新的版本号会显示在页面顶部。
如需避免在新版本中运行流水线时流水线卡住,请在升级后的实例中授予所需的角色。
gcloud
如需升级到新的 Cloud Data Fusion 版本,请运行以下命令 从本地终端运行 gcloud CLI 命令 Cloud Shell 会话:
gcloud beta data-fusion instances update INSTANCE_ID \ --project=PROJECT_ID \ --location=LOCATION_NAME \ --version=AVAILABLE_INSTANCE_VERSION
可选:如果适用于您的实例,请添加
--enable_stackdriver_logging
、--enable_stackdriver_monitoring
和--labels
标志。可选:您可以传递 CDAP 属性,例如
enable.unrecoverable.reset
,以--options
。
按照以下步骤验证升级是否成功:
在 Google Cloud 控制台中,前往 Cloud Data Fusion 实例页面。
点击查看实例以访问已升级的实例, Cloud Data Fusion 网页界面。
点击菜单栏中的 System Admin。
新的版本号会显示在页面顶部。
如需避免在新版本中运行流水线时流水线卡住,请在升级后的实例中授予所需的角色。
升级批处理流水线
要升级 Cloud Data Fusion 批处理流水线以使用最新的插件版本,请执行以下操作:
建议:备份所有流水线。您可以通过以下任一方式备份流水线 两种方法:
请按以下步骤下载 ZIP 文件:
- 要触发 ZIP 文件下载,请使用 以下命令:
echo $CDAP_ENDPOINT/v3/export/apps
- 将网址输出复制到浏览器中。
- 解压缩下载的文件,然后确认所有流水线 已导出。流水线按命名空间组织。
使用源代码控制管理备份流水线 (SCM),在 6.9 版及更高版本中提供。SCM 提供 GitHub 可用于备份流水线
请按照以下步骤升级流水线:
创建一个变量,指向您将在下一步中创建的
pipeline_upgrade.json
文件,以保存流水线列表。export PIPELINE_LIST=PATH/pipeline_upgrade.json
将 PATH 替换为文件的路径。
使用 。结果以
JSON
格式存储在$PIPELINE_LIST
文件中。您可以修改此列表以移除 需要升级。curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" ${CDAP_ENDPOINT}/v3/namespaces/NAMESPACE_ID/apps -o $PIPELINE_LIST
将 NAMESPACE_ID 替换为要将 进行升级
升级
pipeline_upgrade.json
中列出的流水线。插入要升级的流水线的 NAMESPACE_ID。该命令会显示已升级流水线及其升级内容的列表 状态。curl -N -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" ${CDAP_ENDPOINT}/v3/namespaces/NAMESPACE_ID/upgrade --data @$PIPELINE_LIST
将 NAMESPACE_ID 替换为流水线的命名空间 ID 正在升级的应用
在新环境中运行流水线时,防止流水线卡住 版本,请在升级后的实例中授予所需的角色。
升级实时流水线
不支持升级实时流水线(在 具有 Kafka 实时源的 6.8.0 版。
对于其他所有操作,您需要执行以下操作:
- 停止并导出流水线。
- 升级实例。
- 将实时流水线导入升级后的实例。
升级以启用复制功能
可以在 Cloud Data Fusion 版本 6.3.0 或更高版本中启用复制功能。如果您使用的是 6.2.3 版,请升级到 6.3.0,然后升级到最新版本。然后,您就可以启用复制功能了。
为升级后的实例授予角色
升级完成后,
Cloud Data Fusion Runner 角色
(roles/datafusion.runner
)和
Cloud Storage Admin 角色
(roles/storage.admin
) 复制到您的
project。
后续步骤
- 管理补丁修订版本 Cloud Data Fusion 实例。
- 了解 Cloud Data Fusion 中的版本控制。
- 请参阅可用的版本和补丁修订版本升级。
- 排查升级问题。