本教程介绍如何使用 Vertex AI Pipelines 运行端到端机器学习工作流,包括以下任务:
- 导入和转换数据。
- 使用转换后的数据微调 TFHub 中的图片分类模型。
- 将经过训练的模型导入 Vertex AI Model Registry。
- 可选:使用 Vertex AI Prediction 部署用于在线服务的模型。
准备工作
确保您已完成设置项目中的步骤 1-3。
创建一个独立的 Python 环境并安装 Python 版 Vertex AI SDK。
安装 Kubeflow Pipelines SDK:
python3 -m pip install "kfp<2.0.0" "google-cloud-aiplatform>=1.16.0" --upgrade --quiet
运行机器学习模型训练流水线
示例代码会执行以下操作:
- 从组件代码库加载组件,以用作流水线基本组件。
- 创建组件任务并使用参数在任务之间传递数据,从而构建流水线。
- 提交流水线以在 Vertex AI Pipelines 上执行。请参阅 Vertex AI Pipelines 价格。
将以下示例代码复制到开发环境中并运行代码。
图片分类
关于提供的示例代码,请注意以下几点:
- Kubeflow 流水线定义为 Python 函数。
- 流水线的工作流步骤是使用 Kubeflow 流水线组件创建的。通过使用组件的输出作为另一个组件的输入,您可以将流水线的工作流定义为图。例如,
preprocess_image_data_op
组件任务依赖于transcode_imagedataset_tfrecord_from_csv_op
组件任务中的tfrecord_image_data_path
输出。 - 您可以使用 Vertex AI SDK for Python 创建在 Vertex AI Pipelines 上运行的流水线。
监控流水线
在 Google Cloud 控制台的 Vertex AI 部分中,转到流水线页面并打开运行标签页。
后续步骤
- 如需详细了解 Vertex AI Pipelines,请参阅 Vertex AI Pipelines 简介。