本页面介绍了 Vertex AI 的 PyTorch 集成,并提供了一些介绍如何在 Vertex AI 上使用 PyTorch 的资源。Vertex AI 的 PyTorch 集成可让您更轻松地在生产环境中训练、部署和编排 PyTorch 模型。
在笔记本中运行代码
Vertex AI 提供了两个在笔记本中运行代码的选项:Colab Enterprise 和 Vertex AI Workbench。如需详细了解这些选项,请参阅选择笔记本解决方案。
用于训练的预构建容器
Vertex AI 为模型训练提供预构建的 Docker 容器映像。这些容器按机器学习框架和框架版本进行组织,并包含您可能想要在训练代码中使用的通用依赖项。 如需了解哪些 PyTorch 版本具有预构建训练容器以及如何使用预构建训练容器来训练模型,请参阅自定义训练的预构建容器。
用于执行预测的预构建容器
Vertex AI 提供预构建的 Docker 容器映像,以同时提供批量预测和在线预测。这些容器按机器学习框架和框架版本进行组织,并包含您可能想要在预测代码中使用的通用依赖项。如需了解哪些 PyTorch 版本具有预构建预测容器,以及如何使用预构建预测容器来提供模型,请参阅自定义训练的预构建容器。
分布式训练
您可以在 Vertex AI 上运行 PyTorch 模型的分布式训练。对于多工作器训练,您可以使用 Reduction Server 进一步优化性能,以实现全规约集合操作。如需详细了解 Vertex AI 上的分布式训练,请参阅分布式训练。
在 Vertex AI 上使用 PyTorch 的资源
如需了解详情并开始在 Vertex AI 中使用 PyTorch,请参阅以下资源:
- 如何在 Vertex AI 上训练和调整 PyTorch 模型:了解如何使用 Vertex AI Training 通过 PyTorch 构建和训练情感文本分类模型,以及如何使用 Vertex AI Hyperparameter Tuning 来调整 PyTorch 模型的超参数。
- 如何在 Vertex AI 上部署 PyTorch 模型:通过将模型工件部署到 Vertex AI Prediction 服务,演示如何使用 TorchServe 作为自定义容器来部署 Pytorch 模型。
- 在 Vertex AI Pipelines 上编排 PyTorch 机器学习工作流:了解如何使用 Vertex AI Pipelines 构建和编排机器学习流水线,以便在 Google Cloud Vertex AI 上训练和部署 PyTorch 模型。
- 在 Kubeflow 流水线和 Vertex Pipelines 上使用 PyTorch 的可扩缩机器学习工作流:查看 OSS Kubeflow 流水线(Kubeflow 项目的一部分)和 Vertex AI Pipelines 上基于 PyTorch 的机器学习工作流的示例。我们分享添加到 Kubeflow 流水线的新的 PyTorch 内置组件。
- 在 Vertex AI 上使用预构建容器提供 PyTorch 图片模型:此笔记本使用预构建的 PyTorch 服务图片在 Vertex AI 上部署 PyTorch 图片分类模型。
后续步骤
- 教程:使用 Vertex AI 通过 Google Cloud 控制台在 Vertex AI 的某个预构建容器环境中训练 PyTorch 图片分类模型。
如需在 Google Cloud 控制台中直接遵循有关此任务的分步指导,请点击操作演示: