在向 Vertex AI 提交自定义训练作业、超参数调节作业或训练流水线之前，您需要创建一个 Python 训练应用或自定义容器定义您要在 Vertex AI 上运行的训练代码和依赖项。如果您使用 TensorFlow、PyTorch、scikit-learn 或 XGBoost 创建 Python 训练应用，则可以使用我们的预构建容器运行您的代码。如果您不确定选择哪个选项，请参阅训练代码要求了解详情。

分布式训练

您可以通过指定多个工作器池来为分布式训练配置自定义训练作业、超参数调优作业或训练流水线：

使用第一个工作器池配置主副本，并将副本计数设置为 1。
添加更多工作器池来配置工作器副本、参数服务器副本或评估器副本（如果您的机器学习框架支持分布式训练的这些额外集群任务）。

详细了解如何使用分布式训练。

后续步骤

了解如何创建永久性资源以运行自定义训练作业。
请参阅创建自定义训练作业，了解如何创建自定义训练作业，以在 Vertex AI 上运行自定义训练应用。
请参阅创建训练流水线，了解如何创建训练流水线以在 Vertex AI 中运行自定义训练应用。
如需了解超参数调节搜索，请参阅使用超参数调节。