本教程是完整的指南,介绍了如何使用 Python 版 Vertex AI SDK 创建自定义训练模型。在笔记本 (IPYNB) 文件中运行使用 Docker 容器训练和创建模型的代码。本教程适用于不熟悉 Vertex AI 但熟悉笔记本、Python 和机器学习 (ML) 工作流的数据科学家。
该过程开始使用 Google Cloud 控制台来创建包含您的工作的项目。在您的项目中,您将使用 Vertex AI Workbench 创建 Jupyter 笔记本。您可在笔记本环境中运行用于下载和准备数据集的代码,然后使用数据集创建和训练模型。在本教程结束时,经过训练的模型可生成预测。
本教程的目标是引导您在不到一小时的时间内完成创建预测所需的每个步骤。所用的数据集相对较小,因此训练模型所需的时间不会太长。完成后,您可以将所学知识应用于更大的数据集。数据集越大,预测结果就越准确。
教程步骤
前提条件 - 创建您的 Google Cloud账号和项目。
创建笔记本 - 创建并准备 Jupyter 笔记本及其环境。您可使用该笔记本运行用于创建数据集、创建和训练模型以及生成预测的代码。
创建数据集 - 下载公开可用的 BigQuery 数据集,然后使用该数据集创建 Vertex AI 表格式数据集。该数据集包含您用于训练模型的数据。
创建训练脚本 - 创建一个 Python 脚本,并将其传递到训练作业。脚本会在训练作业训练和创建模型时运行。
训练模型 - 使用表格式数据集训练和部署模型。您可以使用该模型来创建预测。
进行预测 - 使用模型创建预测。本部分还将引导您删除在运行本教程时创建的资源,以免产生不必要的费用。
您将完成的操作
本教程将向您介绍如何使用 Vertex AI SDK for Python 执行以下操作:
- 创建 Cloud Storage 存储桶以存储数据集
- 对训练数据进行预处理
- 使用已处理的数据在 BigQuery 中创建数据集
- 使用 BigQuery 数据集创建 Vertex AI 表格式数据集
- 创建和训练自定义训练的模型
- 将经过自定义训练的模型部署到端点
- 生成预测
- 取消部署模型
- 删除在本教程中创建的所有资源,以免产生更多费用
使用的计费资源
本教程使用与 Vertex AI、BigQuery 和 Cloud Storage Google Cloud 服务相关联的计费资源。如果您是 Google Cloud的新用户,则可以免费使用其中一个或多个服务。Vertex AI 向新客户提供 $300 赠金,Cloud Storage 和 BigQuery 提供免费层级。详情请参阅以下内容:
- Vertex AI 价格以及免费云功能和试用优惠
- BigQuery 价格和 BigQuery 免费层级用量
- Cloud Storage 价格和 Cloud Storage 免费层级用量
- Google Cloud 价格计算器
为避免产生更多费用,本教程的最后一步将引导您移除您创建的所有计费 Google Cloud 资源。